章
目
录
本文提供浙江大学《Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景》pdf免费下载,本文档深入剖析DeepSeek的技术突破、大模型与智能体的协同发展,以及“浙大先生”在人工智能教育与实践中的探索成果。文末提供了该课程相关pdf下载地址。
DeepSeek的技术突破与发展拐点
DeepSeek的技术创新亮点
DeepSeek在技术层面有着诸多创新。它采用的MOE架构,就像是让多个专家各司其职。以往一个复杂的任务可能由一个模型吃力地完成,现在通过多个专家模型分工合作,既降低了训练成本,又提高了效率。
多头潜在注意力机制也是DeepSeek的一大特色。在信息处理过程中,它优化了注意力机制,就好比我们在看书时,能够快速找到关键内容,减少了不必要的计算,还降低了显存占用,让模型运行更加流畅。
此外,DeepSeek还在工程优化、数据集优化、计算精度改进等方面下功夫,全方位提升了模型性能。
DeepSeek带来的发展新契机
DeepSeek的出现,为人工智能发展带来了多个重要拐点。从战略层面看,人工智能正处在成长期迈向产业化的关键阶段,DeepSeek的技术突破让我们看到新的发展机遇就在眼前。
在算力方面,DeepSeek通过优化算法和架构,大幅降低了训练大模型所需的算力,提高了算力利用效率。这就好比以前开车很费油,现在经过改进后,同样的路程消耗的油少了很多。
数据利用上,虽然大模型的参数量不断增加,但DeepSeek利用蒸馏技术,能把大模型压缩成小模型进行部署,提升了数据利用效率,避免了资源浪费。
大模型与智能体:协同发展的必然趋势
大模型的困境与不足
大模型虽然在自然语言处理方面表现出色,能和我们聊天、回答各种问题,但它也存在一些问题。比如使用成本较高,在回答专业问题时,准确性有待提高,甚至还会“编造”一些信息,出现幻觉现象。
智能体的重要性及开发方式
智能体在实际应用中起着关键作用,它是将大模型的知识运用到具体场景的桥梁。智能体可以把大模型的通用知识和特定领域的专业知识结合起来,完成各种实际任务,实现从知识到价值的转化。
在智能体开发过程中,有多种方法。模型蒸馏就像是给大模型进行专项培训,让它在某一类知识上更加精通;模型微调则像是大模型在针对自己的薄弱环节进行自我提升,以适应不同的应用环境;检索增强生成(RAG)是在模型和用户交流时,先去查找相关资料,再结合自身知识回答问题。不过这种方式有个小缺点,它不会让模型本身的能力得到提升,要是资料缺失,模型可能就无法回答问题了。
随着大模型和智能体的协同发展,未来智能体开发的时代即将来临。到那时,智能体借助多模态能力,和我们的交互体验会更加丰富、自然,使用起来就像日常的APP和工具一样方便。
“浙大先生”:人工智能教育的创新实践
“浙大先生”平台概述
“浙大先生”是浙江大学打造的重要人工智能平台,它的目标是让AI在校园里无处不在,让师生都能熟练运用AI,并且把这个理念推广到社会。目前,“浙大先生”接入了DeepSeek,形成了“浙大先生 + DeepSeek + CARSI”的教育教学新模式,为师生带来智能化的教学和学习体验。
“浙大先生”有两个主要入口。门户入口就像是一个知识交流中心,用户可以在这里和功能完备的DeepSeek交流,获取问题答案,还能浏览各种行业应用案例。开发平台则为用户提供了丰富的智能体和开发工具,像智能体广场、智能体开发者中心等。在智能体广场,用户可以选择不同的智能体进行交互,比如AI校园智能体,输入问题就能得到回复。
“浙大先生”在教育领域的应用
在教学应用方面,“浙大先生”对教学平台“学在浙大”进行了全面升级,让AI贯穿教师教学和学生学习的全过程。
而且,结合“浙大先生”和DeepSeek大模型,还能进行AI创意制作,比如短视频故事的生成和制作。这为高校的教学和科研注入了新的活力,带来了更多的可能性。