浙江大学《Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景》pdf免费下载

其他资源 潘老师 3个月前 (02-26) 546 ℃ (0) 扫码查看

本文提供浙江大学《Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景》pdf免费下载,本文档深入剖析DeepSeek的技术突破、大模型与智能体的协同发展,以及“浙大先生”在人工智能教育与实践中的探索成果。文末提供了该课程相关pdf下载地址。浙江大学《Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景》pdf免费下载

DeepSeek的技术突破与发展拐点

DeepSeek的技术创新亮点

DeepSeek在技术层面有着诸多创新。它采用的MOE架构,就像是让多个专家各司其职。以往一个复杂的任务可能由一个模型吃力地完成,现在通过多个专家模型分工合作,既降低了训练成本,又提高了效率。

多头潜在注意力机制也是DeepSeek的一大特色。在信息处理过程中,它优化了注意力机制,就好比我们在看书时,能够快速找到关键内容,减少了不必要的计算,还降低了显存占用,让模型运行更加流畅。

此外,DeepSeek还在工程优化、数据集优化、计算精度改进等方面下功夫,全方位提升了模型性能。

DeepSeek带来的发展新契机

DeepSeek的出现,为人工智能发展带来了多个重要拐点。从战略层面看,人工智能正处在成长期迈向产业化的关键阶段,DeepSeek的技术突破让我们看到新的发展机遇就在眼前。

在算力方面,DeepSeek通过优化算法和架构,大幅降低了训练大模型所需的算力,提高了算力利用效率。这就好比以前开车很费油,现在经过改进后,同样的路程消耗的油少了很多。

数据利用上,虽然大模型的参数量不断增加,但DeepSeek利用蒸馏技术,能把大模型压缩成小模型进行部署,提升了数据利用效率,避免了资源浪费。

大模型与智能体:协同发展的必然趋势

大模型的困境与不足

大模型虽然在自然语言处理方面表现出色,能和我们聊天、回答各种问题,但它也存在一些问题。比如使用成本较高,在回答专业问题时,准确性有待提高,甚至还会“编造”一些信息,出现幻觉现象。

智能体的重要性及开发方式

智能体在实际应用中起着关键作用,它是将大模型的知识运用到具体场景的桥梁。智能体可以把大模型的通用知识和特定领域的专业知识结合起来,完成各种实际任务,实现从知识到价值的转化。

在智能体开发过程中,有多种方法。模型蒸馏就像是给大模型进行专项培训,让它在某一类知识上更加精通;模型微调则像是大模型在针对自己的薄弱环节进行自我提升,以适应不同的应用环境;检索增强生成(RAG)是在模型和用户交流时,先去查找相关资料,再结合自身知识回答问题。不过这种方式有个小缺点,它不会让模型本身的能力得到提升,要是资料缺失,模型可能就无法回答问题了。

随着大模型和智能体的协同发展,未来智能体开发的时代即将来临。到那时,智能体借助多模态能力,和我们的交互体验会更加丰富、自然,使用起来就像日常的APP和工具一样方便。

“浙大先生”:人工智能教育的创新实践

“浙大先生”平台概述

“浙大先生”是浙江大学打造的重要人工智能平台,它的目标是让AI在校园里无处不在,让师生都能熟练运用AI,并且把这个理念推广到社会。目前,“浙大先生”接入了DeepSeek,形成了“浙大先生 + DeepSeek + CARSI”的教育教学新模式,为师生带来智能化的教学和学习体验。

“浙大先生”有两个主要入口。门户入口就像是一个知识交流中心,用户可以在这里和功能完备的DeepSeek交流,获取问题答案,还能浏览各种行业应用案例。开发平台则为用户提供了丰富的智能体和开发工具,像智能体广场、智能体开发者中心等。在智能体广场,用户可以选择不同的智能体进行交互,比如AI校园智能体,输入问题就能得到回复。

“浙大先生”在教育领域的应用

在教学应用方面,“浙大先生”对教学平台“学在浙大”进行了全面升级,让AI贯穿教师教学和学生学习的全过程。

而且,结合“浙大先生”和DeepSeek大模型,还能进行AI创意制作,比如短视频故事的生成和制作。这为高校的教学和科研注入了新的活力,带来了更多的可能性。

扩展下载

资源下载


版权声明:本站文章,如无说明,均为本站原创,转载请注明文章来源。如有侵权,请联系博主删除。
本文链接:https://www.panziye.com/project/other/14977.html
喜欢 (1)
请潘老师喝杯Coffee吧!】
分享 (0)
用户头像
发表我的评论
取消评论
表情 贴图 签到 代码

Hi,您需要填写昵称和邮箱!

  • 昵称【必填】
  • 邮箱【必填】
  • 网址【可选】