浙江大学第四期朱朝阳《DeepSeek之火 可以燎原》pdf免费下载

其他资源 潘老师 2周前 (04-08) 61 ℃ (0) 扫码查看

浙江大学举办的DeepSeek系列专题线上公开课第四期备受关注,此次公开课由浙江大学医学院的朱朝阳主讲,围绕DeepSeek展开多方面探讨,内容丰富且极具深度。文末会附上该pdf免费下载地址。

朱朝阳开场便从中华文化基因的独特视角,解读DeepSeek的成功因素。他指出,中华文化中开放、包容和共享的特质,在DeepSeek发展进程中有着重要体现。在对比DeepSeek与ChatGPT的训练语料时,发现DeepSeek总语料规模达14.8万亿token,涵盖多语言、数学、编程等诸多领域,其中中文语料占比3%,不仅包含2.3亿字精校的古典文献,还覆盖多种现代文本 ,且通过独特分词算法增强对成语、典故的理解。而ChatGPT英文语料占比约92.6%,中文语料仅约0.1%,来源较为单一。从这一对比能看出,DeepSeek在语料上更具多元性,对中文文化的挖掘更深入,这得益于中华文化基因的滋养。同时,DeepSeek在技术上也实现了突破,在算力优化方面打破CUDA标准库壁垒,为非英伟达算力芯片提供了发展机遇;算法革新上采用思维链提升逻辑性能;架构创新则通过知识蒸馏和混合专家(MOE)技术,证明了小规模高质量数据的优势,这些技术突破展现出中华民族不屈不挠的精神。

课程中,朱朝阳也对DeepSeek面临的争议进行剖析。争议之一是知识蒸馏技术,有人质疑其是抄袭还是创新。知识蒸馏是将大型模型知识迁移到小型模型的技术,能减少计算资源消耗并缩短推理时间。朱朝阳通过举例说明,抄袭是对他人成果的不当占有,而创新是在已有知识基础上的创造。DeepSeek的知识蒸馏技术结合自身架构创新,并非简单照搬,属于创新行为。争议之二聚焦于人工智能是资源黑洞还是效率革命。随着人工智能发展,对算力等资源需求增大,像Grok3使用大量GPU,引发资源担忧;但DeepSeek相对低能耗,且人工智能在智能决策等方面能提高效率,这一争议反映出人工智能发展过程中资源利用与效率提升的复杂关系。

关于人工智能未来发展之路,朱朝阳引用《道德经》和《易经》中的哲学思想,阐述AI的“道”与“术”。“道”是规律和本源,“术”是具体方法技巧。他提出,理想的人工智能应是智(算法)、能(能力扩展)与伦理安全的结合。以自动驾驶中的电车困境为例,说明人工智能面临的伦理道德困境,强调在发展人工智能时,必须重视伦理安全问题,找到技术发展与伦理道德的平衡,避免算法偏见和统治,确保人工智能真正为人类带来美好生活。

在DeepSeek私有化应用方法上,公开课提供了多种方案。检索增强生成(RAG)技术,利用外部知识库增强答案,能动态检索知识,适合数据频繁更新的场景。课程详细介绍了基于Cherry Studio部署RAG的步骤,包括下载安装Cherry Studio、基座模型和嵌入模型,配置OLLAMA接口,管理模型和知识库等,但也提醒使用Ollama存在安全风险,如未授权访问、数据泄露等,并给出安全加固建议。大模型微调方面,介绍了LoRA和Backbone两种技术。LoRA通过训练低秩矩阵微调模型,减少训练资源需求;Backbone则是设计专业骨架模型装载在基础模型输出端,只训练骨架模型,适用于不同专业场景任务。此外,还讲解了基于LLaMA – Factory的轻代码微调方法,包括安装部署、必备项安装、主要子目录说明、训练模版制作、修改训练参数、准备数据集和训练等步骤,最后展示了DeepSeek本地微调在AI智能助教等方面的简单应用,以及智能助教系统与虚拟仿真实验室集成的案例。

资源下载

归属教程 DeepSeek 全套汇总资料pdf免费下载(持续更新)

文章目录 1、清华大学系列 2、北京大学系列 3、浙江大学系列 4、厦门大学系列 5、其他 有很多朋友都关注D […]


版权声明:本站文章,如无说明,均为本站原创,转载请注明文章来源。如有侵权,请联系博主删除。
本文链接:https://www.panziye.com/project/other/16922.html
喜欢 (0)
请潘老师喝杯Coffee吧!】
分享 (0)
用户头像
发表我的评论
取消评论
表情 贴图 签到 代码

Hi,您需要填写昵称和邮箱!

  • 昵称【必填】
  • 邮箱【必填】
  • 网址【可选】