章
目
录
今天给大家分享一份PPT的报告——《人类经验与AI算法的镜像之旅》,作者是浙江大学教育学院的陈静远,这是浙江大学关于AI方向公开的第三期文档。搞AI、对语言和智能感兴趣的朋友,这份PDF真的值得下载好好研究研究。
报告开篇就把语言的重要性给拎出来了。语言这玩意儿,可不只是咱们日常唠嗑的工具,它直接定义了人类和动物的区别。咱们人类能创造性地用语言,它能给世界带来秩序,还是思维和合作的关键。而且啊,想搞通用人工智能,理解人类这复杂又不精确的语言可是条必经之路。
接着就深入探讨人类和AI理解语言的方式了。咱人类理解语言,靠的是大脑里基于经验建立的神经连接,把词语意思搞明白,再组合起来,顺便还能推断出句子背后的含义,而且理解的时候还特别依赖语境。那计算机呢?它得把信息数字化才行,像处理图像就用RGB值表示像素。在处理语言时,一开始用的词向量模型有不少毛病,比如一个词在不同语境意思不同,但模型里却只有一个向量,这就容易产生歧义。不过后来Transformer架构和注意力机制出现,大语言模型就能给每个词生成跟上下文相关的向量,这问题才算是解决了。
大语言模型这块内容也很精彩。大家都知道大语言模型能对话式回答问题,但它咋做到的呢?其实就跟玩文字接龙有点像,根据前面的内容不断生成下一个词,直到觉得差不多了为止。这里面的关键就是模型内部的参数,这些参数经过大量数据训练,能掌握数据的规律,从而预测出最合适的下一个词。就拿DeepSeek-V3来说,它有不同配置,训练语料库大得吓人,有14.8万亿词元。要是让人一秒读一个词,得读47万年,这啥概念!训练过程也很复杂,分预训练、指令微调、奖励建模和强化学习好几个阶段,每个阶段都有特定的方法和作用。
推理模型部分也很值得一看。推理模型能处理复杂的推理任务,DeepSeek-R1就是个典型。它的诞生过程挺曲折的,从纯强化学习的DeepSeek-R1-Zero开始,这模型有可读性差和语言混淆的问题。后来经过有监督微调和强化学习,变成了DeepSeek-R1。而且还能用它和DeepSeek-V3产生的数据去微调小规模的LLM,提升小模型的效果。报告里还列了个表格,对比了不同模型在各种任务上的表现,DeepSeek-R1的实力一目了然。
最后,报告展示了AI在教育领域的应用。像DeepSeek和其他工具结合,能自动生成PPT、辅助编程、管理英语课堂。还有那个苏格拉底式教学智能体,通过引导学生思考,能培养学生的批判性思维和自主学习能力,推动教育从知识传授向能力培养转变。
总的来说,这份报告理论和实践结合,讲得深入浅出赶紧下载这份报告吧!
相关下载
文章目录 1、清华大学系列 2、北京大学系列 3、浙江大学系列 4、厦门大学系列 5、其他 有很多朋友都关注D […]