完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
今天开始学习《大语言模型应用指南》第一篇——基础篇,对于人工智能相关专业威廉希尔官方网站 人员应该可以轻松加愉快的完成此篇阅读,但对于我还是有许多的知识点、专业术语比较陌生,需要网上搜索学习更多的资料才能理解书中的内容,阅读虽慢,但在这一学习过程中也掌握了许多新知识,为后续章节的阅读打下基础,这是一个快乐的学习过程。 基础篇从人工智能的起源讲起,提出了机器能否思考的疑问,引入了图灵机这一神奇的机器。 1.2章节介绍了机器学习,从方法论上来看,机器学习属于归纳推理;从开发设计方式来看,机器学习属于自动编程。我们平时使用各种计算机高级语言编写程序代码,这属于人工编程的范畴;机器学习则由算法自动产生程序,因此这个程序不需要程序员编写,而是由计算机自动生成。因此,人工编程方法依赖程序员思考的规则,而自动编程是计算机算法通过分析数据自行创建规则。 作者通过类比学生准备高考的过程来说明机器学习的过程,如下图: 此章节最后总结了机器学习的分类:有监督学习、无监督学习、半监督学习、自监督学习和强化学习。 1.3章节依次介绍了神经网络的历史、神经网络基础知识、神经网络三要素。对神经网络的核心概念、专业术语定义进行讲解,包括偏置、权重、激活函数;三要素包括网络结构、损失函数和优化方法。章节最后总结了神经网络参数学习的关键步骤。 1.4章节描述了自然语言处理的相关知识点,包括什么是自然语言处理、文本的向量化和自监督学习方法。其中文本向量化中的三种编码方式:独热编码、静态编码和动态编码,这些概念描述是需要时间仔细研究理解的。 1.5章节终于开始讲解大语言模型了,这也是基础篇的最后一章节,占据了基础篇的一半篇幅。首先结合ChatGPT的4次迭代升级介绍了什么是大语言模型,大语言模型的特点:参数多、通用性强;之后用较大的篇幅详细讲解了自然语言处理中的最小处理单位——词元(token),使用了大量的示例帮助读者理解token; 紧随token之后,作者讲解了基于自回归模型的字符预测方法以及文本生成原理,这些知识对我来说有些晦涩难懂,如果要熟练掌握是需要一些时间的,只能后续抽空仔细研读,暂且跳过继续阅读,后面的章节包括统一自然语言任务、大语言模型的训练过程和局限性分析,阅读还算顺利。 至此,基础篇只能算是浏览完成,因为部分原理方法并没有吃透,但尽管如此也是收获颇丰,因为我了解了大语言模型的基础知识和应用过程。 |
|
相关推荐
|
|
1554 浏览 6 评论
668 浏览 1 评论
【书籍评测活动NO.56】极速探索HarmonyOS NEXT:纯血鸿蒙应用开发实践
1178 浏览 17 评论
电子发烧友荣获电子工业出版社博文视点 “2024 年度卓越合作伙伴”
924 浏览 0 评论
电子发烧友荣获人民邮电出版社-异步社区“2024年度最佳合作伙伴奖”
895 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2025-1-23 20:17 , Processed in 0.370008 second(s), Total 36, Slave 28 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号