机器学习的本质,其实就是模仿人类大脑进行学习的过程,通过让机器模仿这种学习过程实现所谓的“智能”。
经过近几十年的发展,机器学习的方法也越来越成熟,主要有以下几种:
- 监督学习
- 无监督学习
- 强化学习
- 深度学习
- 深度强化学习
如上图所示,机器学习是从左往右的发展方向,每一阶段的学习方法都比上一代优秀了很多。
下面简单介绍这几种机器学习方法的工作原理。
监督学习
监督学习指的是让机器从现有的标注好的已知数据中学习预测模型的学习方法。
简单来说,先给定计算机一组标记好的数据,让计算机用回归或分类的方法计算出数据与标记之间的经验关系。
通过这种方式,计算机最终会得出一个预测模型,训练数据越多,预测模型越准确。
而所谓的“回归”和“分类”方法,是计算机的两种寻找规律的方式。具体如下:
回归方法
计算机通过给定的标记与数据之间的特征值,计算出标记与数据之间的经验关系。
这种方法最终得到的预测模型其实就是“经验关系”。当训练完成,你可以使用模型对未知数据进行预测,以此来测试计算机是否已经学习到了。
分类方法
分类方法指的是让计算机将性质相似的数据分类为一个组。这种方法得到的模型是一个分类器。
训练完成后,你可以使用未知数据让分类器进行分类,根据分类结果判断计算机的预测精度水平。
监督学习的方法包括:KNN、SVN等。
无监督学习
无监督学习是相对于监督学习来讲的,是对监督学习的升级版。
无监督学习指的是从无标注的数据集中学习预测模型的方法。
监督学习需要给计算机标记好的训练集,而无监督学习不需要人工标记训练集,计算机会根据现有的数据集的特征,自动对数据集进行分类。
无监督学习的方法有:聚类、K均值、PCA等
强化学习
强化学习与监督学习、无监督学习最大的区别,就是它不是一个分类任务。
强化学习训练时,需要环境给予反馈,以及对应具体的反馈值。通过反馈值告诉预测模型预测结果是“好”还是“坏”,然后通过外界的反馈结果调整预测模型。
深度学习
深度学习是无监督学习的一种,它模仿的是人类大脑神经网络。
常用的深度学习方法有深度神经网络、深度信念网络、递归神经网络和卷积神经网络等。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
深度强化学习
深度学习具有较强的感知能力,但是缺乏一定的决策能力;而强化学习具有决策能力,对感知问题束手无策。因此,深度强化学习将深度学习和强化学习相结合,优势互补,为复杂系统的感知决策问题提供了解决思路。
该威廉希尔官方网站 在机器人、视频游戏、金融和医疗领域取得了巨大成功。许多以前无法解决的问题现在通过创建DRL模型得到了解决。
-
计算机
+关注
关注
19文章
7492浏览量
87902 -
机器学习
+关注
关注
66文章
8414浏览量
132604 -
深度学习
+关注
关注
73文章
5503浏览量
121136
发布评论请先 登录
相关推荐
评论