详解机器学习算法流形学习-电子发烧友网

在格物汇之前的文章中，我们系统性的介绍了特征抽取的经典算法——主成分分析PCA与线性判别分析LDA的原理、应用场景，以及这两种算法的局限性和改进方法。今天的格物汇要给大家介绍一种新的机器学习算法——流形学习。

流形学习

流形学习是一类借鉴了拓扑流形概念的降维方法，与核PCA的目的一样，它想要在低维空间中尽量保持在高维空间中的结构。一个形象的流形降维过程如下图，我们有一块卷起来的布，我们希望将其展开到一个二维平面，我们希望展开后的布能够在局部保持布结构的特征，其实也就是将其展开的过程，就像两个人将其拉开一样。

流形学习方法有很多种，但是他们具有一些共同的特征：首先构造流形上样本点的局部邻域结构，然后用这些局部邻域结构来将样本点全局的映射到一个低维空间。它们之间的不同之处主要是在于构造的局部邻域结构不同，以及利用这些局部邻域结构来构造全局的低维嵌入方法的不同。下面我们简要介绍两种最常见的流形学习方法：Isomap和LLE。

Isomap

高维数据结构可能太过于抽象，很难去理解。我们先来看一个具体的实例：在上一篇文章中，我们所看到的三维空间上的数据是呈现”S”型，假设我们想寻找图中两点的测地距离（延曲面距离），就不能用这两点坐标所计算的欧式距离，如下图（a）黑色线所示，因为黑色线所构成的路径延曲面不可达。而应该使用其沿着“S”形曲面所生成的距离，想象一下一只蚂蚁在数据曲面上爬行，它不能脱离曲面行走，行走的路径如下图（a）红色线所示。下图（b）则显示的是两条线本真二维结构上所显示的路径，很明显红色的线更加真实的反映了两个数据点在三维数据上的距离。

详解机器学习算法流形学习

上述这种寻找数据曲面测算距离的方法称为Isomap（等度量映射），它是流形学习中的一种方法。它是如何实现的呢？它假设数据点与K个最近邻的点可以构成一个子集，这个子集可以用普通的欧式距离来衡量，而这个子集中的点又与其他子集中的点相连，这样两个目标点的距离就可以分解成若干子集的欧式距离叠加来近似得到，最后这些相连的点可以降维到低维空间中展现出来。

详解机器学习算法流形学习

局部线性嵌入（LLE）

流形学习另外一个典型案例是局部线性嵌入（LLE）。Isomap假设近邻的测地距离可以用欧式距离来表示。而LLE则假设在近邻内可以用线性加权互相表达。比如对于任意一个样本x0，我们都可以用他附近的几个点x1 x2 x3 x4的线性组合表示出来，即

详解机器学习算法流形学习

经过LLE降维投影后，原来的点x0 x1 x2 x3 x4，投影变成了

详解机器学习算法流形学习

LLE降维的想法是，降维后尽量去保留高维时的线性组合关系：

详解机器学习算法流形学习

如何求解呢？我们需要先求出线性组合的权重w，对于样本x0我们需要找到其最近的k个其他样本点，假设为x1 x2 x3 x4，我们根据线性表示误差最小来求出w：

详解机器学习算法流形学习

根据上式确定出线性组合的w以后，我们还需要让其在低维空间也能尽可能满足线性组合的表达关系式，也就是说对于x0 x1 x2 x3 x4……的低维投影点z0 z1 z2 z3 z4……满足：

详解机器学习算法流形学习

两个优化目标函数类型很像，但需要明确的是第一个目标函数优化的是权重w，而第二个目标函数优化的是降维后的坐标z。经过优化即可得出样本集在低维空间上的投影坐标。

总的来说，对于不在某一个点x0邻域内的其他点A，不管A怎么变动，都不会影响到点x0，这种变动局部限制的思想在很多地方都有用，此外LLE尽可能的保存了局部线性信息，使得其在局部能反映出数据原本的结构。它的流程大致如下图所示：

详解机器学习算法流形学习

小结

LLE是广泛使用的图形图像降维方法，它实现简单，但是对数据的流形分布特征有严格的要求。比如不能是闭合流形，不能是稀疏的数据集，不能是分布不均匀的数据集等等，这限制了它的应用。

优点

1、可以学习任意维的局部线性的低维流形

2、算法归结为稀疏矩阵特征分解，计算复杂度相对较小，实现容易

缺点

1、算法所学习的流行只能是不闭合的，且样本集是稠密均匀的

2、算法对最近邻样本数的选择敏感，不同的最近邻数对最后的降维结果有很大影响

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

拓扑

拓扑

+关注

关注
4

文章
341

浏览量
29598
机器学习

机器学习

+关注

关注
66

文章
8411

浏览量
132596
张飞电子

张飞电子

+关注

关注
54

文章
175

浏览量
12590

原文标题：【众筹突破25W销量】马达驱动开发板+45小时视频教程

文章出处：【微信号：fcsde-sh，微信公众号：fcsde-sh】欢迎添加关注！文章转载请注明出处。

高级机器学习算法工程师--【北京】

职位描述：1. 负责计算机视觉&机器学习（包括深度学习）算法的开发与性能提升，负责下述研究课题中的一项或多项，包括但不限于：人脸识别、检测、活体、跟踪、分类、语义分割、深度估计、图像处

发表于 12-07 14:34

基于流形学习的毫米波探测器目标识别方法研究【个人收藏】

流形学习是一种机器学习理论，旨在发现高维数据分布的内在规律，并从中恢复低维流形结构，实现维数约简。本文将流形学习方法应用于毫米波探测

发表于 12-20 15:43

有监督流形学习算法SLLESVM 在图像检索中的应用

基于内容的图像检索中，高维特征向量的有效降维是一项关键威廉希尔官方网站，流形学习算法LLE 是有效的非线性降维方法，而SVM 的泛化能力较强，本文将二者结合在一起，成为一种新的有

发表于 06-10 15:59 •10次下载

Spark机器学习库的各种机器学习算法

本文将简要介绍Spark机器学习库（Spark MLlibs APIs）的各种机器学习算法，主要包括：统计

发表于 09-28 16:44 •1次下载

增量流形学习正则优化算法

高维流式大数据的产生与发展对传统机器学习和数据挖掘算法提出了诸多挑战。本文结合流式大数据流式到达的特性，首先建立自适应增量特征提取算法模型。然后，针对噪声环境，建立基于特征空间校准的增

发表于 02-27 11:07 •1次下载

如何刻画数据的本质？流形学习能帮到你

在格物汇之前的文章中，我们系统性的介绍了特征抽取的经典算法——主成分分析PCA与线性判别分析LDA的原理、应用场景，以及这两种算法的局限性和改进方法。今天的格物汇要给大家介绍一种新的机器学习

发表于 04-28 19:08 •2898次阅读

流形学习与非负矩阵分解架构综述

为处理目标数据集仅有部分成对约束信息可用的半监督聚类场景，基于非负矩阵分解（NMF）架构，通过学习给定成对约束知识和运用流形正则化理论提岀了流形学习与成对约東联合正则化非负矩阵分解聚类方法（NMF-

发表于 04-12 11:25 •4次下载

基于流形学习的T分布式多传感器体域网

异常影响较小的优点，但是针对无线多传感器体域网的数据降维效果并不理想。对此，提岀了一种基于流形学习的T分布式随机邻域嵌入（TSNE）算法对多传感器体域网数据进行融合。T-SNE算法首先将高维数据点与其对应的低维数据点间的欧氏距离

发表于 05-18 11:26 •5次下载

流形学习LLE算法的配套Matlab源码汇总

流形学习LLE算法的配套Matlab源码汇总

发表于 08-25 09:30 •1次下载

机器学习算法的基础介绍

现在，机器学习有很多算法。如此多的算法，可能对于初学者来说，是相当不堪重负的。今天，我们将简要介绍 10 种最流行的机器

发表于 10-24 10:08 •1948次阅读

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法汇总机器学习算法分类机器

发表于 08-17 16:11 •1101次阅读

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法总结机器学习算法是什么?机器

发表于 08-17 16:11 •1905次阅读

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习算法入门机器学习算法介绍机器

发表于 08-17 16:27 •948次阅读

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习有哪些算法？机器学习分类算法有哪些？机器

发表于 08-17 16:30 •1988次阅读

机器学习算法原理详解

机器学习作为人工智能的一个重要分支，其目标是通过让计算机自动从数据中学习并改进其性能，而无需进行明确的编程。本文将深入解读几种常见的机器学习

发表于 07-02 11:25 •1010次阅读

搜索历史

详解机器学习算法流形学习

评论

高级机器学习算法工程师--【北京】

基于流形学习的毫米波探测器目标识别方法研究【个人收藏】

有监督流形学习算法SLLESVM 在图像检索中的应用

Spark机器学习库的各种机器学习算法

增量流形学习正则优化算法

如何刻画数据的本质？流形学习能帮到你

流形学习与非负矩阵分解架构综述

基于流形学习的T分布式多传感器体域网

流形学习LLE算法的配套Matlab源码汇总

机器学习算法的基础介绍

机器学习算法汇总机器学习算法分类机器学习算法模型

机器学习算法总结机器学习算法是什么机器学习算法优缺点

机器学习算法入门机器学习算法介绍机器学习算法对比

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

机器学习算法原理详解