等度量映射(Isomap)是最经典的非线性映射降维方法之一,它在MDS的基础上引入了“测地距离”的概念,直接解决了MDS使用欧氏距离无法应对非线性流形的问题。
测地距离(Geometric Distance)是高维流形中两点之间的最短距离,高维流形中,空间是不规则的,所以最短距离不一定是直线距离(欧氏距离)。就像蚂蚁从立方体的一面爬到另一面,不能直接横穿立方体一样。
上图最左边的图中两个点的最近距离应该是蓝色实线的距离,而不应该是虚线的距离。
真实的测地距离是非常难以求出的,Isomap基于流形局部近似于欧式空间
的定义提出了一种近似的求解方式
- 求得原样本的KNN图,并依据定义保留其欧式距离
- 所有非KNN的点间的距离规定为无穷大
- 用dijkstra或floyd求出任意两点的最短路便可近似表示两点间的测地距离
最后Isomap将得到的测地距离矩阵输入MDS完成降维;
感受下效果