等度量映射(ISOMAP)

等度量映射(Isomap)是最经典的非线性映射降维方法之一,它在MDS的基础上引入了“测地距离”的概念,直接解决了MDS使用欧氏距离无法应对非线性流形的问题。

测地距离(Geometric Distance)是高维流形中两点之间的最短距离,高维流形中,空间是不规则的,所以最短距离不一定是直线距离(欧氏距离)。就像蚂蚁从立方体的一面爬到另一面,不能直接横穿立方体一样。

isomap

上图最左边的图中两个点的最近距离应该是蓝色实线的距离,而不应该是虚线的距离。

真实的测地距离是非常难以求出的,Isomap基于流形局部近似于欧式空间的定义提出了一种近似的求解方式

  • 求得原样本的KNN图,并依据定义保留其欧式距离
  • 所有非KNN的点间的距离规定为无穷大
  • 用dijkstra或floyd求出任意两点的最短路便可近似表示两点间的测地距离

最后Isomap将得到的测地距离矩阵输入MDS完成降维;

感受下效果

isomap_result