等度量映射(Isomap)是最经典的非线性映射降维方法之一,它在MDS的基础上引入了“测地距离”的概念,直接解决了MDS使用欧氏距离无法应对非线性流形的问题。
Jetbrain IDE插件开发入门
Posted on
|
In
JetBrains
Jetbrain号称IDE界的Adobe,各个平台、各个环境下的IDE无论从易用性还是外观上都是十分优秀的,这份笔记将会记录如何在JetBrains中编写简单的插件。
Ubuntu下通过docker运行eclipse che
Posted on
|
In
环境搭建
Docker是一个开源的引擎,可以轻松的为任何应用创建一个轻量级的、可移植的、自给自足的容器。开发者在笔记本上编译测试通过的容器可以批量地在生产环境中部署。个人理解:通过沙箱隔离出一块区域,每块区域都有不同的应用运行环境。类似虚拟机是为了操作系统提供模拟的硬件环境,docker容器给应用提供了模拟的系统环境。
Eclipse Che是一个现代的、开放源代码的软件开发环境。它是一个通过提供结构化的工作区、项目输入、模块化扩展插件来支持Codenvy的引擎。Che可以用作桌面IDE,RESTful工作空间服务器,或作为一个创建新的工具SDK。我们将使用docker来运行Che
线性判别分析(LDA)
Posted on
|
In
机器学习
线性判别分析(Linear Discriminant Analysis, LDA)是另外一种线性降维方法。与主成分分析法不同,线性判别分析是一种有监督学习,也就意味着线性判别分析需要使用带标签的数据进行训练来完成降维。
主成分分析法(PCA)
Posted on
|
In
机器学习
主成分分析法(principal component analysis, PCA)是最常用的无监督高维数据降维方法之一,它旨在降维的过程中保留原数据中最重要的几个分量,从而达到最大化原数据方差的作用。几乎所有数据降维方面研究都要用来作为比较重要的方法。
使用Requests和BeautifulSoup并行抓取今日头条图集
Posted on
|
In
网络爬虫
代码分块讲解。分析Ajax请求来爬取今日头条的图集,将结果存储在MongoDB中。使用了Python多进程(multiprocessing)并行进行抓取。针对一个实战的教程进行修改,以适应今日头条最新的网页请求方式