The VLFeat open source library implements popular computer vision algorithms specializing in image understanding and local features extraction and matching. Algorithms include Fisher Vector, VLAD, SIFT, MSER, k-means, hierarchical k-means, agglomerative information bottleneck, SLIC superpixels, quick shift superpixels, large scale SVM training, and many others. It is written in C for efficiency and compatibility, with interfaces in MATLAB for ease of use, and detailed documentation throughout. It supports Windows, Mac OS X, and Linux.
马氏距离(Mahalanobis Distance)
马氏距离(Mahalanobis Distance)是度量学习中一种常用的距离指标,同欧氏距离、曼哈顿距离、汉明距离等一样被用作评定数据之间的相似度指标。但却可以应对高维线性分布的数据中各维度间非独立同分布的问题。
word2vec词嵌入方法
word2vec模型与应用由Mikolov等人在自然语言领域具有很高的影响,它在语言模型进行学习前先找寻到一种合适的编码方式,这种编码方式叫作词嵌入(Word Embedding); 本片笔记属于原理介绍,没有实现细节的代码讲解
训练集(train set)验证集(validation set)测试集(test set)与交叉验证法(Cross Validation)
这三种数据集合非常容易弄混,特别是验证集和测试集,这篇笔记写下我对它们三个的理解以及在实践中是如何进行划分的。
在Ubuntu下一些常用软件安装
安装完Ubuntu后常用软件和环境的安装,之前写过一点,在这里做补充,Chrome,Typora,Anaconda,调节双系统时间,Sublime,nodejs等
LargeVis--LINE在高维数据降维与可视化上的运用
LargeVis是唐建在2016年提出的高维数据降维可视化算法,主要工作是大大降低了t-SNE算法的计算复杂度,使算法能够更高的效率处理更大规模的数据。主要使用的优化方法是改进的随机投影树KNN图构造方法以及、与Word2Vec类似的采样与负采样方法以及随机梯度下降算法;在距离的映射方面仍然采用了与t-SNE一样的高斯分布——T分布的策略
Spring Boot项目中Tomcat端口号的更改
使用IntelliJ Idea开发Spring Boot项目时,Idea会使用内置的Tomcat服务器,默认情况下使用的端口号的8080,本篇笔记记录如何修改内置Tomcat服务器使用的端口号
t-SNE高维数据降维与可视化
t-SNE(基于t分布的随机近邻嵌入,t-distributed stochastic neighbor embedding),是Laurens van der Maaten大神在Geffory Hinton大神的SNE基础上加入t分布而形成的,是目前效果最好的可视化降维算法,可以将高维数据内部的特征放大,使得相似的数据在低维中能更加接近,不相似的数据在低维中距离更远。