我尝试了主成分分析(PCA)进行特征选择,它从9个特征中给出了4个最优特征(绿色均值,绿色方差,标准差)。div.绿色的,红色的均值,红色的方差,标准差。div.红色,色调均值,色调方差,标准差。div.色调,即MGcorr、VarGcorr、stdGcorr、MRcorr、VarRcorr、stdRcorr、MHcorr、VarHcorr、stdHcorr ),用于将数据分类为两个集群。从文献上看,PCA不是一种很好的方法,而是更好地应用核主成分分析(KPCA)进行特征选择。我想将KPCA应用于特征选择,并尝试了以下方法:
d=4; % number of features to be selected, or d: reduced dimension
[Y2 eigVector para ]=kPCA(feature,d); % feature is 300X9 matrix with 300 as number of
% observation and 9 features
% Y: dimensionanlity-reduced data上述kPCA.m函数可从http://www.mathworks.com/matlabcentral/fileexchange/39715-kernel-pca-and-pre-image-reconstruction/content/kPCA_v1.0/code/kPCA.m下载
在上面的实现中,我想知道如何从9个特征中找到要选择的4个特征(即哪些顶级特征是最优的)。
或者,我也尝试了以下函数来实现KPCA:
options.KernelType = 'Gaussian';
options.t = 1;
options.ReducedDim = 4;
[eigvector, eigvalue] = KPCA(feature', options);在上面的实现中,我在从9个特征集中确定4个顶级/optimal特征时也遇到了同样的问题。
以上KPCA.m函数可从http://www.cad.zju.edu.cn/home/dengcai/Data/code/KPCA.m下载
如果有人能帮助我实现内核PCA来解决我的问题,那就太好了。
谢谢
发布于 2013-01-26 01:57:08
PCA本身并不能提供最佳特性。它提供的是一组不相关的新功能。当您选择“最佳”的4个特征时,您选择的是具有最大方差(最大特征值)的特征。因此,对于“正常”PCA,您只需选择对应于4个最大特征值的4个特征向量,然后通过矩阵乘法将原始的9个特征投影到这些特征向量上。
从您为内核PCA函数提供的链接中,返回值Y2似乎是转换到内核PCA空间的顶级d特性的原始数据,因此转换已经为您完成了。
https://stackoverflow.com/questions/14521215
复制相似问题