我已经在微阵列基因表达集中确定了疾病病例和对照中感兴趣的基因,并应用了PCA。我想使用弹性网络回归来建立一个模型,该模型可以确定哪些主成分是源的预测(病例与对照),但我不确定如何做到这一点,即输入什么作为x和y变量。任何帮助都将不胜感激!
发布于 2016-11-30 08:16:37
某种形式的子集选择(即您提到的弹性网络回归),其中你拟合一个‘惩罚’模型,并确定最有效的预测因子不适用于PCA或PCR (主成分回归)。PCR将数据集减少到“n”个分量,不同的主分量表示数据中不同的“方向”。第一主成分是具有最大方差的数据内的方向,第二主成分是具有第二最大方差的数据内的方向,等等
summary(pcr.model)它将返回一个表,其中包含每个主成分在响应中解释的方差(即y)。你会注意到有一个由主成分解释的累积总方差。
聚合酶链反应的思想是,您可以选择其中的一个子集(如果您的数据适用--即在前几个主成分中捕获了大部分方差),从而允许您极大地降低数据的维度(允许您绘制PC1与PC2的曲线图)。请注意,PCR通常用于顺序或分类数据类型的分类,因此,如果您的数据不是这样的,则可能使用其他数据类型。但是,如果你想知道哪些预测因子是有用的,并应用弹性网型回归,我建议使用套索。我也推荐ISLR的书,它包含了所有基本的频率建模技术的优秀的R演练。
https://stackoverflow.com/questions/40877670
复制相似问题