我有一组来自3个不同亚型的乳腺癌样本的1500个基因的基因表达值及其临床参数。我需要根据乳腺癌亚型对基因表达进行聚类,以找到每个乳腺癌亚型的独特基因。我尝试过PCA和Kmeans,但无法解释子类型的名称。有什么方法可以做到这一点吗?提前谢谢。
发布于 2020-10-30 16:24:12
你要找的是差异表达的基因。如果您有这三个子类型的表达数据,则可以使用差异表达分析工具(通常使用DESeq2和EdgeR )来获取在样本中差异表达的基因。该分析为您提供了差异表达的程度以及结果的统计置信度。
如果你也有一个对照样本,你可以从列表中推断出在某个亚型中特定上调或下调的基因。
这是一个有用的参考,以了解更多的理论以及差异表达分析的应用- Introduction to DGE
https://stackoverflow.com/questions/64540251
复制相似问题