我想下载由微阵列实验产生的基因表达数据。我对这个主题了解不多,但据我所知,行通常对应于基因,列通常对应于样本。理想情况下,我希望得到一个基因表达数据矩阵。
我一直在互联网上搜索,虽然看起来有很多地方可以下载这样的数据,但当我真正下载数据时,我并不了解基因表达的矩阵。有没有人可以让我知道有没有地方或者如何以我期望的格式下载基因表达数据?
任何帮助都是非常感谢的。
发布于 2012-03-23 12:46:29
例如,如果您查看Gene Expression Omnibus中的this entry,其中一种文件格式是"TXT“,并且在一些元数据之后包含您所要求的矩阵。
发布于 2012-03-23 23:00:53
如果你只是得到一个预处理的数据集,你很难保证原始数据的处理方式可以与其他实验相媲美,或者底层的原始数据具有足够高的质量。
您还需要高质量的元数据才能从数据矩阵中获得任何含义。这些样本的生物学条件和来源是什么?使用的特定阵列上的探针对应于哪些基因?(请注意,9890_at是"probeset id",一个特定序列设计的分子探针的唯一标识符,然后需要将其映射到一个基因,同一基因的不同探针不会给出完全相同的反应。)
对于许多人来说,处理微阵列数据的首选工具是用于统计编程语言R的bioconductor软件套件。
这两个软件包与大多数bioconductor软件一样,都带有引入该软件的出色的“小插曲”:GEO bioc vignette和Arrayexpress bioc vignette
这些小插曲还应该为您提供获取原始数据并从原始数据派生"Esets“(表达式集)的示例。在这一点上,您可以访问bioconductor Eset对象中的基因表达矩阵,并且您有一个对象和API来询问必要的元数据。
注意,有不同类型的微阵列。
https://stackoverflow.com/questions/9834120
复制相似问题