首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >玩转 TCGA 数据库-网页解读(四)

玩转 TCGA 数据库-网页解读(四)

作者头像
生信菜鸟团
发布2025-05-27 09:35:08
发布2025-05-27 09:35:08
6970
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

TGCA 数据储存在 Genomic Data Commons Data Portal,但是这个网页不只储存 TGCA 的数据,还保存着其他项目。,目前一共有 86 个 projects。

主界面

数据库主要有三个界面,Projedcts, Cohort Builder, Repository.

Projects

这个界面主要就是看我们关注的项目都有哪些,可以利用一些筛选条件,对总共 86 个 projects 进行筛选,然后再进一步看这些项目的具体信息。

比如我按照以下条件在左侧选择框中进行筛选,想看哪些 TCGA 项目有胰腺导管癌。

  • Primary Site = pancreas
  • Program = TCGA
  • Disease Type = ductal and lobular neoplasms

可以看到最后只有一个 project。

可以看带这个项目的基本信息。可以下载下来查看,但比较难读。不推荐

Cohort Builder

这一步就是筛选我们需要的样本,为下一步下载数据做准备, 这一步是得到想要的 患者数据。

比如我是在 General这一步过滤的:

  • Program = TCGA
  • Project = TCGA-PAAD
  • Disease = ductal and lobular neoplasms

选择好后就点 Repository

Repository

这一步是选择我们想要哪些数据,比如我们想要下载这些样本点转录组数据,是选择:

  • Data Category = transcriptome profiling
  • Data Type = Gene Expression Quantification
  • Workflow Type = STAR - Counts
  • Access = open

一共 145 个样本,点击 Add All Files to Cart

然后点击 Download Cart---Manifest

下载

下载 TCGA 数据的 manifest 文件后,你可以使用 GDC Data Transfer Tool 来下载实际的数据文件。以下是具体步骤:

  1. 安装 GDC Data Transfer Tool
    • 访问 GDC Data Transfer Tool 的安装页面,通常可以在 GDC 数据门户的帮助或工具部分找到。
    • 根据你的操作系统(Windows, macOS, Linux)下载并安装适合的版本。
  2. 准备 Manifest 文件
    • Manifest 文件是一个文本文件,包含你所需数据文件的标识符。确保你已经从 GDC 数据门户下载了这个文件。
  3. 使用 GDC Data Transfer Tool 下载数据
    • 打开终端或命令提示符。
    • 导航到 GDC Data Transfer Tool 所在的目录。
    • 使用以下命令下载数据:
代码语言:javascript
复制
gdc-client download -m path/to/manifest.txt
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 主界面
    • Projects
    • Cohort Builder
    • Repository
  • 下载
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档