正准备在公司提升单细胞VDJ分析售后的时候被开除了。 空间VDJ技术(Spatial VDJ),能够在空间上解析B细胞受体和T细胞受体。 Spatial VDJ是10x Visium空间基因表达(Spatial GEX)技术的扩展,Spatial GEX依赖于组织切片中3’polyA序列进行靶向捕获,在片段化步骤之前,CDR3区域序列可以从空间条形码全长 空间VDJ的运用生活很好,有你更好
Ranger-V6.0 开启单细胞之旅(上) 2 scVDJ分析 首先下载V(D)J reference文件,然后解压 curl -O https://cf.10xgenomics.com/supp/cell-vdj /refdata-cellranger-vdj-GRCh38-alts-ensembl-5.0.0.tar.gz tar -xf refdata-cellranger-vdj-GRCh38-alts-ensembl -5.0.0.tar.gz 进行cellranger vdj分析 /path/cellranger vdj --id=sample1 \ --reference=/path/... /refdata-cellranger-vdj-GRCh38-alts-ensembl-5.0.0 \ --fastqs=/path/... localcores=8 \ --localmem=64 \ 运行结果在outs文件夹,文件很多,建议根据https://support.10xgenomics.com/single-cell-vdj
每一个凝胶珠子上带有细胞Barcode,UMI和专门为VDJ测序设计的switch oligo。 ? ? 下面是最终上机测序的VDJ文库和mRNA文库 ? 通过建库,PCR扩增,上机测序等步骤,10X系统完成了对样本中存在的VDJ基因重排信息的捕捉,以便查看样本的BCR或TCR丰度和多样性。 如何获取全长VDJ序列 10X VDJ测序可以得到VDJ的全长序列,而VDJ的全长序列一般有~650bp,那么是如何通过2X150bp的reads来实现的呢? 前面的原理里面提到过酶切,得到不同长度的片段,测序之后会对得到的reads进行拼接从而得到VDJ全长序列。 ?
作者,Evil Genius单细胞空间VDJ分析导论适应性免疫系统依赖于巨大的免疫库的多样性来识别和响应广泛的病原体和外来物质。
Data preparation10x Genomics cellranger vdj提供了许多对scTCR/BCR-seq分析有用的输出文件。 这是必要的,因为10x Genomics cellranger vdj使用基于ensembll的参考进行注释,由于IMGT唯一编号系统或V(D)J位点的等位基因级别注释而缺乏空白信息。 值得注意的是,10x Genomics cellranger vdj已经恢复了没有V基因的contigs。 然而,对于具有多个J基因的contigs,其中很大一部分也缺少一个V基因,cellranger vdj将注释具有最高比对分数的J基因,而不是选择leftmost J基因。 它用10x Genomics cellranger vdj克隆型定义解决了之前的问题,该定义断言克隆型中相同的CDR3序列,这对于BCR数据来说是有问题的。
这一篇来一个简单的,VDJ的motif分析。单细胞进行motif的各种细节已经讲过了,空间VDJ课程会再提一下。 而针对空间的VDJ分析,各大公司仅是和大客户一起研发做做,没有大规模的商用化平台,费用也相对较高。那么VDJ的motif分析无论是单细胞还是空间,都是分析的重点。 其中有一个问题,抽取哪些T/B的VDJ序列进行motif分析,也就是哪部分VDJ序列是我们的目标序列,留给大家自己思考了。 motifs analysiskmers <- getKmers(immdata$data[[1]], 5)kp <- kmer_profile(kmers, "self")res = 200png('vdj.motif.png
作者,Evil Genius关于单细胞数据分析的TCR已经分享了很多了,其分析的主要方向还是共享克隆以及克隆的多样本,并不能准确定位到具体的VDJ序列和肿瘤或者疾病的关系。 所以在VDJ这块儿还是空转上更具优势。 当然单细胞纯肿瘤组织VDJ检测也可以做到,但是实际操作上还是有难度,而且肿瘤内浸润的T细胞数量非常少,单细胞检出效率有限,还有就是肿瘤内存在异质性,特定的VDJ存在具有特定靶点的区域,消除了空间信息之后很难准确定位 空间VDJ与TCR-T疗法空间组学在表征肿瘤组织的空间异质性以及VDJ测序方面具有无可替代的优势,其中不同的空间区域会聚集不同的TCR/BCR序列,结合数据分析可以表征肿瘤异质性和靶点/VDJ选择。 可见TCR-T疗法与空间VDJ有极强的关联性,未来大有可为。生活很好,有你更好
今天给大家介绍一个做免疫组库数据分析很实用的数据库IMGT,以及如何使用R从IMGT批量下载B细胞和T细胞受体VDJ序列文件。 二、TCR和BCR VDJ序列批量下载 1.获取VDJ序列文件链接 我们这里以TCR VDJ序列为例,下载地址为 http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory 我们把这10个文件的名字读到file变量中 2.下载TCR VDJ序列文件 #创建文件夹 dir.create("TCR_seq") #循环下载10个文件 for(TCR in file){ out B细胞受体VDJ序列文件的下载链接如下,留给大家自己练习吧!
目前而言,单细胞空间技术已经涵盖到单细胞转录组、单细胞VDJ、空间转录组、空间VDJ,空间原位等,对于转录组方面的研究已经非常成熟,也是目前单细胞空间发表文章涉及到的主要技术;相较于转录组,VDJ方面的认知仍然存在很大的空白 手段一、VDJ的丰度差异这是最容易想到的分析手段,丰度差异分为两种,一种是VDJ的种类发生了变化,通常在疾病组VDJ多样性高于对照组;另一种是数量上的变化,为了杀灭异常细胞可能富集了具有针对性的VDJ组合 ,从而导致该VDJ类型的丰度增加。 例如在肿瘤研究中,免疫细胞为了杀灭肿瘤细胞,必然会富集对肿瘤细胞有杀灭作用的VDJ序列,那么通过对比对照和疾病组的VDJ丰度差异,有助于认知甚至治疗肿瘤,如下图[1]:图片对于VDJ基因多样性的分析可以从以下几个角度来考虑 :(1)比较对照和疾病组之间的VDJ差异,借此分析富集到的VDJ基因或组合的生物学作用;(2)比较相同疾病不同病人之间的VDJ基因丰度差异,借此研究疾病反应的异质性;(3)研究不同阶段,或者用药前后的免疫变化
另一个结合点在VDJ,单细胞VDJ已经存在了很多年了,但是一直无法解决我们实际上的问题,最根本的原因在于还是无法找到真针对特定肿瘤的靶向VDJ序列。 文章提出了一种空间VDJ技术(Spatial VDJ),能够在空间上解析B细胞受体和T细胞受体。 在这项工作中,开发了可变、多样性和连接(VDJ)序列的空间转录组学(Spatial VDJ),该技术可绘制人类组织中的全长BCR和TCR转录本。 作者开发了两个空间VDJ版本:(i)长读(LR)空间VDJ,它生成全长IG和T细胞(TR)抗原受体转录物的空间条形码文库;(ii)短读(SR)空间VDJ仅用于TR序列,它使用基于cdr3相邻V引物的两步半嵌套 支持Spatial VDJ捕获更多扩展克隆的概念,与Spatial VDJ共享的scVDJ TR克隆每个克隆具有更多细胞,并且在多个肿瘤区域检测到的scVDJ克隆更频繁地被Spatial VDJ捕获
/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0.tar.gz" 免疫组库定量 定量脚本 根据官方文档,我们可以很容易写出我们所需的定量脚本: $cat ~/scRNAseq_pipeline/st3_cellranger9_vdj_multi.sh #! ] reference,/home/username/reference/human/refdata-cellranger-vdj-GRCh38-alts-ensembl-7.1.0 [libraries C1008587_TCR,/home/username/project/b_rawdata/C1008587_TCR,VDJ-T 提交定量任务 ## 单样本提交后台 nohup bash /home C1008587_TCR,/home/username/project/b_rawdata/C1008587_TCR,VDJ-T $cat C1010319.csv [gene-expression
图片相比较单细胞转录组,ATAC和VDJ的文章相对较少,当然了,分析起来也没有单细胞转录组那么容易,所以就导致了一般大家做单细胞都是3端转录组,ATAC和VDJ一般不考虑,不考虑不代表不重要,只是ATAC 和VDJ需要更深的研究背景,更强的科研和分析能力。 分析策略:VDJ单基因丰度分析(这个主要是不同条件下计算出来的VDJ差异基因)、差异VDJ丰度的组合变化 图片 识别出丰度变化的VDJ基因的配体序列(这个需要实验验证了) 图片识别出VDJ的配体之后 ,就可以分析HLA-DR激活的VDJ序列组成 图片总之一句话,先分析VDJ单基因的差异,然后对V、D、J分析到的丰度变化的基因看是否是VDJ组合,通过这种组合推断上有的配体(这一步最难),进而指导临床应用 分析策略:VDJ丰度,VDJ共享序列分析,VDJ序列与轨迹分析相结合分析变化(克隆迁移)图片 文章TDO2+ myofibroblasts mediate immune suppression in malignant
除了C区,多数VDJ区由多个片段组成。 在DNA水平,不同基因区段会相互组合。 VDJ基因片段重组构成淋巴细胞受体结构的多样性。 那么这种组合能产生怎样规模的多样性呢? ? B细胞从干细胞发育成成熟的B细胞之前,要经历重链的VDJ基因重排和轻链的VJ基因重排;成熟的B细胞,迁移到外周淋巴器官之后,在外界抗原的刺激下,可能发生体细胞高频突变(SHM)。 image 区别在于在单细胞水平上识别并扩增VDJ区域的基因。 10× Genomics提供了完整的实验流程和数据分析方案。 因为只是配参数和投任务的不叫工程师: $ cd /home/jdoe/runs $ cellranger vdj --id=sample345 \ --reference sample=mysample \ --localcores=8 \ --localmem=64 我们肯定想知道cellranger vdj
二 VDJ数据处理 2.1 VDJ数据合并 首先将上篇推文单细胞免疫组库VDJ| 从零开始scRepertoire分析,解决真实场景中可能的问题中提到的所有VDJ文件 合并在一起,可以linux中cat <- do.call(rbind, tcr_list) ; dim(vdj) head(vdj,2) table(vdj$file) 2.2 VDJ数据过滤 使用high_confidence 为true $Cell_name <- paste0(vdj$file,'_',vdj$barcode) head(vdj,2) 注:true这里可能是True 也可能是TRUE,注意进行对应的修改 2.3 拆分 final_vdj = dplyr::full_join(x = vdj_a, y=vdj_b, by = c("Cell_name"), suffix = c(".TRA",".TRB")) dim( final_vdj) head(final_vdj,2) save(final_vdj,file = 'final_vdj.rda') 三 结合单细胞转录组数据 3.1 合并单细胞数据 单细胞数据同样需要构建与
lung characterizes a gland-associated immune niche,2023年1月发表于nature genetics,文章运用了很多比较值得学习的方法,对于单细胞、单核、VDJ 我们来看一下这篇文章:文章首先通过scRNA-seq、snRNA-seq、VDJ-seq和ST深层分析了人类肺部和气道的五个近端到远端位置的组织样本,以捕获软骨、肌肉和粘膜下腺(SMG)等结构。 fig_dir}histology_annotation_dotplot.pdf", bbox_inches='tight') plt.show()图片代码示例在VDJ
编码TCR/BCR蛋白的基因分为V区、 D区和J区,VDJ分别包含多种类型并可以随机重组,产生带有不同受体的T/B细胞免疫组库。 正常人免疫组库的多样性远高于白血病、淋巴瘤等疾病状态 BD 单细胞VDJ产品+SeqGeq™数据分析 BD Rhapsody™单细胞平台推出免疫组库高变区VDJ CDR3测序,可与靶向转录组、 SeqGeq™在分析下游转录组、蛋白组数据的同时,可以通过插件VDJ explorer分析VDJ BCR/TCR数据,简单易用,无需编写代码,操作界面十分友好。 ? ? SeqGeq™ VDJ数据分析流程 导入样本转录组表达矩阵,可进行质控、降维、分群等分析。 选中矩阵,点击Workspace-Plugin-VDJ explorer,调取VDJ explorer插件,在METADATA界面,添加VDJ数据。 ?
使用单细胞联合RNA + VDJ测序(scRNA + VDJ-seq)直接从T细胞中确定TCR序列和肿瘤反应性。 此外,通过无偏克隆TCR和包含大量负训练数据,可以训练机器学习分类器以自动方式从scRNA + VDJ-seq数据中识别肿瘤反应性TCR克隆型。 深度筛选从TILs中识别肿瘤反应性TCR基于scRNA + VDJ数据的predicTCR分类器的开发构建一个机器学习分类器,该分类器可以基于scRNA + VDJ-seq数据,使用下图策略准确、稳健地预测
前面我们讲了R批量下载B细胞和T细胞受体VDJ序列文件,那么如何将这些fasta序列读到R里面,方便后面处理呢?今天小编就给大家演示一下如何利用R将fasta序列转成data.frame。 我们就用上次下载到的BCR的VDJ序列为例,7个fasta文件存放在BCR_seq文件夹中。 row.names(tmp)=tmp[,1] tmp }) 最终得到的all_len也是一个长度为7的list 其中每一个元素也是一个data.frame 参考文献 R批量下载B细胞和T细胞受体VDJ
模块 ## T细胞分析 ###将以下运行代码写入脚本 seeksoul_vdj_tcr_run.sh #! -d ${output_dir} ]; then mkdir -p ${output_dir} fi /usr/bin/time -v ${bin} vdj run \ --fq1 /home/data /t020559/seekone/vdj_data/PBMC_xin_TCR_S19_L1_R1_001.fastq.gz \ --fq2 /home/data/t020559/seekone/vdj_data /t020559/seekone/vdj_data/PBMC_xin_BCR_S19_L1_R1_001.fastq.gz \ --fq2 /home/data/t020559/seekone/vdj_data PBMC_xin_TCR 1>log_test2_tcr.txt 2>&1 & nohup bash seeksoul_vdj_bcr_run.sh PBMC_xin_BCR 1>log_test2_
为了直观展示V/D/J基因的使用偏向性,可以使用图形工具(如R的ggplot2、Python的matplotlib、seaborn等)绘制基因使用的频率分布图。可以通过多种图形如柱状图、条形图,曲线图等方式展示每个基因的使用频率,从而观察某些基因是否出现偏好。