单细胞转录组测序技术和空间转录组技术【2】 单细胞转录组测序技术可以说是融合了高通量组学技术和传统的单细胞研究手段,即解决了通量和分辨率的问题。 空间转录组技术(spatial transcriptomics)则需要利用常规的原位技术和组学技术两方面的优势。 ? 图3. 空间转录组技术的比较【3】 今年一项大受关注的研究成果,来自于中国科学院上海生命科学研究院,该研究利用一种称为Geo-seq的技术,整合激光显微切割技术和微量RNA-seq技术,重建了小鼠不同发育时期的三维空间转录组图谱 图10. 10X Genomics Visium空间转录组技术的流程 3、应用方向 空间转录组的应用方向包含了肿瘤学,免疫学,发育生物学,神经科学及病理学等各个方向。 ? 图11. 基因表达的空间热图【8】 5、空间转录组和单细胞转录组数据的整合 10X Genomics Visium空间转录组技术目前还达不到单细胞分辨率,而单细胞转录组数据则能够起到一定的补充作用,将两者的数据进行锚定和整合
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 局部异常检测 单细胞与空间转录组学中,全局异常检测的一个关键假设是:QC 指标与自然生物学相互独立。否则,天然具有低文库大小或较高线粒体比例的细胞或 spot 更可能被当作异常值移除。 然而,如上所示,在基于测序的 ST 中,由于每个 spot 所采样组织的生物学异质性更高,该假设更常被违背。 解决此问题的一种策略是在其局部生物学邻域内寻找异常值。 0.2) + ggtitle("Local Outliers (Library Size)") # spot plot of log-transformed detected genes p3 point_size = 0.2) + ggtitle("Local Outliers (Mito Prop)") # plot using patchwork (p1 / p2) | (p3
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 不同空间转录组平台做法不一样:像 10X Visium,每个芯片的坐标是固定死的,对照表随协议版本一起发布;而另一些平台,芯片上的坐标是随机打的,供应商会随芯片附赠一个专属对照文件。 把读段按 CID 还原到真实空间位置的过程就叫“条形码解析”(barcode deconvolution),它是空间转录组数据分析的头道工序。 reads 比对 转录本序列本身只是字符串,要想知道这些序列来自哪个基因,就必须把它们比对到带基因注释的参考基因组上。 常用的比对软件有 STAR 和 Rsubread。 过滤与质控 在reads层面,我们要综合前面每一步的信息来做质控: 质量分太低的reads直接扔掉; 条形码对不上已知 CID 或 MID/UMI 的reads不要; 没比对到基因组、比对到多个地方或落进内含子区域的
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 这自然导致灰质区域检测到的基因数量和总体捕获的转录本数量远高于白质。此外,白质往往比灰质显示更高比例的线粒体读段。缺乏这一生物学背景,人们可能错误地认为白质区域质量低,应在下游分析前移除。 其余spots为背景spots,我们不感兴趣,因为它们几乎全部由线粒体基因以及细胞碎片中的转录本构成。 (spe)$gene_name[is_mito] ## [1] "MT-ND1" "MT-ND2" "MT-CO1" "MT-CO2" "MT-ATP8" "MT-ATP6" "MT-CO3" ## [8] "MT-ND3" "MT-ND4L" "MT-ND4" "MT-ND5" "MT-ND6" "MT-CYB" # calculate per-spot QC metrics
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 基于测序的空间转录组学 基于测序的空间转录组学(ST)平台将高通量测序实验中的基因表达分析与特定位置的独特条形码所携带的空间信息相结合。 整个过程包括组织制备、RNA 捕获、逆转录以及高通量测序等步骤。在生物信息学分析中,将测序得到的序列读取与参考转录组(或注释基因组)进行比对,并进一步解析这些序列,以确定它们最初的空间位置。 条形码正方形的高空间分辨率接近单细胞水平,而测序技术则提供了转录组水平的基因覆盖范围。由于其更高的分辨率和数据覆盖范围,数据的稀疏性可能会增加。 瓦片的尺寸为 3 mm x 3 mm,空间分辨率由紧密排列的直径为 10 µm 的珠子组成。
(non-coding RNA)包括micro RNA,long non-coding RNA,circular RNA,pi RNA等,它们不像蛋白质,可以作为生命活动的直接承担者,有关非编码RNA组学的研究也不能像蛋白分子或者基因分子一样仅仅做定量研究 一般情况下,非编码RNA只能通过间接调控来发挥生物学作用,因此,非编码RNA组学一定要深入研究其调控分子的机制才行。 目前非编码RNA的常用研究方法,与编码RNA相同,都是测序,芯片已经较为少见了。 (分别位于图中3个不同的位置) 结果解释:对比正常小鼠和心衰模型小鼠发现,两组小鼠心脏(heart)和全血(WB)中的lncRNA表达模式是相似的,但是血浆中的lncRNA表达模式差别很大。 2:非编码RNA的研究务必结合机制研究,通过基础实验阐明其间接影响mRNA或功能蛋白的转录和翻译,这样才能使研究具有实际意义。 3:如果要筛选临床生物标记物(bio-maker),必须保证前提条件是该ncRNA在临床检验中有标准定量方法,测量的重复性和准确性好,否则意义不大。
作者,Evil Genius参考文章Spatial epigenome–transcriptome co-profiling of mammalian tissues | Nature单细胞多组学,特别是染色质可及性表观遗传和转录组同时测序分析 随着近年来空间组学的兴起, 空间多组学技术 (spatial multi-omics)是否也可以同时分析基因表达和基因调控机制?这成为了大家一致期待的新一代革命性组学工具。 空间多组学在2022年更是被Nature杂志展望为为最值得期待的七个技术之一。2020年底,耶鲁大学的樊荣教授团队首次报道了利用组织样本原位编码方法同时分析空间转录组和蛋白组(DBiT-seq)。 2023年2月23日,樊荣教授团队开发的空间转录组和蛋白组新技术Spatial-CITE-seq,实现了高通量(约200–300)蛋白和转录组同时分析。 因此如果空间分辨的表观遗传组和转录组联合测序分析技术(spatial epigenome–transcriptome co-sequencing)能够实现,将会成为复杂组织生物学研究的一个终极利器,
FastQC软件可以对fastq格式的原始数据进行质量统计,评估测序结果,为下一步修剪过滤提供参考。
3 Using Slingshot基于此,我们已拥有在模拟数据集上运行Slingshot所需的准备文件。 必要的输入是坐标的降维矩阵和一组聚类标签。这些对象可以是单独的对象,或者在单轨迹数据的情况下,是包含在 SingleCellExperiment 对象中的元素。 Median Mean 3rd Qu. 该数据集旨在表示低维空间中的细胞,并带有一组由 k 生成的聚类标签-表示聚类。 此约束可能会影响树的其他部分的绘制方式,如下一个示例所示,其中我们将集群 3 指定为终点。
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 这有助于我们在确定最佳阈值的同时,检查是否无意中去除了具有生物学意义的 spot 组。 spot 组,也不会导致剔除过多的观测值。 最后,我们还要检查被丢弃的 spot 是否存在任何与已知生物学特征明显相关的空间模式。 否则,移除这些 spot 可能意味着我们设定的阈值过高,从而把具有生物学信息的 spot 也一并删除了。
DNA甲基化作为重要的表观遗传学标记,研究的非常广泛。与DNA相对应,在RNA水平也存在着多种化学修饰,已经发现的就有100种以上,在编码和非编码RNA上都存在。 technologies: decoding RNA modifications https://www.nature.com/articles/nmeth.4110 m6A是其中最常见,数量最多的一种转录后修饰 3. Readers 与发生了m6A修饰的位点相结合,构成复合体,介导其实现功能,最经典的Readers蛋白为YTH蛋白家族,包括YTHDF1, YTHDF2等等。 研究转录组m6A修饰有多种技术,示意如下 ? 目前, m6A-seq仍然是最常见的研究m6A修饰的技术,分析内容包括数据质控,比对基因组,peak calling, peak基因注释,差异peak分析,motif预测等等,大部分分析内容和chip_seq
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 背景 基于测序的空间转录组学(ST)平台通过使用下一代测序(NGS)技术,结合空间条形码,在组织的不同空间位置上对基因表达进行定量分析。 序列和测序 在转录组学中,“读取序列”是指从RNA分子逆转录而来的cDNA片段的核苷酸序列。这些转录本的丰度反映了基因表达水平,而这正是转录组学分析的核心目标。 空间转录组学的优势在于能够将读取序列与RNA分子的起源位置相关联,从而揭示基因表达的空间分布。 另一个文件则包含我们需要与参考基因组或转录组(或探针集)进行比对以确定表达基因的转录本(或探针)序列。
而对应到我们的比较转录组,自然就是先经过测序得到原始数据,又或者是使用已经发表的转录组数据(初始数据),经过数据初步质检(fastqc确定碱基质量),切除接头与低质量碱基(数据清洗),然后再检验一次质量 至于样品的要求,做比较转录组对时期不是那么严格,只要能够获取大量生物体RNA即可。 而这一次我们的测试数据选择来自NCBI的两个物种Arabidopsis halleri与Arabidopsis lyrata,这两个物种其实都有基因组公布了,各位如果有兴趣可以拿比较转录组的结果跟已发表基因组的结果做对比 ,就可以知道比较转录组的精确度如何了。 -t 4 -O ./ # 如果是单端测序则不需要添加--split-3 # -t表示线程数,本次使用了4个线程 # -O输出目录,.
空间转录组学的出现让研究人员能够在天然结构下观察生物标志物、空间相互作用和肿瘤转录组,帮助他们更好地鉴定潜在的药物靶点和耐药机制。1859年,达尔文提出了进化论,其中对各个地方鸟类的描述尤为经典。 空间转录组学的出现让研究人员能够在天然结构下观察生物标志物、空间相互作用和肿瘤转录组,帮助他们更好地鉴定潜在的药物靶点和耐药机制。 结果3、空间邻域互作在空间转录组数据中,距离越近的细胞之间,发生互作的可能性越高。了解相邻细胞之间的潜在的互作关系,能帮助研究者了解肿瘤微环境(TME)在肿瘤的发生发展和药物治疗过程中发挥的作用。 打败癌症的进化空间转录组学让科学家能够在细胞背景下了解肿瘤应答和耐药性的分子基础。 我们很高兴看到空间转录组学如何继续帮助研究人员分析患者样本,鉴定新的生物标志物和药物靶点,并向真正的个性化医疗迈进。
生物信息学研究:可以帮助研究人员理解基因之间的调控机制,识别出潜在的关键调控因子和调控通路。 疾病研究:通过识别特定基因的调控网络,可以揭示疾病相关的基因调控机制。 分析流程 1、导入矩阵数据和转录因子 rm(list=ls()) library(GENIE3) load("~/data.Rdata") exp1_input <- exp1[intersect(degs allTFs_hg38_new.txt",header = F) A1 <- intersect(tfs$V1,rownames(exp1_input)) length(A1) # [1] 12 需要提前将转录因子和矩阵基因取交集 , 因为目前已知的转录因子数量是有限的,而且未必会出现在分析的矩阵中。 #K=7, nTrees=50 ) dim(weightMat_1) # [1] 12 213 限定转录因子的好处在于能够帮使用者提前规定好TFs和靶基因的身份
空间转录组学技术的快速发展加快了包括肾脏病学在内的多个领域的发现步伐。 空间转录组学技术与其他组学方法的整合,如蛋白质组学和空间表观遗传学,将进一步促进全面分子图谱的生成,并提供对动态平衡和疾病中分子成分动态关系的见解。 3、空间技术能够在组织病理学背景下定位生物学相关的细胞相互作用,并识别与形态和组织病理学变化相关的疾病相关的细胞信号传导途径。4、空间技术正在迅速发展,可以在整个转录组水平上提供单细胞特征。 空间转录组学方法总的来说,空间转录组学技术可以分为两种主要方法:利用下一代测序的方法和基于原位成像的方法。 虽然空间转录组学分析的数据输出可能是稳健的,但如果没有正交转录组学、蛋白质组学或表观基因组学分析数据的多模式整合,它们是不完整的。需要多种模态来定义细胞的身份和功能。
引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群!
无需参考基因组: Trinity最大的亮点之一在于它无需依赖参考基因组就能进行转录组组装。这对于那些没有参考基因组、非模式生物或基因组信息不全的物种来说,无疑是一个巨大的福音。 它不仅能够组装出高质量的转录本,还能够提供丰富的统计信息,如转录本的长度分布、表达量等,为后续的分析和解读提供有力支持。 3. Genome-scale transcriptome profiling of the malaria parasite Plasmodium falciparum • 实例描述:研究人员利用Trinity对疟原虫的转录组进行了全面的分析 single cell transcriptomic atlas of the human lung across sexes and organs • 实例描述:研究人员利用Trinity对人类肺部的单细胞转录组数据进行了高效组装 总结 Trinity在无参考基因组的情况下具有显著的优势,能够重建大量转录本并区分同源基因的转录本。然而,其高计算资源需求和复杂性是其主要局限性。
欢迎大家关注全网生信学习者系列:WX公zhong号:生信学习者Xiao hong书:生信学习者知hu:生信学习者CDSN:生信学习者2介绍在生物信息学(生信)领域,随着高通量测序技术的不断发展,大量数据涌现 鉴于此,我们结合先前的项目经验,特别为初学者设计了一套基于癌症转录组数据的纯生信文章项目教程。
目前,基因组学、蛋白质组学、转录组学、微生物组学、代谢组学、病理组学、放射组学等多组学是研究的热点之一。其中多组学数据、药物和疾病之间的关系受到了研究者们的广泛关注。 本文提出了一种综合的研究策略,即构建多组学数据的异构网络,覆盖多模态数据,并利用当前流行的计算方法进行预测。 多组学关联预测的全面描述 未来面临的挑战 本文以当前热点的生物学关联关系预测研究作为讨论。作者提出了一种可能的策略,融合大规模的多组学数据,以全面探索各种生物实体之间的关系。 放射组学的合理组合也是当前研究的热点,特别是放射组学与组织病理学和生物分子特征的对应关联问题。 3. 设计预测方法的挑战 现阶段的预测方法有很多,每一种方法都有其优缺点。 这导致了生物学意义不明显,无法说服生物学和医学工作者,以及在分析和预测疾病时,很少有对其他关系的全面分析。