基于测序的空间转录组技术(sequencing-based ST,sST)正以前所未有的速度突破分辨率极限,大步迈入微观领域。
自 2016 年首个基于微阵列芯片(分辨率约 200 μm)的功能原型诞生以来,sST 通过多种创新策略实现了分辨率跨越式的提升。在过去近十年中,sST 平台遵循着中心距每年减半的趋势,分辨率提高了超过 1000 倍,突显了 ST 技术的快速发展步伐。
提高分辨率的一种直接方法是制造具有更精细特征的微阵列。这些技术利用预先分配并与已知空间坐标匹配的确定性条形码 (deterministic barcoding),其中最近的 Visium HD Spatial Gene Expression 结合了改进的微阵列制造技术,在 2 μm 分辨率下实现了高质量的 sST 。
区别于确定性条形码,另一种基于微珠的方法也被开发出来以应对分辨率挑战,包括 Slide-seq、HDST 等。其中,Slide-Seq 和 HDST 的初始实现与其他 sST 方法相比 RNA 捕获效率较低,然而,Slide-Seq 的后续改进(Slide-SeqV2)使其能够作为 Curio Seeker 商业化。
第三种方法,即利用 NGS 进行 sST,迄今为止在生成微观尺度的高分辨率数据方面最为成功。使用高分辨率(0.5–0.7 μm)的 DNA 纳米球(DNB)阵列,Stereo-Seq 能够进行单细胞水平的分析。利用 illumina 测序仪器,Seq-Scope 实现了亚微米分辨率(0.5–0.6 μm),可支持在单细胞甚至亚细胞水平的分析。Stereo-Seq 现已由华大基因作为 STOmics 商业化,而 Seq-Scope 促进了衍生技术如 Open-ST 和 Nova-ST 的开发。通过分析连续切片并沿 Z 轴重建,其中一些技术已被用于 3D 分析。
所有上述方法都旨在提高阵列密度以最小化像素间距。最近组织膨胀(tissue expansion)作为一种新的策略,它从物理上放大了组织本身,且不影响转录组捕获效率。最近,在 Seq-Scope-X 中,组织膨胀与高分辨率 Seq-Scope 阵列相结合,实现了纳米级分辨率(180 nm),支持在组织范围内进行亚细胞分析。
sST技术的分辨率提升。纵轴为分辨率,横轴为年份。蓝色点表示基于确定性条形码的方法,绿色点表示基于微珠的方法,黄色表示基于NGS的方法。红色空心圆圈表示已商业化,红色圆心表示使用组织膨胀技术。可以看到,Seq-Scope-X 的分辨率已达到大多数基于成像的空间转录组技术(image-based ST,iST)的水平。
本次稍微重点了解一下基于NGS原理的 Seq-Scope 以及由它衍生的 Open-ST(Nova-ST 感觉上和 Open-ST 非常类似)。
图A:Seq-Scope的1st-Seq文库结构。P5/P7:Illumina 测序接头,用于流动槽表面扩增。TR1 (TruSeq Read 1):测序引物结合位点。HDMI:20-32 nt 随机条形码(空间坐标标识)。HR1 (HDMI Read 1):HDMI 测序引物位点。Oligo-dT:用于捕获 mRNA 的 polyA 尾(初始被封闭)。DraI:限制性内切酶位点(用于后续释放 oligo-dT)。
图B:固相扩增生成HDMI簇。文库在涂有 P5/P7 引物的流动槽表面进行桥式 PCR,形成数千个相同寡核苷酸拷贝的“簇”。每个簇代表一个空间像素点,包含唯一 HDMI 序列。
图C:1st-Seq第一次测序。通过边合成边测序(SBS)读取 HDMI 序列,记录每个簇的物理坐标(X,Y)与 HDMI 序列。
图D:用 DraI 酶使得 oligo-dT 暴露,NaOH 清洗去除游离片段,形成 HDMI 阵列。
图E:冰冻组织切片贴附于 HDMI 阵列,释放 mRNA。
图F:oligo-dT 捕获 mRNA,合成 cDNA 第一条链。
图G:随机引物延伸合成 cDNA 第二条链(含 UMI 序列,用于去重复)。
图H:PCR 添加测序接头,构建含 P5/P7 的完整文库。
图I:2nd-Seq文库结构。
图J:阵列密度。每 100 μm² 含 150 个 HDMI 簇,支持单细胞级分辨率。
图A:所有实验协议与计算工具开源,提供可复现的端到端方案,降低技术门槛。
图B:基本原理和Seq-Scope一致。创新点:使用图案化芯片(Patterned Flow Cell),表面有规则排列的纳米孔(中心间距约 0.6 μm),用于固定寡核苷酸。比 Seq-Scope 能产生更密集、更规则排列的捕获点。并且规则排列降低了单个点内混合不同条形码信号的概率,提高了空间定位的准确性。
图C:Open-ST 设计了可 3D 打印的切割引导装置。优势:可以将一个昂贵的 NovaSeq S4 测序芯片高效、精确且无损伤地切割成~360 个小的、独立使用的捕获区域( 3x4 mm),每个捕获区域的成本约 €35。用户可以根据实验需求选择合适大小的捕获区域,无需为每次实验浪费整个芯片,极大地降低了实验门槛。
图D:组织处理与数据生成。将冷冻切片放置在捕获区域上,对同一切片进行优化的 H&E 染色和高分辨率成像,进行 mRNA 原位捕获。Open-ST 优化了实验流程,提高了实验成功率,可以从同一切片上获取高质量的 H&E 图像和转录组数据。
图E:2D 数据整合与分析。使用 openst 软件包将组织形态信息与单张切片的 ST 数据整合,包括自动细胞分割、模态的成对对齐、在分割细胞中量化转录本。
图F:3D 重建与可视化。使用 STIM 对连续切片的 H&E 染色和基因表达数据进行对齐,对齐后的成像和转录组数据可以作为一个3D 虚拟组织块,使用任何 3D 渲染引擎(如 ParaView)进行可视化和交互式查询。
基于NGS平台实现的高分辨率sST技术在带来亚微米级精度的同时,也引入了独特且严峻的计算分析挑战:
Baysor, Proseg),但面对sST全转录组、高噪声、大数据量的特点,其应用仍具挑战。总的来说,基于 NGS 的 sST 技术实现了革命性的空间分辨率,但其产生的数据具有“海量、稀疏、碎片化”的核心特征,对传统的细胞分割方法、数据分析流程、计算资源以及数据存储与共享标准都构成了巨大挑战。克服这些挑战需要发展免分割分析、高效稀疏数据处理算法、统一且可扩展的数据格式、以及专门针对 3D 高分辨率数据的分析框架。