在教程 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这个第一次分群规则是 :
然后呢,第二次分群的 上皮细胞可以细分恶性与否,免疫细胞呢细分可以成为: B细胞,T细胞,巨噬细胞,树突细胞等等。但实际上每个免疫细胞亚群仍然可以继续精细的划分,这个时候就有3条路线了:
但第三次分群仍然不是终点,比如张泽民团队的单细胞研究把T细胞分的更夸张。文章的实验设计图里面可以很清楚的看到,研究者们就是专门针对CD4或者CD8的T细胞,首先就是流式筛选了这两群细胞进行后续分析:

实验设计图
全部的T细胞可视化如下,可以看到CD4与CD8的T细胞是有比较明显的界限的:

CD4与CD8的T细胞是有比较明显的界限
文章描述的是:t-distributed stochastic neighbour embedding (t-SNE) plot of 8,530 T cells from 12 patients with CRC showing 20 major clusters (8 for 3,628 CD8+ and 12 for 4,902 CD4+ T cells ;
细胞亚群的生物学功能命名,以及各自的高表达量基因,也是在文章的表格里面列的清清楚楚 :

确实是有点多啊,12个亚群 for 4,902 CD4+ T cells ;如下:
而8个亚群 for 3,628 CD8+ ,也是N初始,CM中央记忆型,EM记忆型,EX耗竭型的功能分类。
首先是重点标记基因的表达量可视化,表达量高低以颜色深浅仍然是映射到了tSNE图,很容易看到不同细胞亚群高表达哪些基因。

重点标记基因的表达量可视化
然后是不同细胞亚群的多个高表达量基因的热图可视化:

不同细胞亚群的多个高表达量基因的热图
小提琴图可视化也有异曲同工之妙,如下:

小提琴图
还有doplot,featureplot都可以实现同样的效果, 我想应该是没有必要把这5种可视化方法集齐了,不然就有凑图的嫌疑了。
既然每个细胞亚群都有自己特异的高表达量基因,首先可以对各自的基因集进行GO/KEGG等数据库的生物学功能基因集的超几何分布检验,然后也可以对单个细胞进行独立的GSEA分析,文章可视化如下:

Gene set enrichment analysis (GSEA) showing the enrichment of proliferation-related pathways in CD8+ TEX cells (n = 3,628; false discovery rate < 0.01; labelled in red).
发表于2020年2月的文章:《Tissue Determinants of Human NK Cell Development, Function, and Residence.》,研究者们从60好受试者的多种器官通过流式分选NK细胞,如下:

NK细胞文章流程图
可以初步分成15个细胞亚群,(A) Force-directed plot showing the relationship between different NK cell communities identified by multi-dimensional analysis (data compiled from 5 donors). Each node is an aggregation of similar cells resulting from downsampling of data, and collection of similar colored nodes forms 15 distinct NK cell clusters.

NK细胞的15个亚群
同理,其它的免疫细胞是不是也可以这样近乎无限的细分呢?确实非常有意义吗,还是所谓的“内卷”呢?
查询其它免疫细胞亚群的精细分群文献,比如B细胞,巨噬细胞,树突细胞等等。
记得仔细观察各个文献是如何描述细胞亚群和细胞状态的。