这个分辨率意味着CopyKAT可以在单细胞中检测到跨越5百万碱基对的染色体拷贝数变化,进而识别该区域内的非整倍体(基因组拷贝数异常)。 因此,inferCNV在依赖参考细胞的选择上比CopyKAT更为严格。在应用层面两种都可以使用~ 不必纠结。 这一步很慢copykat.test <- copykat(rawmat=exp.rawdata, id.type="S", # S是symbol的含义 %in% c("aneuploid","diploid")),]CNA.test <- data.frame(copykat.test$CNAmat)查看pred.test$copykat.pred中的数据 5.UMAP可视化# 把结果添加到Seurat对象的meta.data中scRNA$CopyKAT = copykat.test$prediction$copykat.predDimPlot(scRNA
单细胞测序—Copykat抽样以及结果映射copykat的分析,还是太耗费内存和时间了,详细见单细胞测序—Copykat以及服务器Rstudio运行长脚本的解决方案,因此常规的做法是先抽样,再把结果映射回全部的细胞 #############在子集上训练(跑CopyKAT),然后将结果标签映射回全集#copykat的作者建议每个样本单独跑,避免批次效应影响CNV推断#这里我采取了折中的方案,把NEU跑一次,Ade "GBC_copykat_CNA_raw_results_gene_by_cell.txt"# [3] "GBC_copykat_CNA_results.txt" "GBC_copykat_heatmap.jpeg " copykat_result <- readRDS('.. /result/rds/step2_sce_select_Epithelial_copykat.rds')pred <- copykat_result$predictiontable(pred$copykat.pred
/scripts/step4-run-copykat.R & cd ../ done 很容易看到了每个病人的单细胞水平细胞表达量矩阵跑这个copykat流程耗费时间: S11/nohup.out:Time 让我们看看它的图表: test_copykat_heatmap 确实有点奇特哦,这个时候肉眼跟软件其实是一样的! copykat 虽然把大量的ref和spike错误的判定为恶性细胞,但是很明显我们看图就会反过来把前面的恶性上皮细胞定义为正常细胞。这个时候根据有一些唯心主义的嫌疑了。 虽然 copykat 仅仅是没有infercnv直观,但是copykat至少给出来了 aneuploid 和 diploid的判断,inferCNV给出来的结果文件,仍然是需要自己读取,自己计算cnv打分 肿瘤相关单细胞数据的拷贝数变异单项分析2400,如果需要前面的降维聚类分群需要再多加800,提供区分样品的独立copykat和infercnv流程,以及合并的copykat和infercnv流程的全部结果和代码文件夹
我需要对上皮细胞进行copykat的分析,这种分析非常耗费计算资源, 其中也没有必要对所有的细胞进行copykat,我这里提取了6w细胞进行分析。 copykat的作者建议每个样本单独跑copykat后,再把结果合并,以减少批次效应对算法cnv判断的影响。 ############ #在子集上训练(跑CopyKAT),然后将结果标签映射回全集 #copykat的作者建议每个样本单独跑,避免批次效应影响CNV推断 #这里我采取了折中的方案,把NEU跑一次, copykat # ############ 以下代码废除 copyKAT NEU############ # # copykat_out_neu <- ".. > copykat.log 2>&1 & #查看日志 cat copykat.log #或 tail -f copykat.log 这样放在后台执行,就不会因终端与服务器断开导致程序运行失败了,所以这样才是服务器
构建两个算法都需要的输入数据 其中 infercnv 算法需要3个文件,但是 copykat 只需一个文件即可,我们这里一起制作。 然后走copykat流程 有了前面的3个文件,接下来走copykat流程超级简单!真正的核心代码就 是 copykat 函数,来源于 copykat这个包! ') 可以看到: > Sys.time() [1] "2021-12-02 10:14:49 CST" # 本身 copykat 函数运行过程也会自己记录时间 [1] "running copykat :step4-run-copykat.R 进行如上所示的并行啦。 然后我们一起看看copykat针对全部的病人混合群里的结果吧!
cell和3个NK细胞cluster,从NK细胞毒性激活/抑制,细胞通讯,NK细胞功能相关的标志物,NK细胞介导的毒性通路等角度进行分析,并用NLH单细胞转录数据集进行验证 对上皮细胞取子集进行细分,用copykat library(scRNAtoolVis) library(enrichplot) library(GSEABase) library(msigdbr) library(CellChat) library(copykat 'tsne',group.by = 'type',label = T,label.box = T) dim(Epi_sub) # copycat # 鉴定正常细胞和肿瘤细胞 Epi_cnv <- copykat <- ifelse(rownames(Epi_sub@meta.data) %in% rownames(pred.test[pred.test$copykat.pred=='aneuploid',]) ',label = T) p3 <- DimPlot(Epi_sub,group.by = '<em>copykat</em>.Tumor_pred',label=T) p1+p2+p3 copykat的鉴定结果,正常细胞和肿瘤可以区分开
GeniusinferCNV示例教程:https://github.com/broadinstitute/inferCNV/wikicopyCAT示例教程:https://github.com/navinlabcode/copykat 改进部分:自动识别normal细胞CopyKAT算法概述在统计学上,CopyKAT将贝叶斯方法与层次聚类相结合,计算单个细胞的基因组拷贝数分布,并从高通量单细胞转录组数据中定义克隆子结构。 首先,单细胞转录组数据的Unique Molecular Identifier(UMI)的基因表达矩阵作为CopyKAT的输入,通过它们的基因组坐标对它们进行排序,并对基因的排列进行注释。
ConsensusTME DoubletFinder EPIC MCPcounter SCENIC SCEVAN SCopeLoomR VISION copykat cpbnplot depmap ggforestplot https://api.github.com/repos/YosefLab/VISION/tarball/HEAD https://api.github.com/repos/navinlabcode/copykat ge8de4ce.tar.gz 15M Sep 19 10:19 NightingaleHealth-ggforestplot-547617e.tar.gz 6.9M Sep 19 10:19 navinlabcode-copykat-b795ff7
("sizes.cellranger-GRCh38-1.0.0.txt", stringsAsFactors = F)# List of cyclegenes retrieved from the "CopyKAT"package (https://github.com/navinlabcode/copykat)cyclegenes <- readRDS("cyclegenes.rds")# bed file indicating ("sizes.cellranger-GRCh38-1.0.0.txt", stringsAsFactors = F)# List of cyclegenes retrieved from the "CopyKAT"package (https://github.com/navinlabcode/copykat)cyclegenes <- readRDS("cyclegenes.rds")# bed file indicating
区分肿瘤细胞和正常细胞 devtools::install_github("navinlabcode/copykat") library("copykat") library(Seurat) library (copykat) library(tidyverse) scRNA <- sce counts <- as.matrix(scRNA@assays$RNA@counts) table(scRNA$celltype ) cnv <- copykat(rawmat=counts, ngene.chr=5, sam.name="test", n.cores=8) # ngene.chr参数是过滤细胞的一个标准,它要求被用来做 table(a) scRNA$CopyKAT = a p1 <- DimPlot(scRNA, group.by = "celltype", label = T) p2 <- DimPlot(scRNA , group.by = "<em>CopyKAT</em>") + scale_color_manual(values = c("#F8766D",'#02BFC4', "gray")) pc <- p1 + p2 pc
分群等基本操作; (2)根据Shannon entropy香农熵判断批次效应,如有则使用Harmony校正; (3)使用CHETAH包分3个深度注释细胞类型:major、immune、minor; (4)使用copyKAT
阳了个阳~~~文章在10X单细胞(10X空间转录组)CNV分析回顾之CopyKAT详细回顾了copycat,还有分享的文章copyKAT推断单细胞转录组肿瘤细胞CNV(自动识别肿瘤normal和tumor
然后,我们使用Visium中的全基因组转录组信息来估计拷贝数状态(使用CopyKat18),并标注主要的遗传亚克隆。 Clone detection on Visium using CopyKat 使用 CopyKat 在 Visium 上进行克隆检测 Para_01 我们使用了默认参数的CopyKat(v.1.1.0
通过算法(如InferCNV、CopyKAT)比较肿瘤位点与正常参考细胞的表达模式,识别异常区域。
CopyKAT在识别图2上图中的癌细胞方面是第二好的。由于它不能分配完整的标签列表,copyKAT没有在图2中展示。
而且前些天我们 比较了copykat和infercnv这两个从单细胞转录组数据推断肿瘤拷贝数变异技术差异 ,可以看到如果混合全部的病人的上皮细胞,使用infercnv更容易判断上皮细胞里面的恶性肿瘤细胞
dynamic programming approach for single cell data CNV segmentation and checkpoint detection. inferCNV CopyKat
dynamic programming approach for single cell data CNV segmentation and checkpoint detection. inferCNV CopyKat
该图显示了通过 CopyKat 估算的每条染色体臂中不同细胞类型和肿瘤数据集中患者的染色体增益(红线)和损失(蓝线)。为了绘图目的,所有免疫细胞类型被归为一组。B. 代码可用性用于所有分析和生成本文所有图表的脚本可在以下网址获取: https://gitlab.com/cvejic-group/lung https://github.com/sdentro/copykat_pipeline
此系列包括但不限于以下内容:数据下载与读取;质控和去批次;降维聚类;分群注释;差异分析;富集分析;拟时序分析;细胞通讯;CopyKAT。