首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏分析工具

    maftools癌症体细胞变异(突变)分析工具学习

    Maftools 是一个专门用于分析和可视化突变数据的 R 包。 临床数据整合:可以将临床数据与突变数据整合,分析不同临床亚群的突变特征和生存分析等。统计分析:包括突变负荷分析、通路富集分析、TCGA数据整合分析等功能。 这种类型的遗传变异非常普遍,并且与许多遗传性疾病和个体之间的表型差异有关。 )和变异等位基因计数(t_alt_count)的列。 VAF的计算公式通常是变异等位基因计数除以总等位基因计数(变异等位基因计数加上参考等位基因计数) 10、共现和互斥分析somaticInteractions( maf, top = 20, genes

    78210编辑于 2024-09-02
  • 来自专栏啄木鸟软件测试

    变异测试

    =10; i++){ //变体1 //To-do ... } 变体2如下: for(int i=0;i<10; i--){ //变体2 //To-do ... } 由此可见变体1与源代码是等价的 :i从0开始,经历2,3,4,5,6,7,8,9到10,在源代码中由于10<10返回False,退出循环;在变体1中由于10! =10返回False,退出循环。而变体2与源代码是非等价的:i从0开始,经历-1,-2,-3…永远达不到i<10为False的情形。 各位可以看到3个变异,存活了1个,杀死了22个,最后得分为66.7%。分析一下原因。 这里对于x * y的3个变异,分别为x / y ,x // y和x ** y。 mul classCalculatorTest(TestCase): def test_mul(self): self.assertEqual(mul(2, 3), 6) 分析一下

    1.1K30编辑于 2022-05-22
  • 来自专栏InvQ的专栏

    变异测试

    什么是变异测试? 变异测试,英文Mutation Testing,是使用变异器 (切换数学运算符,更改返回类型,删除调用等)将代码修改为不同的变异(基于变异器创建新代码),并检查单元测试是否失败。 所以,变异测试的有效性可以衡量杀死了多少个突变。 变异测试是覆盖率的一个很好的补充。相比覆盖率,它能够使单元测试更加健壮。 执行变异测试 在执行变异测试前需要先执行单元测试,不然变异测试有可能找不到单元测试类。 找到对应模块下的pitest插件: ? 运行完成后,会自动生成变异测试报告,报告位置一般在对应模块的target/pit-reports目录下: 报告会详细列出每个包、每个类的覆盖率,变异通过率等。 ? 从上面很明显可以看到我的单元测试其实并没有写得完整,我们看看里面哪些变异详细报告: ? ? ? 如果我的单元测试加上边界测试: ? 再次执行,变异测试全覆盖了! ?

    2K20发布于 2021-03-04
  • 来自专栏R语言交流中心

    R语言实现拷贝数变异分析

    拷贝数分析大家都不陌生, 其可能和表型变异紧密关联,同时在物种的演化和发展中发挥着重要作用。今天我们来介绍一个在R语言环境下运行的拷贝数分析包cn.mops.。 主要是展示拷贝数变异位置的。评估分数为正则为红色,为负则为蓝色,样例如下: ? plot(resCNMOPS,which=1) ? plot(resCNMOPS,which=5) ?

    3.4K30发布于 2019-07-31
  • 来自专栏生信开发者

    生信分析零背景 变异注释你也行

    背景 BACKGROUND 人类基因组测序数据分析得到的变异位点,如SNV、INDEL,需要经过基因信息、人群频率、进化保守性预测、蛋白功能影响预测等分析,才能用于遗传分析和解读。 目前已知的主流变异位点注释软件包括annovar、VEP、 snpeff等,VEP是ensembl出品,质量有保障。 2、参考文献注释: 报道该变异位点的文献PMID号,文献收集自ClinVar数据库2019年12月更新版和HGMD-public数据库2019年第4季度更新版(2020年10月30日测试结果) ? genome/genebuild/mane.html (2)https://usf.app.box.com/s/cdws8yx5occ603ccbknwyamz5reapdug END 作者:研发中心生信分析

    3.3K21发布于 2021-03-18
  • 来自专栏生信菜鸟团

    scDNAseq 拷贝数变异分析肿瘤克隆进化

    研究方法 病人或样本:10个 HCC 患者分离的 1275 个细胞进行 scDNAseq, 1 个患者的 356 个细胞进行倍性 scDNA-seq,3名患者的27344个细胞进行scRNA-seq scDNA-seq 主要是采用了 MALBAC 方法进行全基因组扩增,该方法覆盖率较高,适合 CNA 分析。 关心的癌基因主要来自: 研究结果 scDNA-seq结果:1222个肿瘤细胞和53对照正常细胞进行的 scDNAseq,平均测序深度是 0.4x,分析得到的拷贝数变异结果:发现了 3 个肿瘤细胞亚群(图 R2, Bayesian information criterion, and Akaike information criterion 这四个指标进一步拟合模型,作者发现 DPCNE 模型更加符合这 10 名患者的 CNV 进行模式(图3A),然后计算 pairwise distances of CNA profiles (PWD-CNA) 指标,基于中位数将10个患者分为 P-group 和 G-group

    57110编辑于 2024-04-11
  • 来自专栏青青青山的学习笔记

    单细胞转录组之拷贝数变异分析

    1.什么是拷贝数变异拷贝数变异(Copy number variation, CNV):基因组发生重排而导致的,一般指长度1 kb 以上的基因组片段的拷贝数增加或者减少, 主要表现为亚显微水平的重复或者缺失 因此称为“微”缺失或重复变异。 作为疾病的⼀项⽣物标志,染⾊体⽔平的缺失、扩增等变化已成为许多疾病研究的热点,然⽽传统的⽅法(⽐如G显带,FISH,CGH等)存在操作繁琐,分辨率低等问题,难以提供变异区段的具体信息,单细胞测序为我们提供了一种新的工具和视野去分析 ## 这个取决于自己的分组信息里面的# cutoff=1 works well for Smart-seq2, and # cutoff=0.1 works well for 10x Genomics# colors = as.data.frame(the_bars), dend = infercnv.dend, sort_by_labels_order = FALSE, add = T, y_scale=10

    4.2K11编辑于 2022-07-07
  • 来自专栏yw的数据分析

    生物结构变异分析软件meerkat 0.189使用笔记(二)

    如果-d 选项是5或者小于5,使用用-c相同的参数,如果-d 很大,比如10,那么使用更小的-c,比如5。 开了这个选项之后应使用-Q 参数过滤低mapping reads,推荐-Q设置10,对于bwa比对过的bam,也可以继续过滤。 核bwa比对花费1.5天和10GB的内存。 /scripts/fusions.pl -i variantfile -G /db/hg18/refGene_hg18_sorted.txt 4.3 为变异位点设计引物 使用primer.pl 有时候,即使引物是在重复序列上(小写字母),但是在基因组上仍然是单一比对的,(1 blat hit),因为是重复元件的变异,挑选这种引物是可以的。

    1.1K30编辑于 2022-03-22
  • 来自专栏实验盒

    Biobank测序时代的罕见变异关联分析进展综述

    随着测序成本的降低和技术的进步,采用全外显子组和全基因组测序对大规模生物银行样本进行分析变得可行,这为稀有变异关联分析提供了机会和挑战。 文章主要内容包括: 稀有变异分析方法的基本概念:介绍了识别稀有变异在遗传疾病和常见复杂表型中的重要性。 利用变异注释或外部对照改进统计功效的最新方法:探讨了如何通过变异注释或使用外部对照数据提高稀有变异关联分析的统计效力。 面临的挑战:包括如何考虑人群结构、极不平衡的病例对照设计等问题。 家族测序数据和更复杂表型稀有变异分析的最新进展和挑战:讨论了在家族测序数据以及如生存数据等更复杂表型中稀有变异分析的最新进展。 进一步的方法学研究方向:提出了其他潜在的研究方向以进一步探讨和解决稀有变异关联分析中的挑战。

    29110编辑于 2024-03-25
  • 来自专栏yw的数据分析

    生物结构变异分析软件meerkat 0.189使用笔记(一)

    1. 50bp的reads,<10x TCGA 基因组 建议使用-s 18 -l 0 -q 0 估计50bp片段过小,所以-s 选项 以1/3 read 长度,短长度 建议使用-s 20 -k 10000 -q 5 -k 10000表示10000的copy number的reads也会留下,-q 5,就是过滤的basequality为5 这次我们实验室分析的数据

    83730编辑于 2022-03-22
  • 来自专栏生信喵实验柴

    GATK变异检测

    {i} -I ${j} -o ${i%*.fastq.gz}_clean.fastq.gz -O ${j%*.fastq.gz}_clean.fastq.gz -z 4 -q 20 -u 40 -n 10 #3' fastp.sh sed -i 's#/share/home/xiehs/data/Project_RM8398/Sample_U0a/##3' fastp.sh bsub -q fat -n 10 samtools flagstat merge.sorted.markdup.BQSR.bam #建立索引 time samtools index merge.sorted.markdup.BQSR.bam 五、变异检测 3、1000G 千人基因组计划(1000 genomes project)质控后的变异数据,质控后,它包含的绝大部分都是真实的变异,但由于没办法做全面的实验验证,并不能排除含有少部分假阳性的结果。 dbSNP 收集的数据,实际都是研究者们发表了相关文章提交上来的变异,这些变异很多是没做过严格验证的。

    91810编辑于 2023-09-04
  • 来自专栏生信技能树

    RNA-seq入门实战(八):GSVA——基因集变异分析

    GSVA简单介绍 官方文档:GSVA: gene set variation analysis (bioconductor.org)不错的一篇文章:GSVA的使用 - raisok 定义基因集变异分析( GSVA)是一种特殊类型的基因集富集方法,通过对分析的功能单元进行概念上简单但功能强大的改变——从基因到基因集,从而实现对分子数据的路径中心分析。 GSVA分析常用MSigDB数据库中基因集,也可以自定义基因集进行分析。 (dat_plot$p)*dat_plot$group # 将上调-log10p设置为正,下调-log10p设置为负 dat_plot$id <- str_replace(dat_plot$id, "KEGG (p_cutoff),log10(p_cutoff)),color = 'white',size = 0.5,lty='dashed') + xlab('') + ylab('-log10(P.Value

    11.1K113编辑于 2022-07-26
  • 来自专栏生信修炼手册

    breakdancer检测结构变异

    breakdancer 是一款结构变异检测软件, 专门针对双端测序数据进行开发,github地址如下 https://github.com/genome/breakdancer 分析原理图如下 ? 从原理图可以看出,breakdancer 会根据双端reads的比对情况,检测以下5种类型的结构变异 insertions deletions inversions inter-chromosomal 鉴定结构变异 用法如下 breakdancer_max -t -q 10 -d sv.reads config.txt > sv.out 结构变异的检测计算量较大,所以需要的时间也很久。 each map file Estimated allele frequency Software version The run parameters 1到6列描述的是断裂点的位置信息;第7列描述结构变异的类型 ,DEL代表缺失,INS代表插入,INV代表倒位,ITX代表同一染色体上的易位,CTX代表不同染色体之间的易位;第8列代表结构变异的长度,对于染色体间的易位,这个数值没有含义;第9列代表该结构变异可信度的打分值

    1.5K20发布于 2020-05-11
  • 来自专栏全栈程序员必看

    elf 变异upx 脱壳

    p_offset=Qword(e_phoff+0x8); StartImg=Qword(e_phoff+0x10

    2K20编辑于 2022-09-14
  • 来自专栏生信菜鸟团

    文献阅读 · 变异分析流程--肿瘤基因组测序数据分析专栏

    Title Best practices for variant calling in clinical sequencing Journal Genome Medicine volume Factor 10 临床上更关心的是体细胞突变、拷贝数变异和融合基因等与临床表征是否相关,通常需要肿瘤-正常样本配对进行分析。 肿瘤和正常样本在突变位点的 reads 覆盖度 > 10x 体细胞拷贝数变异 对于体细胞拷贝数变异 SCAN 分析,同样也是建议使用多个工具结果,如 GATK 和 VarScan2 ,分析过程中纳入 VAF 过滤之后还有更多分析,如肿瘤异质性、TMB评估、克隆分析、突变特征分析 Mutation Signature、肿瘤纯度评估、驱动突变的推断、MSI 评估、新抗原预测等。 这些分析和可视化用到的众多工具或R包,其安装方法和使用方法都有一定难度。本系列文章的后续推文,将就这些分析进行文献解读和工具使用方法介绍。

    1.9K61发布于 2021-09-17
  • 来自专栏biosignalsplux

    使用 Kubios 分析 BITalino 采集的心率变异性(HRV)数据

    作者:科采通 关键词:BITalino、Kubios HRV、ECG、心率变异性、RR间期、科研工具、Python预处理一、前言心率变异性(Heart Rate Variability, HRV)是评估自主神经系统功能的重要指标 ) 4.2 加载 RR 间期数据 打开 Kubios HRV 点击 File > Load RR-intervals 选择我们刚刚生成的 rr_interval_kubios.txt 4.3 数据分析功能预览模块分析内容时域分析平均 RR、SDNN、RMSSD、PNN50等频域分析LF/HF比值、功率谱密度非线性分析Poincaré 图、DFA、样本熵导出报告(PDF)、原始数据、结果汇总表五、Kubios 输出示例分析完成后,Kubios 六、进阶拓展建议 与 EDA、EMG 同步分析:使用 BITalino 同步记录多个通道 ⏳ 长期 HRV:结合夜间佩戴设备进行 REM 睡眠段分析 情绪分类研究:结合主观评分(如 PANAS) 提取 RR 间期、并导入 Kubios HRV 进行心率变异分析的完整流程。

    70210编辑于 2025-06-25
  • 来自专栏FreeBuf

    NDAY漏洞CVE-2017-11882新变异样本分析

    与上一篇文章《一个CVE-2017-11882漏洞新变异样本的调试与分析》https://www.freebuf.com/vuls/190397.html中的样本相比,本次样本RTF格式更加怪异,下面来看看具体的分析情况 0x1 文件格式 1、静态文件 利用winhex查看该文件,发现其是一个rft1开始的RTF格式文件,不过该文件与之前分析的CVE-2017-11882样本相比,显得较为怪异,没有包含OLE结构。 2、查杀情况 利用文件HASH值,在totolvirus查询,发现该样本10月9日上传,57款杀软有11款已经查杀,其中McAfee-GW-Edition、Ikarus、McAfee、AhnLab-V3 3、RTFOBJ工具分析 利用RTFOBJ工具分析,结果如下: ? 其中导出的virus.doc_object_0000006C.bin不是正常的OLE结构。 ? 上篇文章中的加解密算法为: 至此,样本基本调试分析完毕。 0x4 小结 1、CVE-2017-11882漏洞由于稳定、效果好等特点,经久不衰。 2、CVE-2017-11882漏洞变异样本层出不穷。

    82320发布于 2019-10-29
  • 来自专栏生信技能树

    Variant 分析阶段小结2- 变异寻找碎碎念

    这里需要说明的是如果在分析过程中但凡要涉及到使用 GATK 相关的流程,比对后产生的 bam 文件必须包含@RG tag 信息,如果没有的在后续分析中会各种报错。 且分析物种为植物。更新内容后续会发布在博客。 call variant 的工具非常之多,但是如果观察官方提供的最佳实践步骤的话多数都是使用HaplotypeCaller(HC),这厮在前任的基础上引入了实时de novo算法,能够通过对活跃区域(变异热点区域 比如 SAF >0 & SAR>0; PRR>1 & RPL>1 ; QUAL/AO>10 等等。 如果时间允许可以使用三个软件共同操作,当然,到了这里变异相关的分析不是结束而是刚刚开始…… ---- Variant 分析阶段小结1-基础碎碎念 谁来拯救你 我的屁屁踢 RNA-seq 从原理到应用

    4.3K40发布于 2018-07-27
  • 来自专栏单细胞天地

    使用inferCNV分析单细胞转录组中拷贝数变异

    分享是一种态度 inferCNV用与探索肿瘤单细胞RNA-seq数据,分析其中的体细胞大规模染色体拷贝数变化(copy number alterations, CNA), 例如整条染色体或大片段染色体的增加或丢失 工作原理是,以一组"正常"细胞作为参考,分析肿瘤基因组上各个位置的基因表达量强度变化. 通过热图的形式展示每条染色体上的基因相对表达量,相对于正常细胞,肿瘤基因组总会过表达或者低表达。 这个需要根据具体的测序深度来算,官方教程建议10X设置为0.1,smart-seq设置为1。你可以先评估下不同阈值下的保留基因数,决定具体值。 参数说明 Infercnv::run的参数非常之多,总体上分为如下几类 基本设置 平滑参数 基于肿瘤亚群的下游分析(HMM或non-DE-masking) 根据 BayesNet P(Normal) 过滤低可信度 HMM预测结果 肿瘤亚群细分 去噪参数 离群值修剪 其他选项 实验性参数(不稳定) 差异表达分析的实验性参数 你可以按照具体的需求修改不同步骤的参数,例如聚类默认cluster_by_groups=FALSE

    6.6K22发布于 2020-03-27
  • 来自专栏脑电信号科研科普

    Nature:相同fMRI数据集多中心分析变异

    三、结果 1.跨团队的结果变异性 NARPS的第一个目标是评估分析相同数据集的独立团队的结果在现实中的变异性。 2.与分析变异性有关的因素 为了检验报告的二元结果中分析变异性的来源,研究者们分析了团队使用的Pipeline以及他们提供的无阈值和阈值统计图。没有两个团队拥有相同的Pipeline。 4.阈值统计图的变异性 通过分析研究小组提交的统计图,进一步探讨分析变异性的性质。阈值映射是高度稀疏的。 在所有分析小组提交了他们的结果(这些结果是保密的)之后,市场连续开放10天,持续时间1.5个月。 这些做法,再加上使用预先登记或注册的报告,将减少研究人员的自由度,但不会防止分析变异性;然而,他们将确保变异性的影响是可以评估的。

    66400发布于 2020-11-17
领券