搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生物信息学、python、R、linux
bamtools分割bam文件
bam文件可以按照染色体或者tag分割，bam文件的分割可以使用bamtools. 用法： Description: splits a BAM file on user-specified property, creating a new BAM output file for each original BAM file) 简单来说，bamtools split 用法为： -in ：指定输入的需要分割的bam文件 -reference ：按染色体分割 -refPrefix :将按染色体分割生成的文件名字前缀 "REF_"替换 -tagPrefix:将按tag分割生成的文件名字前缀"TAG_"替换 1.按染色体分割bam文件 bamtools split -in tmp.bam -reference 2.按 tag分割bam文件 bamtools split -in tmp.bam -tag RG 参考： https://github.com/pezmaster31/bamtools/issues/135
5.1K20发布于 2020-08-11
来自专栏生物信息学、python、R、linux
bam格式转bigWig
如果不满足要求的话，bam2Coverage可能会引发如下错误： "The XXX file does not have BAM or CRAM format"； "ModuleNotFoundError ChIP-seq的例子： bamCoverage --bam a.bam -o a.SeqDepthNorm.bw \ --binSize 10 --normalizeUsing RPGC a.bam -o reverse.bw --filterRNAstrand reverse # 如果在2.2版本之前： bamCoverage -b a.bam -o a.fwd.bw --samFlagExclude 16 bamCoverage -b a.bam -o a.rev.bw --samFlagInclude 16 相当于我们做了如下操作： samtools view -@ 8 a.bam | \ awk -F '\t' '$2==0' | \ bamCoverage -b a.bam -o a.fwd.bw
7.5K30发布于 2020-07-22
来自专栏生物信息学、python、R、linux
根据barcode过滤bam文件
10x 单细胞产生的BAM文件可以根据所需的barcode进行过滤。首先，将所需的cell barcode条形码放入 filter.txt中。并在barcode前面加上CB:Z:，以确保专门过滤BAM文件中的该标记，格式如下所示： ? 其次，将$ BAM_FILE设置为要过滤的BAM文件的位置及名称。例如，如果BAM文件被命名为“ possorted_genome_bam.bam ” ，则使用以下命令。 export BAM_FILE='/your path /possorted_genome_bam.bam' # Save the header lines samtools view -@ 16 -H $BAM_FILE > SAM_header # Filter alignments using filter.txt.
2.9K30发布于 2020-08-14
来自专栏生信喵实验柴
sam和bam处理案例
#2 sam和bam格式转换 samtools view -O bam -o all.bam all.sam samtools view all.bam -o all.sam #转换成cram格式, O bam -o all.sorted.bam all.sam #4 排序后建立索引 samtools index all.sorted.bam #5 比对结果统计 samtools stats #10计算覆盖比率 samtools coverage all.sorted.bam #11 按照染色体拆分bam bamtools split -in all.sorted.bam -reference _1_pilon.bam all.sorted.REF_contig_2_pilon.bam all.sorted.REF_contig_3_pilon.bam all.sorted.REF_unmapped.bam _3_pilon.bam all.sorted.REF_unmapped.bam #13 统计bam并绘图 samtools stats all.sorted.bam >all.stats plot-bamstats
90820编辑于 2022-10-25
来自专栏生信修炼手册
使用pysam操作BAM文件
BAM/CRAM/SAM 对于samtools的封装，提现在操作bam文件上，既可以通过编程来读取bam文件中的内容，也可以实现samtools的调用；对tabix的封装，体现在利用索引来提取对应区域的 BAM 对于Bam文件，遍历行的操作如下 >>> bam = pysam.AlignmentFile('input.bam') >>> for i in bam: ... Options: -b output BAM -C output CRAM (requires -T) -1 use fast BAM compression (implies only (no alignments) ------ >>> pysam.view('-o', 'out.bam', 'accepted_hits.bam') 如果需要对上述几种文件根据指定区域提取子集，或者针对bam文件进行更加个性化的统计处理，可以使用pysam来实现，集成到python开发环境中，实现更加复杂的逻辑处理，会更加的高效。
2K20发布于 2020-12-24
来自专栏生物信息学_troubleshooting
从bam文件到TPM file
referencegenome/genes.gtfTPMCalculator=/data/software/TPMCalculatorTPMCalculator -v -g $genegtf -b *.bam
46500编辑于 2023-07-26
来自专栏生信菜鸟团
更快的处理bam数据—Sambamba
默认会同时输出排序后的文件 .sorted.bam，以及排序后的索引文件 .sorted.bam.bai sambamba sort -t 4 d0.bam --tmpdir ~/test ## 其余参数 ## 查看bam文件，不显示heads 信息 sambamba view d0.bam|less -SN ## 查看bam文件，显示heads 信息 sambamba view -h d0.bam|less 也可以选择 BAM、JSON 或解压缩的 BAM（unpack） -h: #在reads之前打印头部信息（对于 BAM 输出总是这样做）。这可以确保了抽样的可重复性 merge —合并主要用途是将多个排序过的 BAM 文件合并成一个单一的 BAM 文件。 ## 提取d0.sorted.bam 中 chr3 的 200k 到 300k 区域内的所有reads sambamba slice -o chr3_200k-300k.bam d0.sorted.bam
4.8K21编辑于 2023-12-28
来自专栏Alter聊科技
BAM进入新赛段，智能音箱何去何从？
一旦BAM三巨头掌控了市场话语权，也就有了左右市场进程的能力，甚至是选择性控制市场销量。况且当前智能音箱的销量主要集中在一二线市场，倘若BAM继续早先的价格战，并在渠道上主动向五六线城市下沉，智能音箱并非没有继续增长的空间。
46720编辑于 2023-01-13
来自专栏yw的数据分析
bam文件softclip ， hardclip ，markduplicate的探究
测序产生的bam文件，有一些reads在cigar值里显示存在softclip，有一些存在hardclip，究竟softclip和hardclip是怎么判断出来的，还有是怎么标记duplicate的
2K90发布于 2018-04-28
来自专栏GPUS开发者
BAM!吸引奥巴马的脑计划
奥巴马政府将在下一财政年度的预算中为一项重大研究课题——大脑活动图谱（BAM）项目拨款，这项研究最终可以极大地拓展人们对人类大脑健康和患病状态的认知。《科学》最新撰文，详尽解释了BAM何以同人类基因组计划相媲美，以及又如何值得数十亿美元的投资，力图让公众了解BAM的真正价值。
54940发布于 2018-03-30
来自专栏生物信息学、python、R、linux
10X genomics bam文件的格式
samtools view -@ 8 possorted_genome_bam.bam |head ? RG Read group RG:Z:Day1:0:1:HWJ5VDSXX:4 参考： https://davetang.org/muse/2018/06/06/10x-single-cell-bam-files / https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/output/bam
1.7K10发布于 2020-08-11
来自专栏生物信息学、python、R、linux
10X bam文件按barcode分割
最近遇到一个需求是将10X单细胞测序数据按照barcode分割，一般分割文件我们首先想到bamtools split,具体用法可以参考之前记录过的bamtools分割bam文件，但是由于bamtools bamtools split -in tmp.bam -tag CB 因此，查了一下，有人提出了一种解决方案，即将bam文件按barcode排序，然后按相同的barcode将reads取出，代码（转自herrinca ）如下：原文链接：https://github.com/pezmaster31/bamtools/issues/135 samtools sort -t CB unsorted.bam > sorted_tags.bam ##### Code has not been tested on unsorted bam files, sort on barcode (CB): ##### samtools sort -t CB unsorted.bam > sorted_tags.bam ### ##### INPUT: .bam file to be sorted and output directory to place
2.8K20发布于 2020-08-12
来自专栏叶子的数据科技专栏
bam 转 wig 并批量处理的方法
引言本文将介绍一种 bam 转 wig 并批量处理的方法。 /Augustus/bin/bam2wig如果顺利的话，会打印出：Usage: bam2wig [-r region] [-t trackname] <in.bam>------------------ /Augustus由打印可知，在使用 bam2wig 之前需要先进行samtools sort, 因此正确的流程是：## checksamtools quickcheck SRR******.bam## 其中，conda activate bulkrna需要设置为含samtools的环境名，Augustus/bin/bam2wig要设置为bam2wig的绝对路径。1.get_raw_data.sh#! bam2wig SRR******.bam会提示找不到文件。
61610编辑于 2024-03-17
来自专栏生信技能树
把bam文件读入R，并且转为grange对象
假如你的Windows电脑有个bam文件，不想传输到linux服务器去使用samtools等命令行工具来探索它，就可以使用R语言！有成熟的R包可以把bam文件读入R，比如Rsamtools，很简单的代码： library(Rsamtools) bamFile="alignResults.BAM" quickBamFlagSummary (bamFile) # https://kasperdanielhansen.github.io/genbioconductor/html/Rsamtools.html bam <- scanBam(bamFile 那么这个R包就可以多复杂，如果你学习足够努力，那就发一个你比较Rsamtools和samtools命令行工具的心得笔记给我吧，我会给你惊喜的，我的邮箱是 jmzeng1314@163.com names(bam [[1]]) tmp=as.data.frame(do.call(cbind,lapply(bam[[1]], as.character))) tmp=tmp[tmp$flag!
2.9K20发布于 2018-12-24
来自专栏单细胞天地
非正常数据读取——之仅有bam文件
.bam fasp.sra.ebi.ac.uk:/vol1/run/SRR117/SRR11798251/ICBtreated_Brca1null_rep1.bam fasp.sra.ebi.ac.uk 转fastq 2.1 special bam of cellranger 这里的bam序列比对结果文件应该是作者使用cellranger后的产生的比对结果。 samtools view ICBtreated_Parental_rep1.bam | less -SN samtools view ICBtreated_Parental_rep1.bam | head 如下图是一个bam文件的处理结果。其很强大的功能：自动根据bam文件，生成配套的三种文件。而且还修改为规范命名！这里为空，表示bam文件里没有。而且的确也不需要，就提供一个空序列文件即可。
3.1K40发布于 2020-12-11
来自专栏生信菜鸟团
bam文件转fastq的一些小tips
同样的，让人工智能大模型梳理一下这个bam2fastq工具的来龙去脉，使用方法：一句话定位 bam2fastq 是用 C 写的轻量级命令行工具，只做一件事——把 BAM/CRAM 里任意状态的 reads 先确保 BAM 已按 QNAME 排序！ samtools sort -n -o qsort.bam original.bam # 2. 旧版 bam2fastq bam2fastq -o my_%#_sequence.txt -f qsort.bam 输出： my_1_sequence.txtmy_2_sequence.txt（纯文本一、命令骨架 bam2fastq [options] input.bam [input2.bam ...] 支持批量输入多个 BAM/CRAM；结果文件名由 -o模板决定。 CRAM 直接转，参考同目录 bam2fastq -j 6 -o % data.cram # 自动找 ref.fa 批量样品 bam2fastq -j 16 -o % *.bam #
69110编辑于 2025-11-19
来自专栏单细胞天地
使用velocyto进行bam转loom吐血踩坑记录
-09-03 01:07:06,306 - DEBUG - Peeking into Cell_ranger_count/200739E_GDLC_PWZ/outs/possorted_genome_bam.bam Cell_ranger_count/200739E_GDLC_PWZ/outs/cellsorted_possorted_genome_bam.bam already exists. 按照CB排序 nohup samtools sort -@ 10 -t CB -O BAM -o cellsorted_possorted_genome_bam.bam possorted_genome_bam.bam 2021-09-03 02:43:17,661 - INFO - Scan Cell_ranger_count/200739E_GDLC_PWZ/outs/possorted_genome_bam.bam 2021-09-03 02:43:20,862 - DEBUG - Reading Cell_ranger_count/200739E_GDLC_PWZ/outs/possorted_genome_bam.bam
5.8K10发布于 2021-09-15
来自专栏yw的数据分析
C++使用htslib库读入和写出bam文件
htslib可以用来处理SAM, BAM,CRAM 和VCF文件，是samtools、bcftools的核心库。 (b) (((b)->core.flag&BAM_FREAD1) ! *header; bam1_t *aln = bam_init1(); samFile *in = sam_open(argv[1], "r"); htsFile *outR1 ;++i){ int icigar = cigar[i]; printf("%d%d\n",bam_cigar_op(icigar),bam_cigar_oplen bam_seqi(seq,i)遍历。
2.4K90发布于 2018-04-28
来自专栏Y大宽
7 比对到参考基因组输出bam文件
wesproject/4_clean/wes/$fq1 /home/kelly/wesproject/4_clean/wes/$fq2 |samtools sort -@ 20 -o $sample.bam - & done 注意bam命令的-R参数，不加也可以运行，但是后面的gatk时会报错，但是也有解决办法，见后面。
1.9K20发布于 2019-06-15
来自专栏Y大宽
4 比对到参考基因组输出bam文件
一个个比对，生成BAM文件 align目录 sample=SRR7696207 bwa mem -t 2 -R "@RG\tID:$sample\tSM:$sample\tLB:WGS\tPL:Illumina /clean/SRR7696207_2_val_2.fq.gz |samtools sort -@ 2 -o SRR7696207.bam - 不用-R参数也可以执行，但后面gatk的时候会报错 /clean/$fq2 |samtools sort -@ 2 -o $sample.bam - done & [M::bwa_idx_load_from_disk] read 0 ALT contigs not enough pairs [M::mem_process_seqs] Processed 142876 reads in 24.094 CPU sec, 11.833 real sec 3 查看bam 文件 $ samtools view -H SRR8517853.bam |grep -v "SQ" @HD VN:1.6 SO:coordinate @RG ID:SRR8517853
3.7K40发布于 2019-06-03

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

bamtools分割bam文件

bam格式转bigWig

根据barcode过滤bam文件

sam和bam处理案例

使用pysam操作BAM文件

从bam文件到TPM file

更快的处理bam数据—Sambamba

BAM进入新赛段，智能音箱何去何从？

bam文件softclip ， hardclip ，markduplicate的探究

BAM!吸引奥巴马的脑计划

10X genomics bam文件的格式

10X bam文件按barcode分割

bam 转 wig 并批量处理的方法

把bam文件读入R，并且转为grange对象

非正常数据读取——之仅有bam文件

bam文件转fastq的一些小tips

使用velocyto进行bam转loom吐血踩坑记录

C++使用htslib库读入和写出bam文件

7 比对到参考基因组输出bam文件

4 比对到参考基因组输出bam文件

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐