首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生物信息云

    生物信息学初识篇——第二章:序列比对(2

    生物信息学初识篇——第一章:生物数据库 生物信息学初识篇——第二章:序列比对(1) 四、双序列局部比对 一长一短的两条序列,比较局部比比较全长更有意义。 开头的一串gap是个例外,因为 seq2 太短,seq1的这一段只能跟gap相对。其他部分的gap都是分散出现的。

    7.6K70发布于 2019-08-07
  • 来自专栏生信挖掘姬

    基础生物信息学

    生物信息学序列分析是了解这些序列的核心,这本书简单介绍了DNA, RNA和蛋白质序列的研究。 生物信息学(Bioinformatics )涉及生成,可视化,分析,存储和检索大量的生物信息。 原始形式的生物医学数据(包括DNA序列)的生成不涉及生物信息学技能。但是为了使该序列可用,必须对其进行分析,注释和重新生成适合数据库的格式。这些都属于生物信息学分析范畴。 其中许多分析可以自动化,但需要具有生物信息学技能或经验的人来分析和支持。 一旦拿到数据,您如何分析数据呢?有没有DNA和蛋白质序列文件之类的文本呢? 生物信息学是最早接受科学技术的领域之一。网页是传播信息的工具,本书中我们将使用许多网页。 最后,生物信息学活动通常涉及大量数据。即使如果您只关注一个基因,那么仍然会有大量的数据连接到该单个序列。 尽管如此,生物信息学领域面临的最大的挑战之一是信息的绝对泛滥以及如何生成,可视化,分析,存储和检索这些数据,这无论怎么强调都不为过。

    74560发布于 2020-06-05
  • 来自专栏生物信息云

    医学生物信息学文献第2期:肿瘤微环境

    此外,BDCA-1+DC(CDC2s)在2个群组中均未显示与应答者状态相关的显著变化 (Fig. 1f)。 Flt3l-纯合报告小鼠注射异常的B16F10肿瘤,在肿瘤移植后2周,TFP作为Flt3l表达的读数,仅在淋巴细胞内检测到(Fig. 2b,c)。 在肿瘤中与能产生FLT3L的淋巴细胞间隔的IL2RG-/-:WT混合骨髓嵌合体相比,其淋巴细胞室不能产生FLT3L的IL2RG-/-:Flt3l-/-,CD 103+SDC的水平降低(图3b)。 为了直接比较SDC和NK细胞的数量,收集人黑色素瘤活检标本,消化成单细胞悬液,用流式细胞术进行分析(队列A;补充图2和补充表2)。 11、NK-SDC轴与抗PD-1免疫治疗的反应性相关 用于黑色素瘤群组A的综合流式细胞仪板对TME中的33个免疫群体进行定量(补充图2和补充表2)。

    84230发布于 2019-08-07
  • 来自专栏Y大宽

    通过简单数据熟悉Linux下生物信息学各种操作2

    原地址 一共三部分 通过简单数据熟悉Linux下生物信息学各种操作1 通过简单数据熟悉Linux下生物信息学各种操作2 通过简单数据熟悉Linux下生物信息学各种操作3 ---- 11安装使用 安装编译并创建到bin目录的链接 cat src curl -OL http://downloads.sourceforge.net/project/bio-bwa/bwa-0.7.17.tar.bz2 tar jxvf bwa-0.7.17.tar.bz2 cd bwa-0.7.17/ make ln -s ~/src/bwa-0.7.17/bwa ~/bin 11.2 制作index 创建文件夹放 ebola-1999.fa.nsd ebola-1999.fa.sa 共有16个文件,这也是为什么刚才创建单独文件夹的原因 获取ebolas 基因组的前1行作为query序列 head -2 /lec4/*.fq . bash align.sh read1.fq read2.fq results.bam 载入IGV,看100-150bp区域的深度

    1.3K41发布于 2019-07-02
  • 来自专栏生信菜鸟团

    读《理解生物信息学

    生物信息学不只是画图那么简单,而《理解生物信息学》就是为那些想进一步理解生物信息学的好奇者准备的礼物。说起这个礼物,大约是在2017年的某个周末一个加班的下午,在一位同事工位上偶遇的。 可以是说这本书的内容是对我生物信息学背景知识的补充和扩展,特别是对一个半路出家的生物信息学工作者而言。 每一章的每个小节都有一个流程图以帮助读者记忆该小节所涵盖的主题 每一章都配有教科书级别的插图,助于我们理解相关的概念 每一章末都列了一些研究文献和专业著作的参考文献以帮助读者进一步扩展知识、发展技能 字符表和名词解释 《理解生物信息学 这不像《细胞分子生物学》那样讲的全是生物的知识,也不是《R语言数据科学》那样讲的全是编程的技巧,《理解生物信息学》是一本真正意义上的生信书籍。

    79221编辑于 2022-04-08
  • 来自专栏R语言交流中心

    R语言相识生物信息学

    1.NBDC(NationalBioscience Database Center) 链接:https://biosciencedbc.jp/en 简介:本网站主要收集了目前流行的生物信息学专业的数据库 2. Biostars 链接:https://www.biostars.org/ 介绍:生物信息学相关知识的讨论,问题的回答 网站截图: ? 3. Bioconductor 链接: http://www.bioconductor.org/ 介绍:本网站集中了大量的生物信息学相关的R包,并都附有相关的教程 网站链接: ? 4. OMMIC TOOLS 链接:https://omictools.com/transcriptomics-category 介绍:生物信息学分析以及相关的组学数据库平台集合。 网站截图: ?

    1.5K20发布于 2019-07-31
  • 来自专栏生信宝典

    43个生物信息学“事实”

    名称来历 GCG, the old bioinformatics package, was named after the authors kept high-fiving each other, shouting “good code guys!”. (GCG is a software package for the analyses of gene and protein sequences.) Bowtie is named so because “it is almost impossible t

    57010编辑于 2022-01-18
  • 来自专栏生物信息学

    所以你想做生物信息学

    所以你想做生物信息学? 作者:Mario F. 生物信息学的大部分工作是关于如何更聪明地工作,而不是单纯依赖更强大的硬件。 台式机?笔记本?云端? 以下是快速指南: 笔记本电脑 - 便携性强,适合日常开发。 操作系统对决:Linux VS macOS VS Windows 生物信息学中会用到很多命令行工具,其中一些工具的使用难度较高。 Windows – 不太理想,但如果你使用的是 Windows 10 或 11,WSL2(Windows Subsystem for Linux)是一个改变游戏规则的工具。 欢迎来到生物信息学的世界! 接下来:我们将讨论 Conda、Docker 和 Mamba,因为安装生物信息学工具不应该像打最终 Boss 那样困难。

    56510编辑于 2025-09-04
  • 来自专栏生信菜鸟团

    生物信息学必备工具—SAMtools

    广泛兼容性:与其他生物信息学工具和流程兼容。 易于集成:可以轻松集成到自动化的生物信息学分析流程中。 强大的数据过滤和查询功能:能够高效地过滤和查询特定的数据。 这些优势使Samtools成为生物信息学领域研究人员广泛使用的关键工具之一。 hisat2,STAR等等产生的】。 -1.18.tar.bz2 ##. 注意需要时绝对路径 make make install 未指定目录安装,非管理员用户会报错 5高频用法 samtools 有39个子命令,但是最常用的功能就是对bam文件排序后构建索引,然后进行后续的生物信息学分析

    3.8K10编辑于 2023-12-14
  • 来自专栏生物信息学

    如何成为顶级生物信息学

    相比与0级,这已经有很大的进步,并且是训练生物信息学者最好的途径之一。可以练习将已有的生物信息学技术来做出真正生物学发现的技巧,学习更多的生信技术和生物学知识,为未来进阶到2级和3级打下良好的基础。 此外,2级的研究要做的好,生物信息学者一般需要专注于自己特定的方向,从而能够较好地了解领域内相关的、新的计算方法和实验技术。 从2级进阶到3级很困难,兄弟我目前正在努力中。 X级(LevelX):玩科学、讲政治。简称:神级。在这个级别,生物信息学家要在巨型项目产生的海量数据的整合和模拟中发挥关键作用。 做这个级别工作的生物信息学家一般具有良好的1级和2级的研究记录,并且在团队研究中要具有非凡的领导才能。这些工作一般都发表在顶级的期刊,并且引用极好,在研究过程中要注意协调方方面面。 Shirley总结,对于生物信息学者来说,一般从1级的研究开始,学习基本的生信技术;等到计算和生物学知识掌握差不多之后,可以尝试想2级和3级进阶,并且有可能也参与X级的研究。

    1.2K10发布于 2020-04-14
  • 来自专栏深度学习

    生物信息学】基因富集分析enrichment

    networkx conda install statsmodels pip install pyHSICLasso 注:本人的实验环境按照上述顺序安装各种库,若想尝试一起安装(天知道会不会出问题) 2. pandas as pd from statsmodels.stats.multitest import fdrcorrection import matplotlib.pyplot as plt 2. 将n个p值按照从小到大排序,k为p值的顺序值,找到一个最大的k使得p*n/k <α ,认为1,2,...k个通路是显著富集的 # 最大的p值保持不变,对于排名n-1的,p_adj(n-1) = david.ncifcrf.gov/ ChatGPT DAVID(Database for Annotation, Visualization, and Integrated Discovery)是一个功能注释和生物信息学分析工具 它通过使用多种生物信息学数据库和资源,如Gene Ontology(GO)数据库、KEGG(Kyoto Encyclopedia of Genes and Genomes)通路数据库、PubMed文献数据库等

    57210编辑于 2024-07-30
  • 来自专栏BioIT爱好者

    顶级生物信息学 RSS 订阅源

    今天主要来给大家推荐一些常用的生物信息学的 RSS 订阅源,通过这些订阅源你可以及时掌握和了解到一些比较前沿的生物信息学研究资讯。 使用 inoreader 跟踪各种订阅源最新资讯 1. 更新频率 4 posts / week 2. BioInformatics LLC RSS Feed https://www.gene2drug.com/feed 网站 https://www.gene2drug.com/blog/ 简介 生物信息学和我们的 更新频率 2 posts / quarter 17. 进入我们的在线课程,开始您的生物信息学教育! 更新频率 1 post / week 19.

    2K20发布于 2021-10-15
  • 来自专栏深度学习

    生物信息学】层次聚类过程

    δ \delta δ B C D E A 1 3 2 )=3 δ \delta δ C D E AB 3 2 B C D E A 1 3 2 4 B 3 2 3 C 1 3 D 5 \delta BCDEA1324B323C13D5 \delta(CD,E)=\min(\delta(C,E),\delta (D,E))=3 \delta(CD,A)=\min(\delta(C,A),\delta(D,A))=2 \delta(CD,B)=\min(\delta(C,B),\delta(D,B))=2 δ \delta δ B CD E A 1 2 4 B 2

    36710编辑于 2024-07-30
  • 来自专栏生信技能树

    【资源分享】生物信息学编程实战

    市面上唯一适合生物信息学从业者的教学视频 直接复制链接 https://ke.qq.com/course/285055 到浏览器即可打开购买 永不打折,但是会下架,请抓紧机会购买! =GeneID2kegg Path2GeneID=kegg2GeneID diff_gene_has_path=intersect(diff_gene,names(GeneID2Path)) n=length =toTable(hgu95av2ENTREZID) probe2symbol=toTable(hgu95av2SYMBOL) probe2genename=toTable(hgu95av2GENENAME $probe_id),] tmp2 = probe2entrezID[match(my_probe,probe2entrezID$probe_id),] tmp3 = probe2genename[match probe_id),] probe2entrezID[match(my_probe,probe2entrezID$probe_id),] probe2genename[match(my_probe,probe2genename

    4.2K50发布于 2018-06-07
  • 来自专栏生信技能树

    生物信息学软件工具的大致分类

    云平台(有门槛,比如需要看视频教程) 生物信息学云平台提供了在线的计算和数据存储服务,使研究人员能够在云环境中进行生物信息学数据分析和处理,而无需购买和维护本地服务器。 、HISAT2)、ChIP-seq 工具等。 再比如MACS2(Model-based Analysis of ChIP-Seq 2),它是一款用于分析染色质免疫共沉淀测序(ChIP-seq)等表观ngs组学数据的生物信息学工具。 有一些工具和指南可以帮助进行平滑迁移,例如 2to3 工具,以及官方提供的迁移指南。 其实这个也应该是我们生物信息学软件的理想下载模式,目前借助于conda我们勉强能实现在服务器上面使用单一命令任意安装绝大部分生物信息学软件。

    1.2K30编辑于 2023-11-21
  • 来自专栏生信菜鸟团

    生物信息学常见文件格式

    . - id行:以“>”开头, 有时候会包含注释信息,如 chr1、chr2 … - 序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸 fastq:一种保存生物序列(通常为核酸序列)及其测序质量得分信息的

    43910编辑于 2024-07-10
  • 来自专栏小汪Waud

    生物信息学常见数据格式

    生物信息学里常见的数据格式主要有fasta,fastq,gff/gtf。 1 FASTA FASTA是一种基于文本用于表示核酸序列或蛋白质的氨基酸序列的格式。 2 FASTQ FASTQ是一种存储了生物序列以及相应的质量评价的文本格式,共有四行。 :369:C3JLPACXX:测序仪的唯一设备名称 8:lane的编号 1101:tail的坐标 1635:在tail中的X坐标 2086:在tail中的Y坐标 length=101:长度为101 第2行 phase: 仅对注释类型为“CDS”有效,表示起始编码的位置,有效值为0、1、2。从0开始,CDS的起始位置,除以3,余数就是这个值,表示到达下一个密码子需要跳过的碱基个数。 0表示这个region的第1bp就是正好是密码子的第1个碱基; 1表示这个region的第2bp就是正好是密码子的第1个碱基; 2表示这个region的第3bp就是正好是密码子的第1个碱基; attribute

    1.5K30编辑于 2023-02-03
  • 来自专栏DrugOne

    Python生物信息学③提取差异基因

    每一行是一个基因,每一列是一个样本,这也是比较经典的芯片数据集 #查看数据维度data.shape 标准化 常见的log2()标准化 data2 = np.log2(data+0.0001)data2. # 每个阵列的箱线图plt.show(data2.plot(kind = 'box', title = 'GSE5583 Boxplot', rot = 90)) ? # Densityplt.show(data2.plot(kind = 'density', title = 'GSE5583 Density')) ? #每个基因(行)wt样本的表达平均值wt = data2.loc[:, 'WT.GSM130365' : 'WT.GSM130367'].mean(axis = 1)wt.head() #每个基因(行) iloc[i,0:3], data2.iloc[i,3:6]) pvalue.append(ttest[1]) # Histogram of the p-valuesplt.hist(-np.log

    1.8K30发布于 2021-01-28
  • 来自专栏R语言小白

    生物信息学常见数据格式

    生信技能树学习笔记fasta一种基于文本用于表示核酸序列或多肽序列的格式,缩写为fa特征:两部分-id行:以“>”开头,有时候会包含注释信息-序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸fastq一种保存生物序列(通常为核酸序列)及其测序质量得分信息的文本格式通常有四行第一行 @开头,之后为序列的标识符以及描述信息第二行 为序列信息,如ATCG第三行 +开头,之后可以再次加上序列的标识符以及描述信息第四行 为碱基质量值,长度与第二行一一对应gff图片

    53950编辑于 2023-02-17
  • 来自专栏生物信息云

    生物信息学入门必须了解的名词

    生物信息学(bioinformatics):综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。 SwissProt:SwissProt数据库是经过注释的蛋白序列数据库,由欧洲生物信息学研究所(EBI)维护。每个条目包括蛋白质序列、引用文献、分类学信息和注释等。

    3.3K63发布于 2020-04-21
领券