首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 星球——入门DAY7:测序

    今天的笔记是自己记的Goodnotes,字比较丑请见谅…………关于测序的入门,零基础的非常推荐【陈巍学基因】视频1,讲的很清晰,可以对二代测序有一个最基本的了解。 分析软件可以选择fastqc,linux中可以直接用wget安装`unzip fastqc_v0.11.7.zip`-->`cd FastQC`-- >`chmod755 fastqc`chmod 用3个数字来表达对

    21210编辑于 2024-01-24
  • 来自专栏

    星球-自学小组 DAY7 测序基本知识

    sanger法一代测序基本原理Sanger法是基于DNA合成反应的测序技术,又称为SBS法、末端终止法。1975年由Sanger提出,并于1977发表第一个完整的生物体基因组序列。 核心原理:由于双脱氧核苷酸(ddNTP)的3’位置脱氧,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP Illumina二代测序的基本原理基本原理:将dNTP的3'-OH以叠氮集团RTG(Reversible Terminating Group,可逆末端基团)进行修饰;将4种碱基分别与不同的荧光分子连接; 经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有单个DNA模板的很多份拷贝,进行这一过程的目的在于实现将碱基信号强度放大,以达到测序所需的信号要求。图片

    61850编辑于 2023-07-02
  • 来自专栏我的生信入门

    入门day7—测序入门

    测序原理测序是测生物体的遗传信息一代测序:sanger发明的70年代的双脱氧终止反应法原理如下:DNA的基本组成单位是单脱氧核苷酸(dNTP),dNTP5点位和3点位各有一个羟基。 sanger合成了3点位没有羟基的核苷酸(ddNTP),由于无法与下一个dntp形成磷酸二酯键,终止了DNA的聚合反应。 二代测序:illuma公司的合成测序方法为主流原理如下:桥式PCR扩增--DNA链进入flow cell(流动池)配对互补后,加入DNTP和聚合酶合成、加入NAOH碱溶液解开,加入中性溶液又折叠再次互补 测序过程加入4种红黄蓝绿不同荧光标记的dNTP进行互补配对,通过荧光判断碱基是哪一种二次测序读取Index(最开始文库里人工加的DNA接头),可以确认DNA片段来自哪个样本

    37010编辑于 2023-10-16
  • 来自专栏生信入门

    星球Day7 测序知识

    今日学习内容:测序原理第一、二、三代测序的优缺点了解组学的分类---图片---资料来源:测序的世界小白第6天-初涉测序小白第8天 名词结构化测序技术原理及常用数据格式简介DNA 测序技术的发展: 第三代测序测序发展史:150年的风雨历程---感悟:今天学习到了测序的原理和发展,对于之前不了解的概念和困惑有了答案。 7日的学习旅程即将抵达结束的终点,这段时间的所学所获像是推了一把在生门前徘徊的我,从对一切睁眼瞎变成对前方道路有了指示牌,更有动力继续学习和摸索下去。感谢星球的豆豆和花花~

    27030编辑于 2023-07-24
  • Day7-i 星球学习--测序知识

    Day7-i 星球学习--测序相关知识双脱氧核苷酸 ddNTP一代测序(Sanger测序)准确性高,通量低,成本高二代测序读长短,拼接困难,PCR技术增加了测序的错误率1.Roche公司的454技术平台 :罗氏454公司的GS FLX sequencer第二代测序技术中第一个商业化运营的测序平台2.illumina公司的Solexa/Hiseq技术平台:Illumina solexa genome analyzer3 (WGS)(2)全外显子组测序(WES)(3)简化基因组测序(RRGS)作用:(1)基因组作图(遗传图谱、物理图谱、转录本图谱)(2)核苷酸序列分析(3)基因定位(4)基因功能分析其它:(1)以全基因组测序为目标的结构基因组学 (2)得到转录本上基因的相关信息,如基因结构功能等(3)发现新的基因(4)基因结构优化(5)发现可变剪切(6)发现基因融合(7)基因表达差异分析蛋白质组学(1)蛋白质组数据处理、蛋白及其修饰鉴定(2)构建蛋白质数据库 、相关软件的开发和应用(3)蛋白质结构功能预测(4)蛋白质连锁图代谢组学(1)代谢物指纹分析(2)代谢轮廓分析

    29900编辑于 2024-02-25
  • 来自专栏生信情报站

    软件 | FastQC(质量控制,查看测序质量)

    软件 | FastQC 介绍 高通量测序数据的高级质控工具 输入FastQ,SAM,BAM文件,输出对测序数据评估的网页报告 安装 conda install fastqc 这里需要安装Conda 这是 read length = 100 的scRNAseq数据,横轴为read位置,纵轴是quality。 quality = -10*log10§,p为测错的概率。 横轴为位置,纵轴为百分比 正常测序数据为频率相近的四种碱基,无位置差异。表现在图上的话,四条线应该是平行且接近。 N 代表测序仪不能识别的碱基,横轴代表read位置,纵轴代表占比 如果正常测序,红线应该是趋近与0的直线 当任意位置N占比大于5%,报警告;大于20%,报错 Sequence Length Distribution 横坐标为重复(duplication)的次数,纵坐标为reads的数目,以unique reads的总数作为100% 比如,当unique reads数大约为10%时,有两个重复;正常测序开始较高,后续趋近

    2.6K30发布于 2021-01-13
  • 来自专栏Chris生命科学小站五年归档

    干货~测序文件还是应该质控的

    质控 算是补充前面的课程,下别人的数据质控还是要做的~ Talk Less,Show Dry-Goods 安装 你需要准备的软件Fastqc与cutadapter安装方法:加入星球的或者购买镜像的conda 3~4个月第二章讲述一部国自然申请书的诞生记Chris生命科学小站网易云课堂第一学期,配合Chris初级教程与Chris课题与文章辅导完成直播课程。 第二学期,看看大家的投票来决定讲什么吧~ 来说说优惠 1、已经加入Chris初级教程和Chris课题与文章辅导的成员,参加直播的我会在直播前统计发放课程Chris生命科学小站网易云课堂优惠券。 2、已经加入Chris初级教程,想加入Chris课题与文章辅导的成员补差价就可以而Chris课题与文章辅导的成员赠送Chris初级教程3、经已加入的成员邀请加入Chris初级教程/Chris 重要的是,站长决定为了庆祝Chris生命科学小站成功入驻网易云课堂,发放优惠券了面值59元,也就是说你只需要花99元即可购买价值158元的Chris初级教程还等什么,赶紧领券加入学习吧!

    41120编辑于 2023-03-02
  • 来自专栏生信情报站

    软件 | STAR(测序序列与参考序列比对)

    安装 二、使用 1、建立索引 2、STAR 比对 三、原理 聚类、拼接和评分 零、介绍 STAR (Spliced Transcripts Alignment to a Reference),用于将测序

    6.6K21发布于 2021-07-19
  • 来自专栏生信入门

    星球Day3 数据结构

    什么是数据框?如何使用?中途有事离开,怎么保存数据并且下一次重新加载?问题:如果save(X,file="test.RData")报错的话,怎么办? 用c()来创建,如c(1,2,3)。赋值和修改赋值<-是给变量下定义,指明这是个啥东西;修改就是再一次赋值,多次赋值以最后一次为准。 (a %in% b)] #根据FALSE取关于%in%的更多用法:https://blog.csdn.net/dege857/article/details/123344362数据数据框(Data 赋值:从文件中读取read.table() #从文件中读取数据,sep表示文件中的分隔符,header表示第一行是否为标题行read.csv() #读取文件,默认sep为",",header为TX #第x行,注意逗号前为行,逗号后或无逗号为列X[,y] #第y列,等同于X[y] X[a:b] #第a列到第b列X[c(a,b)] #第a列和第b列X$列名 #也可以提取列,但只能提取一列导出数据

    41610编辑于 2023-07-20
  • 来自专栏jerry的学习笔记

    星球学习小组Day7-测序知识 Jerry

    Sanger测序 图片 有了早期的第一次测序成功,才有了后来1983年的Kary Mullis 发明PCR测序仪,利用PCR才有了我们更加效率的NGS(二代测序)。进步的是方法,不变的是基本理念。 图文来自简书刘小泽 测序的世界 2. 有哪些类型的测序 a. 第一代测序 桑格尔-双脱氧链终止法是最为经典的一代测序技术,至今仍是测序行业的金标准。人类基因组计划(HGP)主要基于第一代测序技术。 但成本高、通量低的传统测序技术不能满足深度测序和重复测序等大规模基因组测序的要求。 图片 b. 第二代测序 第二代DNA测序技术(next generation sequencing,NGS )-循环阵列合成测序法。 图片 二代测序大幅度提高了测序速度,降低了测序成本,保持了高准确性。 图片 图片 图文来自微公众号星球 图片 图文来自微公众号美格科服 测序技术原理及常用数据格式简介

    41330编辑于 2023-08-13
  • 来自专栏生信学习小组

    学习day3

    anaconda是总管,职务比conda低,但干的活不少,也是个有内涵的家伙miniconda是区域经理,说白了就是干事的,而且比较专一,主要负责领域二、如何下载软件1.创建biosoft(mkdir biosoft(cd biosoft)2.从某链接下载软件:wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- latest-Linux-x86_64.sh星球:sh是脚本(就是一个程序,后台的代码)文件的后缀,也就是说其实这是一个下载的脚本。 然后出现这个界面:3.下载完成后,运行 :bash Miniconda3-latest-Linux-x86_64.sh,然后开始安装过程4.激活:source ~/.bashrc(注意空格)星球:激活不成功就将 add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/conda config --set show_channel_urls yes星球三

    35310编辑于 2024-01-18
  • 来自专栏生信课程note+实验知识

    课程note-3

    class3数据框、矩阵和列表向量-一维:表格—二维 :matrix 矩阵-二维,只允许一种数据类型;data.frame数据框-二维,每列只允许一种数据类型。 #重点:数据框#1.数据框来源# (1)用代码新建# (2)由已有数据转换或处理得到# (3)读取表格文件 (对数据框操作)# (4)R语言内置数据 (可以直接使用的的数据框)heatmap(volcano ),each = 2), score = c(5,3,-2,-4))df1从文件中读取df2 <- read.csv("gene.csv")df2#3.数据框属性#维度 = 3)colnames(m) <- c("a","b","c") #加列名矩阵取子集不支持$,数据框支持。 (a))a# 4.探索列表取子集l[2]和l[[2]]的区别(提示:数据结构)class(l[2])class(l[[2]])图片引自生技能树

    1.8K40编辑于 2023-02-09
  • 来自专栏笔记生信

    提升day3

    查看服务器 uname -a1.好的,是你64-bit(x86_64)2.3.下载成功未安装,需要运行这句代码(问啥回答啥)bash Miniconda3-latest-Linux-x86_64.sh conda config --set show_channel_urls yes使用conda查看当前服务器上安装的所有软件列表 conda list安装软件 conda install fastqc -y 3尝试不加 fastqc -y(先不试)选修conda 环境 分身就是不同的“conda environment”为了满足不同项目需要的相同软件的不同版本1.查看conda有哪些环境(带*已激活)2.创建也成功了3. 成功成功,芜湖~4.退出当前环境conda deactivate 代码引用星球,说明部分引用星球心得,感觉今天比昨天简单,嘻嘻~

    23800编辑于 2023-11-15
  • 来自专栏用户10800790的专栏

    星球 day 3 —— 橙子🍊

    安装一切顺利,愉快学习的一天,感谢星球,感恩豆豆花花,继续磕cp安装操作记录1. 查看linux服务器位数uname -a选择对应的64位,.sh是脚本文件后缀;注:64-bit(x86_64)、32-bit(x86)3. 选择相应的miniconda,右键复制链接网址图片4. 新建环境conda create -n rna-seq python=3 fastqc trimmomatic -yconda info --envs比如要处理转录组数据,先建立一个名叫rnaseq的conda 环境,然后指定python版本是3,安装软件fastqc、trimmomatic;安装完确认一下。 3. 激活新环境conda activate rna-seq相当于进入该环境,类似于cd 目录conda deactivate退出当前环境

    35570编辑于 2023-10-23
  • 来自专栏图形化开放式生信分析系统开发

    图形化开放式分析系统开发 - 9 Illumina测序测序数据自动拆分

    为了实现完整的自动化,本文讲述如何与Illumina测序仪衔接,实现下机数据自动拆分(测试过的机型MiSeq,NextSeq500)。 、如何识别下机数据目录 Illumina测序仪下机数据文件夹命名: YYMMDD_machinename_XXXX_FCXXXX YYMMDD 为上机日期 machinename为该测序仪唯一命名编号 目录结构为: [Sample Project]/[Sample ID]/[Sample Name]S*_R1_*.fastq.gz 记住此目录结构,为了拆分数据得到的数据与后续pipeline连接做全自动分析 四、与系统交互从样本信息中生成SampleSheet.csv 如果要用程序生成SampleSheet文件,这里就会用到图形化开放式分析系统开发 - 2 样本信息处理文章里样本信息的字段信息。 ? 上机编号即对应于Illumina测序仪下机数据目录,前两个字段 五、与分析流程对接,实现拆分数据数据分析联动 需要完成的工作: 请求系统根据样本信息生成SampleSheet,并下载到本地下机数据目录

    3.1K01发布于 2020-01-17
  • 来自专栏生信情报站

    软件 | bowtie2(测序序列与参考序列比对)

    传统安装 三、使用 1、参考基因组比对 必需参数 可选参数(常用) 2、构建索引 官方索引 自建索引 3、一个完整例子 一、介绍 Bowtie2 是将测序后的 reads 与长参考组的比对工具 ( 可以处理非常长的 Reads(即10~100kb),但它针对近期测序仪产生的 Reads 长度和误差模式进行了优化,如Illumina HiSeq 2000,Roche 454和Ion Torrent仪器 -U 逗号分隔的包含未配对读取的文件列表要对齐,例如lane1.fq,lane2.fq,lane3.fq,lane4.fq。读数可能是不同长度的混合。 如果-指定,bowtie2则从“标准输入”或“标准输入”文件句柄中读取数据。 -S 将SAM对齐文件写入。默认情况下,对齐被写入“标准输出”或“标准输出”文件句柄(即控制台)。 ,所以将待比对文件 example_1.fq example_2.fa 分别输入,以 example.sam 的文件输出 如果为单末端测序的话,上述命令换为: bowtie2 -p 6 -3 5 -

    12.8K31发布于 2021-01-13
  • 来自专栏生信学习小组

    学习小组Day7笔记--测序知识

    思维导图七天居然坚持下来了,感谢小洁老师,看测序的发展史,从第一代测序到第二测序,再到现在的第三代测序,感觉发现这些的人非常聪明,感觉人类跨时代发现的伟大,让我对生真正燃起了兴趣,也感谢这个课程让我学会了 markerdown格式的文章编辑,好像搞最高层级感觉还是数学和物理,觉得挺难的,但人总是应该尝试一些新的东西!!!! 希望学习班结束我能够坚持的学习!

    20710编辑于 2024-01-22
  • 来自专栏生信星球学习小组每日作业

    星球学习小组-Day7学习笔记--测序知识

    1990年代中后期开发了几种新的DNA测序方法,并于 2000年在商业DNA测序仪中实施。这些方法统称为“下一代”或“第二代”测序 (NGS) 方法,以便将它们与包括桑格测序在内的早期方法区分开来。 与第一代测序相比,NGS 技术的典型特征是高度可扩展,允许一次对整个基因组进行测序。图片本文内容源自生小白第6天-初涉测序小白第8天 名词结构化测序技术原理及常用数据格式简介测序的世界

    34600编辑于 2023-02-12
  • 星球——入门DAY3:Linux环境下安装软件

    因为我用的是自己的MacBook的terminal,第一个指令wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- 下成Linux版了,死活安装不了……最后发现应该选mac版:wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- 总之就是为了加快速度…………接下来正式使用conda:conda install fastqc -y(-y)很关键最后加一个conda环境:conda create -n rna-seq python=3 fastqc trimmomatic -y搞一个python版本是3的conda环境来安装fastqc、trimmomatic。

    40510编辑于 2024-01-19
  • 来自专栏百味科研芝士

    单细胞测序结合分析发优质的5分+文章

    三、结果解读 1.LSCC组织的单细胞测序 两例中高分化LSCC样本来自两名未经临床治疗的男性患者(66岁和64岁),从右声带切除2cm3的肿瘤组织,一半进行scRNA-seq,一半处理为FFPE切片进行免疫组化 样本2使用Singleron GEXSCOPE微流控芯片进行测序,鉴定出3,712个细胞。 2.鉴定LSCC组织的细胞组成 使用Seurat包分析测序数据:预处理过滤基因数量少于200的细胞,选择前2500个高度可变的基因进行PCA主成分分析和t-SNE算法进行数据降维,评估前50个主成分进行两阶段的聚类 此外,在测序数据中几乎没有观察p16INK4a(CDKN2A)的表达(图3A),与IHC结果一致。 对于肿瘤细胞簇的标志基因,使用TCGA数据库的头颈部鳞状细胞癌(HNSCC)样本进行了生存分析。通过分析配受体对列表,作者还探究了正常,肿瘤及免疫细胞之间的相互作用。

    4.2K51发布于 2020-10-09
领券