搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生物信息学、python、R、linux
Motif中的PWM矩阵
PWM矩阵是表示motif的一种方式，全称是position-specific weight matrix (PSWM) 或者是position-specific scoring matrix (PSSM 比如CTCF的motif序列为（来自于JASPAR数据库）： ? 要构建出PWM矩阵，首先要得到position frequency matrix (PFM)，即在每个位置的四种核苷酸出现的次数。 motif可以由meme等软件找到，也可以从JASPAR, CISBP, HOCOMOCO等数据库中下载得到，meme的官方网站(http://meme-suite.org/tools/meme)提供了一系列的处理软件和现有的 motif PWMs。得到motif PWM后，可以用Fimo或其他软件在基因组中扫描得到序列，其基本用法为： fimo [options] <motif file> <sequence file> 提供motif的PWM
3.1K30发布于 2020-04-01
来自专栏生信技能树
找个motif嘛，简单
我在生信菜鸟团发布的自学CHIP-seq分析第八讲就提到过如何寻找motif，motif是比较有特征的短序列，会多次出现的，一般认为它的生物学意义重大，做完CHIP-seq分析之后，一般都会寻找motif motif的英文定义如下： motif: recurring pattern. eg, sequence motif, structure motif or network motif DNA sequence motif: short, recurring patterns in DNA that are presumed to have a biological function. 从上边的定义可以看出，其实motif这个单词就是形容一种反复出现的模式，而序列motif往往是DNA上的反复出现的模式，并被假设拥有生物学功能。， 99 元一个月，不仅仅是找motif，更多详情请访问：古有杨志卖刀，今有jimmy售器其它资源还有一些R包可以，直接从BED文件里面记录的基因坐标来找motif，有的需要输入fasta序列，就需要自己根据
2.9K70发布于 2018-06-07
来自专栏生信菜鸟团
ChIP-Seq motif
Motif Motif 是一段典型的序列或者一个结构。一般来说，我们称之为基序。它是构成任何一种特征序列的基本结构。通俗来讲，motif 是有特征的短序列，一般认为它是拥有生物学功能的保守序列。研究 motif 的意义识别生物学功能： motif 是拥有生物学功能的保守序列，研究它们可以帮助我们识别和理解特定的生物学功能。例如，如果一个 motif 与转录因子的结合位点相关，那么研究这个 motif 可以帮助我们了解基因表达调控。理解进化关系： motif 作为保守序列，在不同物种中可能存在相似的结构。例如，如果一个 motif 与某种蛋白质的活性位点相关，那么针对这个 motif 设计的药物可能可以抑制该蛋白质的活性，从而治疗疾病。 motif 分析序列 motif 分析是 ChIP-Seq 中的常规分析，可以了解到 motif 分析就是找基因序列上的规律，那在 ChIP-Seq 分析中，我们是想知道 peaks 序列上的 motif
1.1K10编辑于 2025-03-04
来自专栏Y大宽
转录因子详细介绍(motif)
而“motif”这个词进行结合特异性的genetic（遗传学的）描述，通过汇总一系列sites的信息进行汇总得到。 1 我们使用术语”motif”或“pattern”在模型的意义上代表一个TF结合位点的特异性。 2 一个motif通常从一系列转录结合位点汇总产生 3 一个motif可以使用不同的形式描述 3.1 一致性string（consensus string） A：核苷酸序列（nucleotide alphabet ，那么可以对他们所有进行得分或只计算每个序列的第一个出现，这种情况下，每一个序列都被记录为匹配motif或不匹配。 Matrix-based pattern matching Regulatory motif:position-specific scoring matrix(PSSM) Binding motif of
6K42发布于 2018-09-10
来自专栏生信菜鸟团
HOMER - motif 挖掘和分析
已知motif筛查 (10) 加载motif库（Load Motif Library）功能：加载已知motif库（如JASPAR、HOMER内置库），用于筛查目标序列中的已知motif。 (11) 筛查每个motif（Screen Each Motif）功能：扫描目标序列中的已知motif实例，计算其富集显著性。统计方法：使用超几何分布或二项分布计算motif的富集p值。结果输出 (12) Motif文件（Motif Files）功能：输出motif文件（.motif），包含motif的概率矩阵和富集统计信息。已知motif筛查 (1) 加载motif库（Load Motif Library）功能：加载已知motif库（如JASPAR、HOMER内置库）。结果输出 (1) Motif文件（Motif Files）功能：输出motif文件（.motif），包含motif的概率矩阵和富集统计信息。
3.1K10编辑于 2025-03-11
来自专栏生信修炼手册
详解motif的PWM矩阵
通过一致性序列和sequence logo可以直观的表示某个motif的情况，但是在预测motif结合的位点时，只根据这些信息无法准确的判断查询序列上存在对应的motif。预测输入序列上是否存在特定motif的位点的分析，称之为motif scanning, 示意如下 ? 就是在输入序列上查找特定motif出现的位置。为了满足motif scanning分析的要求，对于motif而言，我们必须提供一个有效的能够代表motif又能够用于序列查找的一个信息，基于这样的出发点，提出了PWM矩阵的概念。根据PPM矩阵，可以计算某个motif序列的概率。根据上述PPM矩阵，GAGGTAAAC出现的概率为 ? 根据PWM矩阵，可以对序列进行打分，以最终的得分值来判断是否为一个潜在的motif。根据上述PWM矩阵，GAGGTAAAC出现的得分值为 ?
2.5K40发布于 2019-12-19
来自专栏生信技能树
scATAC-seq| motif 分析
进行分析对motif 简单的介绍：单细胞还能拉上转录因子？？？流程载入数据数据库 JASPAR2020 获取motif矩阵：getMatrixSet 添加motif矩阵：AddMotifs 计算motif活性分数:RunChromVAR 寻找显著差异的peaks 获取motif矩阵从数据库 JASPAR2020 获取motif矩阵：getMatrixSet # 从公共数据库中获取motif矩阵 # Get a list of motif position frequency , pfm = pfm ) # Building motif matrix # Finding motif positions # Creating Motif object # 得到motifs 计算motif活性分数:RunChromVAR # 计算 motif deviation score pbmc <- RunChromVAR( object = pbmc, genome =
2.5K10编辑于 2023-02-28
来自专栏生信小王子
motifStack | 绘制motif序列结构图
我们在日常分析中，有时会比较不同物种间motif序列结构的保守性。今天小编教大家使用R包“ motifStack ”绘制美观的motif序列结构图！ ? ## 安装R包 if (! 使用脚本前需要准备两个输入文件：输入文件一：motif序列（第一列为ID，第二列为序列，Tab分隔）。 ? 输入文件二：motif ID。 ? ## 输入motif序列, motif ID及输出文件位置 sh ./run.sh motif.seq motif.id out_path 执行完脚本后即可获得矩阵文件，绘制motif序列结构图。 ") ## 生成图形 plot(motif) ? 如果你想绘制多个motif的序列图，可以将所有的motif矩阵文件放入一个文件夹中。
3.9K10发布于 2020-08-10
来自专栏生信修炼手册
使用seqLogo可视化motif
seqLogo是一个bioconductor上的R包，专门用于DNA序列的motif可视化，网址如下 https://www.bioconductor.org/packages/release/bioc /html/seqLogo.html 因为功能的单一性，所以其用法也特别的简单，只需要输入motif对应的PPM矩阵就可以了，下面通过一个实际例子来看下 ? 上图为一个motif的PFM矩阵，只需要通过以下几个步骤就可以得到对应的sequence logo。 1. 读取PFM矩阵将PFM矩阵保存在一个文件pfm.txt中，内容如下 ?
1.3K20发布于 2019-12-19
来自专栏Y大宽
Motif和domain的区别
一个简单的motif可以是，例如，一个模式pattern，而这个模式被这个group中的所有成员共享。例如WTRXEKXXY（这里，X代表任何氨基酸）。当然也有更复杂的motif模型。 Motif有时和特定的功能联系一起。 ? moti.png ? protien motif.jpg ? 那，motif和domains之间有什么联系？当你考虑蛋白质家族的时候，不仅要看整个序列，还有关注单独结构域。因为，它们是一个基本的功能结构单位，因此找到单个结构域domain的序列motif是很有意义的。因此，你经常会发现一个蛋白质包含多个结构域，每个结构域都有一个与它所属的家族motif匹配的序列。 ? motif to domain.jpg ? domians and motif.jpg 最主要的区别是，domain是独立的稳定的，motif不是。
4.2K10发布于 2018-09-10
来自专栏生信修炼手册
详解motif的PFM矩阵
在之前的文章中，对motif的几个基本概念进行了简单介绍。一致性序列采用IUPAC碱基表示标准来描述motif的序列信息，sequence logo是结合碱基分布频率和一致性序列的一种直观展示形式。本文对motif的碱基分布频率进行详细介绍。 PFM全称为position frequency matrix, 用于代表motif的碱基分布频数，本身是一个很容易了解的概念，以下图所示的motif序列为例 ? 每行为一种碱基，每一列为motif的一个位置。在描述motif信息时，除了一致性序列和sequence logo外，PFM矩阵也是一个常见的元素。采用了TRANSFAC数据库中的文件标准，AC表示motif编号，ID表示motif的名称，PO以及下面的行为对应的碱基分布频数。 4. MEME MEME格式的PFM矩阵示意如下 ?
2.1K30发布于 2019-12-19
来自专栏生信修炼手册
使用ggseqlogo可视化motif
ggseqlogo是一个motif可视化的R包，可以看做是seqLogo的加强版。 ", "CCTATTGTTCTC", "TCCATTGTTCGT", "CCAATTGTTTTG" ) 第二种为motif的PFM矩阵，以下图为例 ? 对于序列格式的信息，绘图方式如下 ggseqlogo(motif_seq) 输出结果如下 ? 对于PFM矩阵，绘图方式如下 ggseqlogo(motif_pfm) 输出结果如下 ? 绘制多个sequence logo 当有多个motif信息时，支持一键绘制多个motif的sequence logo, 用法如下 motif_list <- list( "A"=motif_pfm, " B"=motif_pfm, "C"=motif_pfm, "D"=motif_pfm) ggseqlogo(motif_list,ncol = 2) 将多个motif信息存储在list中，直接操作这个list
1.9K20发布于 2019-12-19
来自专栏生物信息学、python、R、linux
Homer预测共表达基因的motif
Homer这个软件比较强大，主要做ChIP-Seq分析，除此之外，还可以做RNAseq以及microarray的分析，并且还可以计算共表达基因中的motif。原文：http://homer.ucsd.edu/homer/motif/rnaMotifs.html Analyzing Co-regulated Gene Lists for RNA motifs 主要用到homer中的findMotifs.pl命令： findMotifs.pl可以分析基因的启动子，并寻找相对于其他启动子而言富含目标基因启动子的motif。
2.9K10发布于 2020-08-20
来自专栏生信修炼手册
使用WebLogo可视化motif
WebLogo是一款经典的motif可视化软件，在很多的文章中都提到了使用该软件绘制motif的sequence logo。
2K20发布于 2019-12-19
来自专栏数据科学（冷冻工厂）
单细胞|Signac 进行 Motif 分析
引言本教程将指导您如何在Signac平台上进行DNA序列的基序(Motif)分析。 # Get a list of motif position frequency matrices from the JASPAR database pfm <- getMatrixSet( x = mouse_brain, genome = BSgenome.Mmusculus.UCSC.mm10, pfm = pfm ) 为了简化 Signac 平台上的基序分析工作，设计了一个名为 Motif AddMotifs() 函数的作用是创建一个 Motif 对象，并将其整合到的小鼠大脑数据集中，同时还会包含每个峰的碱基组成等其他信息。任何 Seurat 检测都可以通过 SetAssayData() 函数添加 Motif 对象。
37810编辑于 2024-12-30
来自专栏生信修炼手册
JASPAR:转录因子motif数据库
JASPAR CORE 该类别下都是从文献中收集的，有实验证据支持的真核生物转录因子motif信息，而且经过了人工核对，是一个非冗余的，高质量的转录因子motif数据库，所以也是整个数据库中的核心。每个motif编号以MA开头，示意如下 ? 2. Collection CNE 该数据集包含了233个调控人类非编码基因的转录因子motif信息，是根据Xie et al. Collection PBM 该类别下是运用体外技术分析了104个小鼠的转录因子后得到的motif信息，每个motif编号以PB开头，示意如下 ? 5. Collection SPLICE 该类别包含的是human剪切位点的motif序列，数据量很小，一共只有6个motif, 每个motif编号以SA开头，示意如下 ? 4， Binding sites 红色标识的是motif对应的具体的序列，示意如下 ? 该数据库提供了下载功能，主要是motif对应的PFM矩阵，示意如下 ?
2.7K21发布于 2020-05-08
来自专栏生信修炼手册
MEME:motif分析的综合性工具
Motif Discovery 这部分工具用于预测输入序列上的motif信息，支持DNA，RNA或者蛋白序列，对应的功能称之为de novo motif discovery,包含的工具列表如下 MEME Motif Scanning 这部分工具用于分析输入序列上可能的motif出现的位置，包含的工具列表如下 FIMO MAST MCAST GLAM2SCan 常见的应用场景是根据转录因子的motif Motif Comparison 这部分工具用于比较不同motif之间的相似性，包含了Tomtom这个工具。 motif既包含了一致性序列，也包含了PFM矩阵信息，借助这个工具，可以有效的判断两个motif之间的相似性。经典的应用场景是将分析到的de novo motif与已知的motif数据库进行分析比对，查找相似的motif, 输出结果示意如下 ?
5.3K20发布于 2019-12-19
来自专栏生信修炼手册
使用MEME挖掘序列中的de novo motif
对于de novo motif分析而言，我们只需要提供序列就可以了。由于peak的长度范围存在一定的波动，通常选取peak中心，即峰值两侧固定长度的序列用于下游的motif分析。同时为了提高运行效率，有时还会只挑选部分peak进行分析，比如按照p值或者富集倍数挑选最显著的1000个peak的序列来进行motif预测。准备好输入序列之后，就可以进行motif分析了。输出文件包含了两个部分的结果 1. motif 提供了motif的sequence logo， PFM, PWM矩阵等信息 ? 2. motif location 提供了motif在输入序列上的位置信息，示意如下 ? 和motif在输入序列上的位置两种信息，在输出多个motif时，在输入序列上sites越多的motif优先输出，所以通常情况下只需要参考前3个motif就可以了，该工具更适用于motif种类较少的场景，
1.7K10发布于 2019-12-19
来自专栏生信修炼手册
使用DREME挖掘序列中的de novo motif
DREME也是一款常用的de novo motif分析软件，它具有以下几个特点只支持核酸序列，即DNA和RNA序列的motif分析，不支持氨基酸序列 DREME需要两个序列集合，其中一个作为control 同时在输入的序列和其反向互补链上查找motif, 输出结果中RC Logo代表反向互补链上的motif。点击每个More可以查看每个motif的具体信息，示意如下 ? 给出了该motif和对应的碱基组合在两个序列集合中次数的个数统计和对应的p值等信息，需要注意的是，这里的个数统计不是简单的统计该字符在输入序列中出现的次数，而且在分析总的motif和对应的各种碱基组合的次数时是独立的操作，所以不是说每种碱基组合的次数叠加就是总的motif的次数。 DREME对应的命令行版本的基本用法如下 dreme -oc out_dir -png -p input.fa DREME适用于发现长度在3-8bp之间的motif, 而MEME的motif长度可以通过参数调整
1.3K10发布于 2019-12-19
来自专栏生信修炼手册
关于motif你需要知道的事
在chip_seq数据分析中，motif分析是一项重要的分析内容。通过motif分析，我们可以对转录因子结合位点的序列模式有进一步的了解，那么什么是motif呢？为了更好的描述结合位点序列的模式，科学家们提出了motif的概念。 motif表示特定碱基序列的模式，这种教科书式的名词解释不够直观难以理解，下面通过一个示例来看下 ? 上图表示的是一个转录因子在多个基因上的结合位点的序列，在采用motif描述上面这段信息时，具体用到以下几个元素 1. 在原始公式的基础上减去了一个e值，在e值的计算公式中，对于DNA序列，s的值为4，n代表的是motif的长度，上述示例中就是12。减去e值后，最大值相比2自然会小一点。有很多的软件可以进行motif分析，比如meme-chip, homer等，在后续的文章中会详细介绍。 ·end· —如果喜欢，快分享给你的朋友们吧— 扫描关注微信号，更多精彩内容等着你！
5.2K42发布于 2019-12-19

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Motif中的PWM矩阵

找个motif嘛，简单

ChIP-Seq motif

转录因子详细介绍(motif)

HOMER - motif 挖掘和分析

详解motif的PWM矩阵

scATAC-seq| motif 分析

motifStack | 绘制motif序列结构图

使用seqLogo可视化motif

Motif和domain的区别

详解motif的PFM矩阵

使用ggseqlogo可视化motif

Homer预测共表达基因的motif

使用WebLogo可视化motif

单细胞|Signac 进行 Motif 分析

JASPAR:转录因子motif数据库

MEME:motif分析的综合性工具

使用MEME挖掘序列中的de novo motif

使用DREME挖掘序列中的de novo motif

关于motif你需要知道的事

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐