首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >查找区域中的RNA和信息

查找区域中的RNA和信息
EN

Stack Overflow用户
提问于 2012-09-04 20:06:52
回答 2查看 76关注 0票数 0

我想要找到大约10KB序列的新颖和已知的RNA和转录本。如果序列在ensembl和UCSC浏览器中没有很好的注释,那么使用生物信息学工具最简单的方法是什么?拼接EST和RNA测序数据是一种选择吗?我刚接触生物信息学,你的建议对我很有用。

提前感谢

EN

回答 2

Stack Overflow用户

发布于 2012-10-09 13:01:25

我有点不清楚你想要的最终产品或输出到底是什么样子的。但我可能建议做多个序列比对,并寻找那些得分较高的序列。如果这个10KB的序列有一些已知的序列,但它们不会完全匹配,所以我认为你需要一个能给你比对分数的程序,而不仅仅是简单的匹配。我将Perl与Clustal结合使用来进行比对。基本上,您需要根据这些文件格式的各自约定,制作同时具有10KB序列和已知感兴趣序列的.fasta或.aln文件。如果你不是很精通编程,你可以使用clustal的GUI版本。如果您想使用Perl,这里有一个我编写的用于对齐整个.fasta文件目录的脚本。它可以一下子执行许多对齐。注意:您必须编辑最后一行(系统调用)中的clustal可执行文件路径,以匹配其在计算机上的位置,此脚本才能正常运行。

代码语言:javascript
复制
#!/usr/bin/perl 


use warnings;

print "Please type the list file name of protein fasta files to align (end the directory    path with a / or this will fail!): ";
$directory = <STDIN>;
chomp $directory;

opendir (DIR,$directory) or die $!;

my @file = readdir DIR;
closedir DIR;

my $add="_align.fasta";

foreach $file (@file) {
 my $infile = "$directory$file";
 (my $fileprefix = $infile) =~ s/\.[^.]+$//;
 my $outfile="$fileprefix$add";
 system "/Users/Wes/Desktop/eggNOG_files/clustalw-2.1-macosx/clustalw2 -INFILE=$infile -OUTFILE=$outfile -OUTPUT=FASTA";
}
票数 1
EN

Stack Overflow用户

发布于 2013-01-09 19:21:00

您是否有linux服务器或计算机,或者您是否依赖于基于web和windows的程序?

最初,我写了很长的回复,解释如何在Linux中做到这一点,但我刚刚意识到,对于初学者来说,Galaxy可能是一个更容易的解决方案。Galaxy是一个在线生物信息学工具,具有非常友好的用户界面;它是专门为初学者设计的。您可以在以下网站注册并登录:https://main.g2.bx.psu.edu/

关于查看输出,我不确定Windows上的自定义参考序列有哪些可用,您可能需要做一些研究。对于Linux/Mac,我建议使用IGV。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12263141

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档