文章/答案/技术大牛

发布

社区首页 >问答首页 >查找区域中的RNA和信息

问查找区域中的RNA和信息
EN

Stack Overflow用户

提问于 2012-09-04 20:06:52

回答 2查看 76关注 0票数 0

我想要找到大约10KB序列的新颖和已知的RNA和转录本。如果序列在ensembl和UCSC浏览器中没有很好的注释，那么使用生物信息学工具最简单的方法是什么？拼接EST和RNA测序数据是一种选择吗？我刚接触生物信息学，你的建议对我很有用。

提前感谢

bioinformatics

sequencing

回答 2

Stack Overflow用户

发布于 2012-10-09 13:01:25

我有点不清楚你想要的最终产品或输出到底是什么样子的。但我可能建议做多个序列比对，并寻找那些得分较高的序列。如果这个10KB的序列有一些已知的序列，但它们不会完全匹配，所以我认为你需要一个能给你比对分数的程序，而不仅仅是简单的匹配。我将Perl与Clustal结合使用来进行比对。基本上，您需要根据这些文件格式的各自约定，制作同时具有10KB序列和已知感兴趣序列的.fasta或.aln文件。如果你不是很精通编程，你可以使用clustal的GUI版本。如果您想使用Perl，这里有一个我编写的用于对齐整个.fasta文件目录的脚本。它可以一下子执行许多对齐。注意:您必须编辑最后一行(系统调用)中的clustal可执行文件路径，以匹配其在计算机上的位置，此脚本才能正常运行。

#!/usr/bin/perl 


use warnings;

print "Please type the list file name of protein fasta files to align (end the directory    path with a / or this will fail!): ";
$directory = <STDIN>;
chomp $directory;

opendir (DIR,$directory) or die $!;

my @file = readdir DIR;
closedir DIR;

my $add="_align.fasta";

foreach $file (@file) {
 my $infile = "$directory$file";
 (my $fileprefix = $infile) =~ s/\.[^.]+$//;
 my $outfile="$fileprefix$add";
 system "/Users/Wes/Desktop/eggNOG_files/clustalw-2.1-macosx/clustalw2 -INFILE=$infile -OUTFILE=$outfile -OUTPUT=FASTA";
}

票数 1

Stack Overflow用户

发布于 2013-01-09 19:21:00

您是否有linux服务器或计算机，或者您是否依赖于基于web和windows的程序？

最初，我写了很长的回复，解释如何在Linux中做到这一点，但我刚刚意识到，对于初学者来说，Galaxy可能是一个更容易的解决方案。Galaxy是一个在线生物信息学工具，具有非常友好的用户界面；它是专门为初学者设计的。您可以在以下网站注册并登录：https://main.g2.bx.psu.edu/

关于查看输出，我不确定Windows上的自定义参考序列有哪些可用，您可能需要做一些研究。对于Linux/Mac，我建议使用IGV。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/12263141

复制

相似问题

问查找区域中的RNA和信息
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问查找区域中的RNA和信息EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问查找区域中的RNA和信息
EN