首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ncbi C++异常(在函数GetSeqEntry()中)

ncbi C++异常(在函数GetSeqEntry()中)
EN

Stack Overflow用户
提问于 2018-03-05 13:32:13
回答 1查看 443关注 0票数 1

windows10上的NCBI

I在命令行中输入以下命令,并希望获得pssm:

代码语言:javascript
复制
psiblast -in_msa 1.sequence.txt -db nr -comp_based_stats 0 -out_ascii_pssm seqpssm.txt

但我得到了C++的例外:

代码语言:javascript
复制
Error: NCBI C++ Exception:
    T0 "..\..\..\..\..\..\src\objtools\readers\aln_reader.cpp", line 649: Error: ncbi::CAlnReader::GetSeqEntry() - CAlnReader::GetSeqEntry(): Seq_entry is not available until after Read() (m_Pos = 0)

1.sequence.txt:

代码语言:javascript
复制
>VACUOLARMORPHOGENESISPROTEINVAM7;SWP:P32912;PDB:1KMDA
KMSEKLRIKVDDVKINPKYVLYGVSTPNKRLYKRYSEFWKLKTRLERDVGS
TIPYDFPEKPGVLDRRWQRRYDDPEMIDERRIGLERFLNELYNDRFDSRWR
DTKIAQDFLQLSKPN

在第649行中搜索GetSeqEntry()

代码语言:javascript
复制
  642 CRef<CSeq_entry> CAlnReader::GetSeqEntry(const TFastaFlags fasta_flags)
  643 {
  644     if (m_Entry) {
  645         return m_Entry;
  646     } else if ( !m_ReadDone ) {
  647         NCBI_THROW2(CObjReaderParseException, eFormat,
  648                    "CAlnReader::GetSeqEntry(): "
  649                    "Seq_entry is not available until after Read()", 0);
  650     }
  651     m_Entry = new CSeq_entry();
  652 
  653     CRef<CSeq_align> seq_align = GetSeqAlign(fasta_flags);
  654     const CDense_seg& denseg = seq_align->GetSegs().GetDenseg();
  655     _ASSERT(denseg.GetIds().size() == m_Dim);
  656 
  657     CRef<CSeq_annot> seq_annot (new CSeq_annot);
  658     seq_annot->SetData().SetAlign().push_back(seq_align);
  659 
  660     m_Entry->SetSet().SetClass(CBioseq_set::eClass_pop_set);
  661     m_Entry->SetSet().SetAnnot().push_back(seq_annot);
  662 
  663     CBioseq_set::TSeq_set& seq_set = m_Entry->SetSet().SetSeq_set();
  664 
  665     typedef CDense_seg::TDim TNumrow;
  666     for (TNumrow row_i = 0; row_i < m_Dim; row_i++) {
  667         const string& seq_str     = m_SeqVec[row_i];
  668         const size_t& seq_str_len = seq_str.size();
  669 
  670         CRef<CSeq_entry> seq_entry (new CSeq_entry);
  671 
  672         // seq-id(s)
  673         CBioseq::TId& ids = seq_entry->SetSeq().SetId();
  674         ids.push_back(denseg.GetIds()[row_i]);
  675 /*
  676         CSeq_id::ParseFastaIds(ids, m_Ids[row_i], true);
  677         if (ids.empty()) {
  678             ids.push_back(CRef<CSeq_id>(new CSeq_id(CSeq_id::e_Local,
  679                                                     m_Ids[row_i])));
  680         }

我该如何解决这个问题?

EN

回答 1

Stack Overflow用户

发布于 2018-08-01 12:41:56

我对新版本的psiblast 2.8.0+也有同样的问题。

在你的序列(*,#或+)中,停止密码子的符号似乎破坏了你正确读取序列的能力。简单地用空隙(-)代替它们似乎可以修复它。

代码语言:javascript
复制
sed -i -r "s/[\*\+\#]/-/g" <alignment_file>
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49111632

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档