DNA测序也使用了编辑距离算法--在NER过程中，你会使用同样的算法来检测误剥现象。但是DNA测序开放源码通常被编程为只对少数几个用于表示DNA序列的字符进行操作。他们不操作正常的a-zA-Z0-9范围的ASCII字符.引文：https://groups.google.com/forum/#!category-topic/nvbio-users/how-do-i--/ITjD6KPlEsc

因此，正如Vihari所建议的--它最好使用一些编辑的距离，也是最好的方法。但是，我真的希望NLP爱好者在未来的时间里探索这样的DNA序列开放源码，并进化它们来利用这些DNA序列开放源的“大数据容量”来为NLP社区带来这一点。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34365621

复制

相似问题

问基于序列对齐算法的NER构建
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于序列对齐算法的NER构建EN