首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NLP:找到连接句子各部分的最佳介词

NLP:找到连接句子各部分的最佳介词
EN

Data Science用户
提问于 2021-04-05 17:07:57
回答 1查看 139关注 0票数 2

我的任务是用介词把句子的2-3部分连成一个整体。

  • 第一部分是某种行动。例如。“拍照”
  • 第二部分是一个宾语,它只能由一个名词或一个名词组成,而形容词和加法则依赖于它。例如。“多汁樱桃派”,“松鼠”
  • 第三部分是场所。例如。“房间”,“伦敦”

为了解决这个问题,我已经尝试了一些选项,比如使用GPT-2 (或其他网络,如LSTM)和语法规则生成,但是它们都没有我想要的那么好。

使用GPT-2需要大量的资源和性能,这在服务器上非常昂贵。普通的神经网络是不够好的,经常产生不好的结果。而且也不可能仅仅用语法规则来描述所有的情况。

有什么方法可以不使用变形器或语法规则来实现这个问题的解决方案,这样模型就不会太重,同时有效吗?

介词可能有几种选择,最主要的是它们被使用。

附注:一个很好的选择是使用n-gram,但是当第二部分很长时,还不清楚如何处理它。

示例:

倒,果汁,锅炉房 ->把果汁倒进锅炉房

去吧,剧院 ->去剧院

学历史,芭蕾 ->学习芭蕾史

EN

回答 1

Data Science用户

发布于 2021-04-05 23:27:42

解决这类问题的传统方法是一种n-g语言模型。语言模型是在一个大的语料库上训练的,因此对于任何不完整的句子,计算出最可能丢失的标记是相当简单的。SRILM是最常见的工具包之一,但可能还有许多其他库。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/92591

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档