我的任务是用介词把句子的2-3部分连成一个整体。
为了解决这个问题,我已经尝试了一些选项,比如使用GPT-2 (或其他网络,如LSTM)和语法规则生成,但是它们都没有我想要的那么好。
使用GPT-2需要大量的资源和性能,这在服务器上非常昂贵。普通的神经网络是不够好的,经常产生不好的结果。而且也不可能仅仅用语法规则来描述所有的情况。
有什么方法可以不使用变形器或语法规则来实现这个问题的解决方案,这样模型就不会太重,同时有效吗?
介词可能有几种选择,最主要的是它们被使用。
附注:一个很好的选择是使用n-gram,但是当第二部分很长时,还不清楚如何处理它。
倒,果汁,锅炉房 ->把果汁倒进锅炉房
去吧,剧院 ->去剧院
学历史,芭蕾 ->学习芭蕾史
发布于 2021-04-05 23:27:42
解决这类问题的传统方法是一种n-g语言模型。语言模型是在一个大的语料库上训练的,因此对于任何不完整的句子,计算出最可能丢失的标记是相当简单的。SRILM是最常见的工具包之一,但可能还有许多其他库。
https://datascience.stackexchange.com/questions/92591
复制相似问题