我是NLP的新手;我在寻找一些可以将一些“单词”,如"add up","sign up","log in“等简化为其主要部分"add","sign”和"log“的东西。
我尝试了词根化和词干提取,但它们都没有给我带来我想要的结果。
感谢您的帮助:)
发布于 2017-07-11 20:36:32
您尝试的一件事是使用词性标记器来获取每个单词的词性类别。然后,您可以在词性序列中查找模式,如“动词,介词”,以找到要查找的组合,然后删除介词。
https://stackoverflow.com/questions/45015428
复制相似问题