首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >怎样才能让“老师”和“老师”得到相似的对待?

怎样才能让“老师”和“老师”得到相似的对待?
EN

Data Science用户
提问于 2017-06-28 17:12:51
回答 2查看 204关注 0票数 2
代码语言:javascript
复制
Who teaches English?

现在,在标记之后,堵塞..。它给了我

代码语言:javascript
复制
Who, teach, English

在我的单词列表中,我有一个词叫做

代码语言:javascript
复制
teacher

因材施教,因材施教,因材施教。

甚至,计算edit_distance也解决不了这个问题。就像,edit_distance最终是2岁。

现在,我该怎么做才能让老师和老师相提并论呢?类似地,可能还有其他的例子,在结尾还有额外的“S”。有什么能解决这个问题的根源吗?有什么解决办法吗?

其他类似的例子可以是:指导员和指导者。

EN

回答 2

Data Science用户

回答已采纳

发布于 2017-07-03 23:21:57

用一种好斗的阻击器。兰开斯特史泰默是最具侵略性和最受欢迎的词干器。

下面是Python代码:

代码语言:javascript
复制
from nltk.stem.lancaster import LancasterStemmer

lancaster_stemmer = LancasterStemmer()
assert 'teach' == lancaster_stemmer.stem('teacher') == lancaster_stemmer.stem('teaches')
票数 2
EN

Data Science用户

发布于 2017-06-28 17:26:22

看看快件。Fasttext的工作原理类似于word2vec,因为您可以创建单词嵌入,然而,它实际上分析字符n-gram,以强制语法与您所想的相似。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/20036

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档