搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

5回答

Lemmatization java

我正在寻找一个在Java的英语实现。我已经找到了一些，但我需要一些不需要太多内存就能运行的东西(最高1 GB )。谢谢。我不需要词干分析器。

浏览 0修改于2014-03-06得票数 24

1回答

Lucene lemmatization

你认为lemmatization可能会影响使用Lucene库的搜索吗？谢谢

浏览 1修改于2015-08-26得票数 2

2回答

Lemmatization .词干

我一直在阅读这两种技术来寻找单词的词根，但我们如何更喜欢其中一种而另一种呢？ “莱曼化”总是比“堵住”好吗？

浏览 0提问于2019-04-22得票数 7

回答已采纳

1回答

更快的Python Lemmatization

我一直在测试不同的柠檬化方法，因为它将用于一个非常大的语料库。下面是我的方法和结果。有谁有任何技巧来加速这些方法吗？空间是最快的，包括部分语音标记(首选)，其次是柠檬。我是不是走错路了？这些函数被应用于包含文本的数据模型上的熊猫.apply()。 lemmatizer = WordNetLemmatizer() if len(x)==0: tok

浏览 12提问于2022-06-21得票数 0

2回答

apache lucene的Lemmatization

我正在使用apache开发一个文本分析项目。我需要归纳一些文本(将单词转换成它们的规范形式)。我已经写了生成词干的代码。使用它，我能够转换以下句子我使用lucene是因为它有许多语言的分析器(我至少需要英语和俄语)。我知道库，但

浏览 27修改于2020-12-31得票数 10

回答已采纳

2回答

所有熊猫细胞的Lemmatization

我有一个熊猫数据帧。有一列，让我们把它命名为：'col‘这一列的每个条目都是一个单词列表。'word1‘、'word2’等。import nltk我希望能够为pandas数据集中某一列中所有单元格的所有单词找到一个引理。import pandas as pd data = [[['walked','am','stressed',

浏览 1修改于2018-09-07得票数 11

回答已采纳

1回答

Marklogic数据库是否支持Lemmatization？

我看到Marklogic数据库支持词干，但它支持词汇化吗？如果是，那么我们如何实现这个特性。

浏览 29提问于2021-10-19得票数 1

1回答

Python中的多语言Lemmatization

我有一个多种语言的数据集。我能根据它的语言使用柠檬化吗？我已经按照它的语言把数据分开了。尝试使用WordNet柠檬化，但它只支持英语

浏览 0提问于2018-12-12得票数 0

回答已采纳

2回答

如何在大熊猫数据栏中应用Lemmatization

如果我有以下数据：df = pd.DataFrame(data=d) col1 col21 swimming 4print(wordnet_lemmatizer.lemmatize('challenging',p

浏览 16提问于2022-02-11得票数 2

回答已采纳

1回答

如何进行阿拉伯文本的lemmatization

如何对阿拉伯原始文本执行词汇化？

浏览 3提问于2015-10-28得票数 0

1回答

为什么(或如何) Keras模型跳过词干或Lemmatization步骤？

这个这里的Keras文章/教程确实执行文本标准化，即从文本数据集中移除HTML元素、标点符号等，但是在向量化步骤之前明显缺乏任何词干或柠檬化。这是我的一个假设--它被省略了，因为神经网络模型能够处理更大的词汇量吗？我想不出还有什么其他原因(S)来解释为什么会这样。

浏览 0提问于2022-04-30得票数 0

1回答

Lemmatization不适用于大写字母开头的单词

我正在做一个使用StanfordNLP的项目。该项目的一个功能是从一段文本中提取所有名词，并对每个名词进行词汇化。我正在使用下面的代码提取名词 props.setProperty("annotators", "tokenize, ssplit, pos, lemma, parse, natlog, openie");

浏览 1提问于2018-06-15得票数 1

1回答