搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

如何平滑unigram

我有一个单字语言模型，我想要平滑计数。添加一个平滑是唯一的方法，或者我也可以使用一些其他的平滑。我不认为我们可以使用knesser nay，因为这是针对Ngrams和N>=2的。还有其他的平滑方法吗？

浏览 2修改于2011-10-08得票数 1

回答已采纳

2回答

Nltk Sklearn Unigram + Bigram

classifier = SklearnClassifier(LinearSVC(), int,True)例如，当我只使用unigram和构建功能集时"Ronaldo") : True }feature_names.sort()TypeError: unorderable types: tuple() < str() 如何使用unigram

浏览 1修改于2015-08-31得票数 1

2回答

使用python的unigram

我正在尝试从一个文本文件生成unigram。但只显示给定文件第一行的二元语法。我想为文件中的所有句子显示unigram。

浏览 0修改于2011-11-29得票数 0

回答已采纳

2回答

NLTK包估计(unigram)困惑

token] += 1我已经为我拥有的数据执行了潜在的Dirichlet分配，并且我已经生成了unigram我的unigram和它们的概率如下：Andreas 7.11290670484e-07yellow 1.26582575863e-05

浏览 5修改于2015-10-23得票数 10

回答已采纳

4回答

用python打印Unigram计数

我有一个名为corpus.txt的文本文件，它包含以下4行文本 a peck of pickled peppers peter piper picked where s the peck of pickled peppers peter piper picked 4 peter等。f = open("c

浏览 1修改于2019-02-11得票数 1

回答已采纳

2回答

R写入函数以获取数据帧中的unigram

"This is a really nice and sunny day") get_unigrams <- function(text) { unigram<- ngram(text, n = 1) %>% get.ngrams() %>% length() }我找到了一个(临时)解决方案：

浏览 0修改于2021-12-02得票数 1

1回答

Unigram记号器:它是如何工作的？

我一直在试图了解unigram令牌程序是如何工作的，因为它是在我计划使用的sentencePiece令牌器中使用的，但我无法用它来包装我的头脑。

浏览 0提问于2021-02-02得票数 5

回答已采纳

1回答

ngram不能正常工作始终是unigram

我想做ngram，但它总是像unigram一样做。

浏览 0修改于2018-06-07得票数 0

1回答

在SOLR中对短语字段使用unigram

我使用solr搜索文档并在一个字段上进行匹配，然后根据其他字段中出现的关键字进行boost。<str name="qf"></str> keywords1^2 description^0.2所以如果我搜索我得到了一个结果keywords1 = "bar" keywords2 = &#

浏览 8提问于2014-08-12得票数 0

1回答

将术语文档矩阵限制为最频繁的unigram

我希望将术语文档矩阵限制为1000个最频繁的unigram，但是将max-features参数更改为n仅返回第一个n unigram。有什么建议吗？

浏览 1修改于2021-01-17得票数 0

1回答

tm Bigrams解决方案仍在生成unigram

stemming = stem))} 然而，不幸的是，这三个函数版本中的每一个都产生了完全相同的输出:带有unigram

浏览 0提问于2018-08-10得票数 1

回答已采纳

1回答

呈现相同输出的Bigram Tokenizer和Unigram Tokenizer

unigram似乎工作得很好，但只要我将二元语法分词器应用于语料库，它就会返回与unigram分词器相同的单词列表。代码如下。

浏览 16提问于2017-07-24得票数 0

1回答

如何使用list traning_data来计算unigram、bigram、cooc和with计数？

我想知道如何用list traning_data来计算unigram、bigram、cooc和wordcount。 # T

浏览 6修改于2015-07-31得票数 0

1回答

我怎样才能找到出现在google unigram中的名词的复数形式？

我下载了unigram，我怎样才能找到unigram中所有名词的复数形式？

浏览 1提问于2013-08-01得票数 0

1回答

如何应用培训文档中的术语--术语矩阵( dtm ) --测试dtm(既包括unigram，也包括bigram)？

当我只使用unigram时，脚本运行得很好。但是，我不知道如何使用control = list(dictionary=Terms(dtm_train_unigram))，因为我有两个独立的文档术语矩阵(一个用于unigram，一个用于bigramfunction(x) unlist(lapply(NLP::ngrams(words(x), 1), paste, collapse = " "), use.names = FALSE) dtm_train_unigram), wordLengths =

浏览 0提问于2018-09-06得票数 0

回答已采纳

1回答

如何将详细文本映射到unigram或bigram

我正在尝试找出需求的解决方案，在那里我需要将长文本映射到单字或双字。例如，“激励和管理团队的能力。你应该能够跟踪团队的进展，并进行干预，以提高进展”。这个长文本应该映射到“团队管理”。基本上，我试图从像职位描述这样的文档中看到的长文本中找出沟通/分析技能。我正在努力想出一个解决方案。我不想硬编码，因为长文本一直在变化。谢谢你的帮助。

浏览 14提问于2020-04-16得票数 0

回答已采纳

1回答

TF-国防军中的Unigram和Bigram组合

我正致力于一个项目，我们正在努力制作一个TF-以色列国防军的标题集的文章分为多个集群。我们的目标是使它同时包含--最重要的一元图和大写图--同时包含每个集群的。我们的计划就是这样。我们首先识别出我们的语料库中最有可能出现的比例尺。在这个列表中，我们计算每个星系团中这些大图的频率。我们下一步要做的，也是我们的问题所在，就是要确保我们不会在那些大字中数两次字。比方说，流行的标签是“气候变化”。在我们的语料库中，“气候变化”这个词的频率是6，但“气候”这个词的频率是7(只有一次)，而“变化”这个词的频率是8(只有两次)。我们必须确保我们的桌子上有组合的单字和双字数，看上去不像这样： n_

浏览 0提问于2020-05-06得票数 2

回答已采纳

6回答

从大量的.txt文件及其频率生成Ngram(Unigram、Bigrams等)

我需要用NLTK编写一个程序，它将一个语料库(大量的txt文件)分解为unigram、bigram、trigram、fourgrams和fivegrams。我已经编写了代码将我的文件输入到程序中。

浏览 3修改于2015-09-07得票数 27

回答已采纳

1回答

如何使用Python为文本文件和类变量创建一个unigram和bigram计数矩阵？

我想用Python为文本文件和类变量创建一个unigram和bigram计数矩阵，文本文件包含两列，如下所示I hate the movie Neg 我想要文本列的unigram

浏览 0修改于2017-11-08得票数 0

回答已采纳

1回答

我正在尝试使用Logistic回归分类器，并将其应用于UniGram单词袋特征集。

因此，我尝试使用Logistic回归分类器，并将其应用于UniGram单词袋特征集。

浏览 4提问于2022-02-21得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

如何平滑unigram

Nltk Sklearn Unigram + Bigram

使用python的unigram

NLTK包估计(unigram)困惑

用python打印Unigram计数

R写入函数以获取数据帧中的unigram

Unigram记号器:它是如何工作的？

ngram不能正常工作始终是unigram

在SOLR中对短语字段使用unigram

将术语文档矩阵限制为最频繁的unigram

tm Bigrams解决方案仍在生成unigram

呈现相同输出的Bigram Tokenizer和Unigram Tokenizer

如何使用list traning_data来计算unigram、bigram、cooc和with计数？

我怎样才能找到出现在google unigram中的名词的复数形式？

如何应用培训文档中的术语--术语矩阵( dtm ) --测试dtm(既包括unigram，也包括bigram)？

如何将详细文本映射到unigram或bigram

TF-国防军中的Unigram和Bigram组合

从大量的.txt文件及其频率生成Ngram(Unigram、Bigrams等)

如何使用Python为文本文件和类变量创建一个unigram和bigram计数矩阵？

我正在尝试使用Logistic回归分类器，并将其应用于UniGram单词袋特征集。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐