腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(273)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
如何平滑
unigram
我有一个单字语言模型,我想要平滑计数。添加一个平滑是唯一的方法,或者我也可以使用一些其他的平滑。我不认为我们可以使用knesser nay,因为这是针对Ngrams和N>=2的。还有其他的平滑方法吗?
浏览 2
修改于2011-10-08
得票数 1
回答已采纳
2
回答
Nltk Sklearn
Unigram
+ Bigram
classifier = SklearnClassifier(LinearSVC(), int,True)例如,当我只使用
unigram
和构建功能集时"Ronaldo") : True }feature_names.sort()TypeError: unorderable types: tuple() < str() 如何使用
unigram
浏览 1
修改于2015-08-31
得票数 1
2
回答
使用python的
unigram
我正在尝试从一个文本文件生成
unigram
。但只显示给定文件第一行的二元语法。我想为文件中的所有句子显示
unigram
。
浏览 0
修改于2011-11-29
得票数 0
回答已采纳
2
回答
NLTK包估计(
unigram
)困惑
token] += 1我已经为我拥有的数据执行了潜在的Dirichlet分配,并且我已经生成了
unigram
我的
unigram
和它们的概率如下:Andreas 7.11290670484e-07yellow 1.26582575863e-05
浏览 5
修改于2015-10-23
得票数 10
回答已采纳
4
回答
用python打印
Unigram
计数
我有一个名为corpus.txt的文本文件,它包含以下4行文本 a peck of pickled peppers peter piper picked where s the peck of pickled peppers peter piper picked 4 peter等。f = open("c
浏览 1
修改于2019-02-11
得票数 1
回答已采纳
2
回答
R写入函数以获取数据帧中的
unigram
"This is a really nice and sunny day") get_unigrams <- function(text) {
unigram
<- ngram(text, n = 1) %>% get.ngrams() %>% length() }我找到了一个(临时)解决方案:
浏览 0
修改于2021-12-02
得票数 1
1
回答
Unigram
记号器:它是如何工作的?
我一直在试图了解
unigram
令牌程序是如何工作的,因为它是在我计划使用的sentencePiece令牌器中使用的,但我无法用它来包装我的头脑。
浏览 0
提问于2021-02-02
得票数 5
回答已采纳
1
回答
ngram不能正常工作始终是
unigram
我想做ngram,但它总是像
unigram
一样做。
浏览 0
修改于2018-06-07
得票数 0
1
回答
在SOLR中对短语字段使用
unigram
我使用solr搜索文档并在一个字段上进行匹配,然后根据其他字段中出现的关键字进行boost。<str name="qf"></str> keywords1^2 description^0.2所以如果我搜索我得到了一个结果keywords1 = "bar" keywords2 =
浏览 8
提问于2014-08-12
得票数 0
1
回答
将术语文档矩阵限制为最频繁的
unigram
我希望将术语文档矩阵限制为1000个最频繁的
unigram
,但是将max-features参数更改为n仅返回第一个n
unigram
。有什么建议吗?
浏览 1
修改于2021-01-17
得票数 0
1
回答
tm Bigrams解决方案仍在生成
unigram
stemming = stem))} 然而,不幸的是,这三个函数版本中的每一个都产生了完全相同的输出:带有
unigram
浏览 0
提问于2018-08-10
得票数 1
回答已采纳
1
回答
呈现相同输出的Bigram Tokenizer和
Unigram
Tokenizer
unigram
似乎工作得很好,但只要我将二元语法分词器应用于语料库,它就会返回与
unigram
分词器相同的单词列表。代码如下。
浏览 16
提问于2017-07-24
得票数 0
1
回答
如何使用list traning_data来计算
unigram
、bigram、cooc和with计数?
我想知道如何用list traning_data来计算
unigram
、bigram、cooc和wordcount。 # T
浏览 6
修改于2015-07-31
得票数 0
1
回答
我怎样才能找到出现在google
unigram
中的名词的复数形式?
我下载了
unigram
,我怎样才能找到
unigram
中所有名词的复数形式?
浏览 1
提问于2013-08-01
得票数 0
1
回答
如何应用培训文档中的术语--术语矩阵( dtm ) --测试dtm(既包括
unigram
,也包括bigram)?
当我只使用
unigram
时,脚本运行得很好。但是,我不知道如何使用control = list(dictionary=Terms(dtm_train_
unigram
)),因为我有两个独立的文档术语矩阵(一个用于
unigram
,一个用于bigramfunction(x) unlist(lapply(NLP::ngrams(words(x), 1), paste, collapse = " "), use.names = FALSE) dtm_train_
unigram
), wordLengths =
浏览 0
提问于2018-09-06
得票数 0
回答已采纳
1
回答
如何将详细文本映射到
unigram
或bigram
我正在尝试找出需求的解决方案,在那里我需要将长文本映射到单字或双字。例如,“激励和管理团队的能力。你应该能够跟踪团队的进展,并进行干预,以提高进展”。这个长文本应该映射到“团队管理”。基本上,我试图从像职位描述这样的文档中看到的长文本中找出沟通/分析技能。我正在努力想出一个解决方案。我不想硬编码,因为长文本一直在变化。谢谢你的帮助。
浏览 14
提问于2020-04-16
得票数 0
回答已采纳
1
回答
TF-国防军中的
Unigram
和Bigram组合
我正致力于一个项目,我们正在努力制作一个TF-以色列国防军的标题集的文章分为多个集群。我们的目标是使它同时包含--最重要的一元图和大写图--同时包含每个集群的。我们的计划就是这样。我们首先识别出我们的语料库中最有可能出现的比例尺。在这个列表中,我们计算每个星系团中这些大图的频率。我们下一步要做的,也是我们的问题所在,就是要确保我们不会在那些大字中数两次字。比方说,流行的标签是“气候变化”。在我们的语料库中,“气候变化”这个词的频率是6,但“气候”这个词的频率是7(只有一次),而“变化”这个词的频率是8(只有两次)。我们必须确保我们的桌子上有组合的单字和双字数,看上去不像这样: n_
浏览 0
提问于2020-05-06
得票数 2
回答已采纳
6
回答
从大量的.txt文件及其频率生成Ngram(
Unigram
、Bigrams等)
我需要用NLTK编写一个程序,它将一个语料库(大量的txt文件)分解为
unigram
、bigram、trigram、fourgrams和fivegrams。我已经编写了代码将我的文件输入到程序中。
浏览 3
修改于2015-09-07
得票数 27
回答已采纳
1
回答
如何使用Python为文本文件和类变量创建一个
unigram
和bigram计数矩阵?
我想用Python为文本文件和类变量创建一个
unigram
和bigram计数矩阵,文本文件包含两列,如下所示I hate the movie Neg 我想要文本列的
unigram
浏览 0
修改于2017-11-08
得票数 0
回答已采纳
1
回答
我正在尝试使用Logistic回归分类器,并将其应用于
UniGram
单词袋特征集。
因此,我尝试使用Logistic回归分类器,并将其应用于
UniGram
单词袋特征集。
浏览 4
提问于2022-02-21
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券