腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(455)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
N-Gram
平滑
我想知道是否有一个很好的例子,比较N和各种平滑技术。 我找到了这个应用拉普拉斯变换的记事本,但仅此而已。如有任何建议,将不胜感激。
浏览 0
提问于2022-01-27
得票数 1
回答已采纳
1
回答
N-Gram
与ArrayList
我正在进行一个分析“ngram”的项目。我在我的程序中有一个方法,可以创建大图和三角图。但是,他们只把相邻的单词连在一起,我想让它得到所有单词的组合. Original String - "chilli, start, day, suffer, raynaud, check, raynaudsuk, great, tip, loveyourglov, ram" Bigram - "chilli start, start day, day suffer, suffer raynaud, raynaud check, check raynaudsuk, rayn
浏览 2
修改于2016-02-24
得票数 0
回答已采纳
2
回答
N-gram
:解释+2个应用
哪种类型的
n-gram
更适合大多数用途?词级还是字符级
n-gram
?如何在PHP中实现n-gram-tokenizer? 句子:“我住在纽约。”此外,我想了解更多关于
n-gram
可以做什么的信息: 如何使用n元语法识别文本的语言?即使没有双语语料库,也可以使用n元语法进行机器翻译吗?如何构建垃圾邮件过滤器(垃圾邮件、火腿)?将
n-gram
与贝叶斯过滤器相结合?如何进行主题定位?例如:是关于篮球还是关于狗
浏览 35
修改于2009-06-23
得票数 18
回答已采纳
7
回答
从句子中生成
N-gram
我想用下面的输入生成
n-gram
:输出应为:iscar is myis my car我正在尝试使用,但它给出了字符序列的
n-gram
,我想要
n-gram
的单词序列。
浏览 1
修改于2012-09-18
得票数 31
回答已采纳
1
回答
Mallet:主题
N-gram
我想使用--use-ngrams true选项运行mallet,但似乎无法使其正常工作。我使用以下命令导入了我的数据:现在我想训练一个主题ngram模型: bin/mallet train-topics --input topic-input.mallet --use-ngrams true --num-topics 30 --xml-topic-report topic-report.xml
浏览 2
修改于2012-04-28
得票数 2
回答已采纳
4
回答
Perl段落
n-gram
假设我有一句话:我想把这句话放入“关键字”的散列中,但我想允许多个单词的关键字;我有以下几个方法来获取单个单词的关键字:完成此操作后,我有一个类似于以下内容的散列:'quick' => 1,'fox' => 1, 'jumps' =&g
浏览 3
提问于2010-08-19
得票数 5
回答已采纳
1
回答
从模式中提取
n-gram
我试图从从文本文档中提取的模式中提取ngram,这些模式具有不同数量的术语。我们需要提取ngram 3t1t3 t2,t3 我写了一些代码,但不能很好地工作。 ArrayList<Pattern> patterns = d.getPatterns(); System.out.println("patterns
浏览 1
修改于2012-07-12
得票数 2
2
回答
基于
n-gram
模型的文本自动分类
我的任务是使用
n-gram
方法对文本文档进行自动分类。 我找不到关于这个主题的适当资源,请帮助我如何继续这个主题,我在哪里可以找到基于
n-gram
分类的教程。
浏览 1
提问于2013-11-13
得票数 2
2
回答
elasticsearch
n-gram
示例说明
参考此处引用的示例,但是,为什么对"Zdler“的查询返回结果,即使zdl不在其中?{ "match": { "query": "zdler" }} 对搜索
浏览 18
修改于2017-07-28
得票数 1
2
回答
Google
N-Gram
Web API
我希望在我的项目中使用Google 2-gram;但是数据大小使得搜索在速度和存储方面都很昂贵。
浏览 0
提问于2012-06-29
得票数 22
回答已采纳
1
回答
Solr 5.x边缘
N-Gram
滤波器从背面
我在Solr 5.x中遇到了Edge
N-Gram
过滤器的问题。我想要后面的
n-gram
。当我设置side ="back“时,solr核心抛出错误。现在我使用的是
N-Gram
过滤器。请提个建议。
浏览 0
提问于2015-08-18
得票数 0
2
回答
Gensim短语用于过滤
n-gram
我正在使用Gensim短语来识别文本中的重要
n-gram
,如下所示。我在上面的例子中提到过,有没有办法停止检测不感兴趣的
n-gram
的短语?
浏览 0
提问于2017-12-10
得票数 1
2
回答
awk
n-gram
提取不正确
我目前正在开发一个awk脚本,它可以从输入文件中提取所有的
n-gram
。当对一个文件运行awk脚本时,它会打印出每个n元语法(排序后)以及它旁边出现的次数。为了提取
n-gram
,我有以下代码:line=tolower($0)begin_len=0 348451302 en930 de772 er703 an如你所
浏览 1
修改于2013-03-17
得票数 0
1
回答
N-gram
忽略换行符
我对nltk比较陌生,但最近我遇到了一个问题,我似乎找不到解决方案。Monkeys like bananas.我正在尝试做二元语法,通过使用word_tokenizer,它创建了这些二元语法:我如何才能使它工作,这样它就不会创建二元语法import nltk corpus = open("my
浏览 1
修改于2017-11-05
得票数 1
1
回答
Python中的
N-Gram
分析
下面是我的示例数据:我需要进行1-2克查询,并计算与查询相关的印象总和和平均值。现在我已经想出了如何使用下面的代码来聚合印象。grams = list()for i in range(len(words)): grams.append(" ".join(words[i:i+k])) counts = df['
浏览 0
修改于2017-06-08
得票数 0
1
回答
Pymongo和
n-gram
搜索
我在mongo db有一套文件。我使用Pymongo访问并插入到这个集合中。我想做的是:我知道如何对单个单词这样做,但很难把它扩展到n克。我不想做的是使用NLTK库进行标记化,然后运行map还原。我相信这会降低解决方案的效率。谢谢。
浏览 3
修改于2017-09-22
得票数 1
回答已采纳
1
回答
按
N-Gram
字符向量化Pandas DataFrame,并追加列名
我正在尝试将一个熊猫数据帧矢量化为单独的
n-gram
字符。但是有一个警告,我希望列名是字符序列的一部分。例如,假设这是原始数据:John, Smith"First Name_Joh", "Last Name_Smi", "Last Name_ith对于我正在做的事情
浏览 6
修改于2018-12-14
得票数 0
回答已采纳
1
回答
我需要计算
n-gram
频率
我有推文列表,我需要知道两个单词的
n-gram
,首先我要将列表转换为str like然后,文本将如下所示 'Based today data dshs website
浏览 2
修改于2021-01-03
得票数 1
1
回答
N-Gram
建模中的未知词
将未知单词分组到相同的标记下,即<UNK>,并且还包括小概率的单词的逻辑是什么?如果所有的<UNK>单词在某种意义上属于同一类,例如,像约翰、蒂姆、山姆这样的专有名词都可以使用彼此的概率作为双文法"Hello John,Hello Tim,Hello Sam“的可能性相等,那么这可能会起作用。但是如果不是这样的话,这个方法不会遇到问题吗?
浏览 1
提问于2017-05-10
得票数 1
1
回答
从大型语料库生成
n-gram
我正在使用wikipidia语料库(17G)和python语言来获取
n-gram
模型。
浏览 12
提问于2021-04-02
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券