搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

N-Gram平滑

我想知道是否有一个很好的例子，比较N和各种平滑技术。我找到了这个应用拉普拉斯变换的记事本，但仅此而已。如有任何建议，将不胜感激。

浏览 0提问于2022-01-27得票数 1

回答已采纳

1回答

我正在进行一个分析“ngram”的项目。我在我的程序中有一个方法，可以创建大图和三角图。但是，他们只把相邻的单词连在一起，我想让它得到所有单词的组合. Original String - "chilli, start, day, suffer, raynaud, check, raynaudsuk, great, tip, loveyourglov, ram" Bigram - "chilli start, start day, day suffer, suffer raynaud, raynaud check, check raynaudsuk, rayn

浏览 2修改于2016-02-24得票数 0

回答已采纳

2回答

N-gram:解释+2个应用

哪种类型的n-gram更适合大多数用途？词级还是字符级n-gram？如何在PHP中实现n-gram-tokenizer？句子：“我住在纽约。”此外，我想了解更多关于n-gram可以做什么的信息：如何使用n元语法识别文本的语言？即使没有双语语料库，也可以使用n元语法进行机器翻译吗？如何构建垃圾邮件过滤器(垃圾邮件、火腿)？将n-gram与贝叶斯过滤器相结合？如何进行主题定位？例如:是关于篮球还是关于狗

浏览 35修改于2009-06-23得票数 18

回答已采纳

7回答

从句子中生成N-gram

我想用下面的输入生成n-gram：输出应为：iscar is myis my car我正在尝试使用，但它给出了字符序列的n-gram，我想要n-gram的单词序列。

浏览 1修改于2012-09-18得票数 31

回答已采纳

1回答

Mallet:主题N-gram

我想使用--use-ngrams true选项运行mallet，但似乎无法使其正常工作。我使用以下命令导入了我的数据：现在我想训练一个主题ngram模型： bin/mallet train-topics --input topic-input.mallet --use-ngrams true --num-topics 30 --xml-topic-report topic-report.xml

浏览 2修改于2012-04-28得票数 2

回答已采纳

4回答

Perl段落n-gram

假设我有一句话：我想把这句话放入“关键字”的散列中，但我想允许多个单词的关键字；我有以下几个方法来获取单个单词的关键字：完成此操作后，我有一个类似于以下内容的散列：'quick' => 1,'fox' => 1, 'jumps' =&g

浏览 3提问于2010-08-19得票数 5

回答已采纳

2回答

Google N-Gram Web API

我希望在我的项目中使用Google 2-gram；但是数据大小使得搜索在速度和存储方面都很昂贵。

浏览 0提问于2012-06-29得票数 22

回答已采纳

2回答

elasticsearch n-gram示例说明

参考此处引用的示例，但是，为什么对"Zdler“的查询返回结果，即使zdl不在其中？{ "match": { "query": "zdler" }} 对搜索

浏览 18修改于2017-07-28得票数 1

1回答

从模式中提取n-gram

我试图从从文本文档中提取的模式中提取ngram，这些模式具有不同数量的术语。我们需要提取ngram 3t1t3 t2,t3 我写了一些代码，但不能很好地工作。 ArrayList<Pattern> patterns = d.getPatterns(); System.out.println("patterns &#

浏览 1修改于2012-07-12得票数 2

2回答

基于n-gram模型的文本自动分类

我的任务是使用n-gram方法对文本文档进行自动分类。我找不到关于这个主题的适当资源，请帮助我如何继续这个主题，我在哪里可以找到基于n-gram分类的教程。

浏览 1提问于2013-11-13得票数 2

2回答

Gensim短语用于过滤n-gram

我正在使用Gensim短语来识别文本中的重要n-gram，如下所示。我在上面的例子中提到过，有没有办法停止检测不感兴趣的n-gram的短语？

浏览 0提问于2017-12-10得票数 1

1回答

Solr 5.x边缘N-Gram滤波器从背面

我在Solr 5.x中遇到了Edge N-Gram过滤器的问题。我想要后面的n-gram。当我设置side ="back“时，solr核心抛出错误。现在我使用的是N-Gram过滤器。请提个建议。

浏览 0提问于2015-08-18得票数 0

2回答

awk n-gram提取不正确

我目前正在开发一个awk脚本，它可以从输入文件中提取所有的n-gram。当对一个文件运行awk脚本时，它会打印出每个n元语法(排序后)以及它旁边出现的次数。为了提取n-gram，我有以下代码：line=tolower($0)begin_len=0 348451302 en930 de772 er703 an如你所

浏览 1修改于2013-03-17得票数 0

1回答

Pymongo和n-gram搜索

我在mongo db有一套文件。我使用Pymongo访问并插入到这个集合中。我想做的是：我知道如何对单个单词这样做，但很难把它扩展到n克。我不想做的是使用NLTK库进行标记化，然后运行map还原。我相信这会降低解决方案的效率。谢谢。

浏览 3修改于2017-09-22得票数 1

回答已采纳

1回答

Python中的N-Gram分析

下面是我的示例数据：我需要进行1-2克查询，并计算与查询相关的印象总和和平均值。现在我已经想出了如何使用下面的代码来聚合印象。grams = list()for i in range(len(words)): grams.append(" ".join(words[i:i+k])) counts = df['

浏览 0修改于2017-06-08得票数 0

1回答

N-gram忽略换行符

我对nltk比较陌生，但最近我遇到了一个问题，我似乎找不到解决方案。Monkeys like bananas.我正在尝试做二元语法，通过使用word_tokenizer，它创建了这些二元语法：我如何才能使它工作，这样它就不会创建二元语法import nltk corpus = open("my

浏览 1修改于2017-11-05得票数 1

1回答

按N-Gram字符向量化Pandas DataFrame，并追加列名

我正在尝试将一个熊猫数据帧矢量化为单独的n-gram字符。但是有一个警告，我希望列名是字符序列的一部分。例如，假设这是原始数据：John, Smith"First Name_Joh", "Last Name_Smi", "Last Name_ith对于我正在做的事情

浏览 6修改于2018-12-14得票数 0

回答已采纳

1回答

我需要计算n-gram频率

我有推文列表，我需要知道两个单词的n-gram，首先我要将列表转换为str like然后，文本将如下所示 'Based today data dshs website

浏览 2修改于2021-01-03得票数 1

1回答

N-Gram建模中的未知词

将未知单词分组到相同的标记下，即<UNK>，并且还包括小概率的单词的逻辑是什么？如果所有的<UNK>单词在某种意义上属于同一类，例如，像约翰、蒂姆、山姆这样的专有名词都可以使用彼此的概率作为双文法"Hello John，Hello Tim，Hello Sam“的可能性相等，那么这可能会起作用。但是如果不是这样的话，这个方法不会遇到问题吗？

浏览 1提问于2017-05-10得票数 1

1回答

从大型语料库生成n-gram

我正在使用wikipidia语料库(17G)和python语言来获取n-gram模型。

浏览 12提问于2021-04-02得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

N-Gram平滑

N-Gram与ArrayList

N-gram:解释+2个应用

从句子中生成N-gram

Mallet:主题N-gram

Perl段落n-gram

Google N-Gram Web API

elasticsearch n-gram示例说明

从模式中提取n-gram

基于n-gram模型的文本自动分类

Gensim短语用于过滤n-gram

Solr 5.x边缘N-Gram滤波器从背面

awk n-gram提取不正确

Pymongo和n-gram搜索

Python中的N-Gram分析

N-gram忽略换行符

按N-Gram字符向量化Pandas DataFrame，并追加列名

我需要计算n-gram频率

N-Gram建模中的未知词

从大型语料库生成n-gram

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐