首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用主题的关键字进行主题建模

使用主题的关键字进行主题建模
EN

Stack Overflow用户
提问于 2014-10-05 01:51:02
回答 1查看 1.3K关注 0票数 0

我需要通过以下方式进行主题建模:

例如:

我需要从作为单个文档的document.The文档中提取5个主题。我有5个主题的关键字,并与这5个关键字相关,我需要提取这些主题。

5个主题的关键词是:关键词1-(汽车,赛车,...)关键词2-(事故,保险,...) ......

相应的输出应该是: Topic 1-(车辆,扭矩,速度...)主题2-(索赔,金额,...)

如何做到这一点呢?

EN

回答 1

Stack Overflow用户

发布于 2014-10-14 05:06:16

为与NodeJS一起使用而编写的这个LDA主题建模库是一个很好的起点。

https://www.npmjs.org/package/lda

代码语言:javascript
复制
var lda = require('lda');
// Example document.
var text = 'Cats are small. Dogs are big. Cats like to chase mice. Dogs like to eat bones.';

// Extract sentences.
var documents = text.match( /[^\.!\?]+[\.!\?]+/g );

// Run LDA to get terms for 2 topics (5 terms each).
var result = lda(documents, 2, 5);
The above example produces the following result with two topics (topic 1 is "cat-related", topic 2 is "dog-related"):

Topic 1
cats (0.21%)
dogs (0.19%)
small (0.1%)
mice (0.1%)
chase (0.1%)

Topic 2
dogs (0.21%)
cats (0.19%)
big (0.11%)
eat (0.1%)
bones (0.1%)

这应该会让你开始走上这条路。请注意,您可能需要调整主题和文档的数量,以适应您希望提取的信息量。

这不是魔法。

http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26195508

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档