首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在gensim和fasttext中为word2vec准备数据?

如何在gensim和fasttext中为word2vec准备数据?
EN

Stack Overflow用户
提问于 2018-10-25 14:33:40
回答 1查看 484关注 0票数 2

我想训练word2vec和fasttext,以获得我拥有的特定数据集的向量。

我的模型应该接受什么作为输入?

我的文件是这样的:

代码语言:javascript
复制
Customer_4: I want to book a ticket to New York.
Agent_9: Okay, when do you want the tickets for
Customer_4: hmm, wait a sec
Agent_9: Sure
Customer_4: When is the least expensive to fly

现在,我应该如何为word2vec运行准备我的数据?word2vec模型是否考虑了句子间的相似性,即我不应该准备语料库句子。

EN

回答 1

Stack Overflow用户

发布于 2018-10-29 07:51:00

一种方法是首先将文档拆分成行,然后对每一行将该行拆分成标记。然后你会得到一个令牌列表的语料库。在此之后,您可以将其提供给gensim word2vec模型。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52982761

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档