首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >可以使用哪种机器学习技术?

可以使用哪种机器学习技术?
EN

Data Science用户
提问于 2017-01-06 06:58:10
回答 3查看 127关注 0票数 0

我想了解顾客使用他的搜索查询的意图,比方说,如果顾客对瑜伽裤感兴趣,他可以搜索瑜伽裤、运动裤或运动紧身衣等。有什么模型可以用来找出与瑜伽裤相关的所有搜索关键词吗?

EN

回答 3

Data Science用户

回答已采纳

发布于 2017-01-06 10:17:38

我认为这是您可以尝试的方法(请您在此列表中添加更多):

  1. 高精度和低召回是使用几乎所有可能的字典(手工努力,但必须值得)。
  2. 使用Word2Vec。Mikolov已经训练了文本数据并创建了单词向量。使用这个向量空间,你可以找出哪些词是相似的。你可以尝试,并找到一个阈值,你可以说哪个词是相似的(例如,瑜伽和锻炼将有相当大的相似性)。
  3. 如果您有足够的数据,就训练自定义的W2V (这是一个无监督的模型,所以您不需要担心标记数据,而是查找大量与工作域相关的数据)。
  4. 您可以使用RNN查找语料库中最相似的单词,并将其用于查询。这比W2V提供了更多的灵活性。
票数 1
EN

Data Science用户

发布于 2017-01-06 07:39:21

您正在寻找的是命名实体推荐。我必须告诉你这是个非常棘手的问题。斯坦福已经开源了一个新的塔格,但是你需要在大量的数据上训练它,你必须创建一个标记的数据集。为了获得一个好的教程,请查看这个介质博客。我建议你研究一下你的需求,如果它们太有限,你就不需要这样的东西了。你可以通过一个简单的词汇。

票数 0
EN

Data Science用户

发布于 2017-01-06 10:06:47

你可以看看罗基的算法,word2vec和其他使用共现的方法.

一个简单的起点是查询一个大型文档集(您的集合、internet或两者的组合)和手头的查询,获取结果中最突出的单词(td-国防军结果/集合),并将其添加到原始查询中。这里的一般想法是,结果中的重要单词是与查询密切相关的单词。您可以在需要一般上下文( Internet)或域特定上下文(您的集合)以及如何权衡上下文(您将添加多少重要单词以及它们的权重)方面进行实验,但我们可以在后面讨论。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/16131

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档