文章/答案/技术大牛

发布

社区首页 >问答首页 >可以使用哪种机器学习技术？

问可以使用哪种机器学习技术？
EN

Data Science用户

提问于 2017-01-06 06:58:10

回答 3查看 127关注 0票数 0

我想了解顾客使用他的搜索查询的意图，比方说，如果顾客对瑜伽裤感兴趣，他可以搜索瑜伽裤、运动裤或运动紧身衣等。有什么模型可以用来找出与瑜伽裤相关的所有搜索关键词吗？

stanford-nlp

machine-learning

nlp

回答 3

Data Science用户

回答已采纳

发布于 2017-01-06 10:17:38

我认为这是您可以尝试的方法(请您在此列表中添加更多)：

高精度和低召回是使用几乎所有可能的字典(手工努力，但必须值得)。
使用Word2Vec。Mikolov已经训练了文本数据并创建了单词向量。使用这个向量空间，你可以找出哪些词是相似的。你可以尝试，并找到一个阈值，你可以说哪个词是相似的(例如，瑜伽和锻炼将有相当大的相似性)。
如果您有足够的数据，就训练自定义的W2V (这是一个无监督的模型，所以您不需要担心标记数据，而是查找大量与工作域相关的数据)。
您可以使用RNN查找语料库中最相似的单词，并将其用于查询。这比W2V提供了更多的灵活性。

票数 1

Data Science用户

发布于 2017-01-06 07:39:21

您正在寻找的是命名实体推荐。我必须告诉你这是个非常棘手的问题。斯坦福已经开源了一个新的塔格，但是你需要在大量的数据上训练它，你必须创建一个标记的数据集。为了获得一个好的教程，请查看这个介质博客。我建议你研究一下你的需求，如果它们太有限，你就不需要这样的东西了。你可以通过一个简单的词汇。

票数 0

Data Science用户

发布于 2017-01-06 10:06:47

你可以看看罗基的算法，word2vec和其他使用共现的方法.

一个简单的起点是查询一个大型文档集(您的集合、internet或两者的组合)和手头的查询，获取结果中最突出的单词(td-国防军结果/集合)，并将其添加到原始查询中。这里的一般想法是，结果中的重要单词是与查询密切相关的单词。您可以在需要一般上下文( Internet)或域特定上下文(您的集合)以及如何权衡上下文(您将添加多少重要单词以及它们的权重)方面进行实验，但我们可以在后面讨论。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/16131

复制

相似问题

问可以使用哪种机器学习技术？
EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问可以使用哪种机器学习技术？EN

回答 3

Data Science用户

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问可以使用哪种机器学习技术？
EN