我对信息检索( IR )任务的最新方法感兴趣,您有一个查询和一组文档,IR模型将为您提供最佳匹配的文档。
我研究过向量空间模型(tfidf-余弦相似)和LSA。
我也尝试过Wordnet,NER,模糊匹配等来提高精度。
现在,我想知道如何通过应用神经网络、字嵌入停止模型等来提高红外任务的准确性,获取更多的上下文/语义信息。
发布于 2017-07-27 16:19:21
深度学习扩展了信息检索(IR)系统的能力。
深度学习已被证明是特征工程的有力工具。这种特征工程的改进,而不是人工的建设,提高了任何机器学习系统的质量,包括信息检索。
具体来说,单词嵌入创建了一个密集的、向量化的词表示,它基于共现对语义关系进行编码。文档和查询都可以投影到相同的潜在空间中,并且可以找到最近的邻居。Word嵌入可以通过查找相关术语来将投递索引扩展到。它们也可以用于查询扩展/查询重写。
https://datascience.stackexchange.com/questions/15477
复制相似问题