TLDR:我想在我的网站上建立多语言搜索,我怎么做呢?
我正在创建一个网站,在那里人们可以发布由用户输入的元数据内容。然后,人们可以通过查看、喜欢、评论、分享给社交媒体来与内容进行互动。另外,内容发现主要是通过搜索完成的。
我不想在我的网站上创建地理边界。我希望说任何语言的人都能找到与他们相关的任何语言的内容。这一要求是有意义的,因为内容是高度可视化的,ala。所以,即使我不明白“汽车”这个词是用法语写在描述中的,那也没关系,因为我很想看看这辆车。
Pinterest真的很擅长跨语言搜索。例如,在uk.pinterest.com 我输入了"coupe carrée“,这是法语的"bob剪发”,所有的结果在视觉上是相关的。上,即使pin元数据是英文的,而原始的网站都是英文的。
这怎么可能呢? Pinterest如何能够与我的法语搜索查询内容相匹配,其文本都是英文的?有没有翻译在某一步:跑车卡瑞>鲍勃发型>内容包含“鲍勃理发”?
我查看了他们的工程博客,我只发现了检测网站原始国家和语言的技术。没有关于在搜索中管理语言。
请让我知道,如果这是错误的地方问如何-它-工作的问题。
谢谢您能分享的任何帮助/提示!
发布于 2016-11-22 03:52:46
在这种情况下,一般的策略是用您想要搜索的每种语言翻译来索引您的内容。
这将需要在索引时使用语言翻译API。还有一个语言识别模型。下面是一个Solr示例。
https://stackoverflow.com/questions/40723662
复制相似问题