首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >多语言搜索匹配

多语言搜索匹配
EN

Stack Overflow用户
提问于 2012-07-05 12:58:47
回答 2查看 305关注 0票数 3

假设我们的名称是用任何无-拉丁字母-语言写成的,比如Arabic, Hebrew, Chinese, Japanese等等。

search engine如何在同名的original nameEnglish spelling之间匹配。反之亦然?

类似于日语中的名字拓海English拼写Takumi

algorithm/technique用来做这个的是什么?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-07-05 13:23:40

日安。

你必须做以下工作:

把世界上的每一个郎都用同样的符号分类:

all langs:

  • a b c d e f g.
  • 俄语33个字母aбвгде..。
  • 中文x字母..。
  • 乌克兰字母aбвгд.i
  • 日文x字母..。
  • .

最后,你将有规则之间的任何符号拼写在任何语言。有些语言,如印地语、汉语等,将不会有任何规定。你应该创建你自己的规则(基于这个语言的转录)。

algo:

wп= wep

E、e、r

E- eng r- rus转录п=p

票数 2
EN

Stack Overflow用户

发布于 2012-07-05 13:14:11

搜索引擎(如Google)可能有大量的数据集(语料库),每个语料库都使用不同的语言。

当您想要将一种语言中的单词翻译到另一种语言时,可以通过在第一语言的语料库中搜索单词,然后在第二语言的语料库中返回兼容的单词。(相同的名称技术)

这是基本的想法。

您最好在这里阅读有关NLP字段的一些背景信息:processing

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11344854

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档