当我们都在玩拇指的时候,一个17岁的加拿大男孩显然发现了一种信息检索算法:
( a)执行的精度是电流的两倍,并且被广泛使用的矢量空间模型。
( b)在识别类似单词方面“相当准确”。
( c)使微搜索更加准确
这是一个很好的采访。
不幸的是,我还没有找到已经发表的论文,但是,从我几年前从图形模型和机器学习课程中所记得的片段来看,我认为我们应该能够从他的摘要中,以及他在采访中对它的看法来重构它。
从采访中:
有些搜索发现出现在类似上下文中的单词。这是相当不错的,但这是遵循的关系到第一阶段。我的算法试图进一步跟踪连接。亲密的关系被认为更有价值。从理论上讲,它在无限大程度上遵循联系。
摘要把它放在上下文中:
提出了一种新的信息检索算法"Apodora“,该算法利用类马尔可夫链矩阵的极限幂来确定文档的模型,并对词的语义进行上下文统计推断。实现了该系统,并与矢量空间模型进行了比较。特别是在查询时间较短的情况下,该算法给出的结果精度约为查询精度的两倍,在微搜索中有着有趣的应用。
我觉得知道马尔可夫链状矩阵或信息检索的人会立刻意识到他在做什么。
那么:他在干什么?
发布于 2011-08-08 21:06:33
从“上下文”这样的词的使用和他引入了二级统计依赖性这一事实来看,我怀疑他正在做一些与论文中概述的LDA-HMM方法有关的事情: Griffiths,T.,Steyvers,M.,Blei,D.,& Tenenbaum,J. (2005)。整合主题和语法。神经信息处理系统研究进展。由于模型平均,搜索的分辨率存在一些固有的限制。然而,在17岁的时候,我很羡慕这样的事情,我希望他已经做了一些独立的事情,至少越来越好。即使在同一主题上有一个不同的方向,也会相当酷。
https://stackoverflow.com/questions/6967792
复制相似问题