我正在开发一个程序,但被困在一个特定的障碍上。我需要找到与其他单词相关联的单词。例如,“绿色”可能与“环境”,“树叶”,“地球”,“风”,“电力”,“混合动力”等联系在一起。有没有其他更好的资源?
发布于 2010-12-19 23:04:55
如果你有一个很大的文本集合(比如维基百科,古腾堡计划),你可以使用共现分数来提取这种数据。例如,参见Padó and Lapata和其中的参考文献。
我最近构建了一个tool,它通过另一种方法从维基百科数据库转储中挖掘这种关联。不过,它需要大量内存;其他人也曾尝试使用随机化的方法来做同样的事情。
https://stackoverflow.com/questions/4470462
复制相似问题