我正在研究Microsoft SQL Server (版本2008 R2)的大规模文本处理能力。我们正在实现一个存储文档(文本)的大型数据库。我们需要根据表中存储的文本生成有效的搜索结果。这里有一篇文章引起了我的注意,我想知道是否有人真正实现了这一点:
http://www.devx.com/dbzone/Article/31339/1954?pf=true
如果你已经实现了这个或者任何类似的东西,或者任何其他的文本处理算法,请回复。
谢谢。
发布于 2011-12-05 10:33:31
您所链接的文章并没有真正介绍搜索文本本身,尽管它确实提供了进行文本处理的方法。从问题中还不能完全清楚你到底想做什么,但我假设你需要实现搜索引擎类型的功能,即根据搜索文本返回最相关的结果。如果是这种情况,并且您必须仅在SQL Server中实现某些内容,那么您可能需要研究一下Full Text Search。
话虽如此,我强烈建议您考虑利用Lucene.NET或Solr (它利用Apache Lucene搜索库)来返回有效的搜索结果。在最后一个链接的末尾有一个关于使用Lucene.NET或StackOverflow uses Lucene.NET的利弊的冗长的讨论。我使用过Solr和IMHO,它比使用全文索引的SQL Server更容易使用,并且产生了更好的结果。如果您真的想要在SQL Server中进行有效的搜索,您可能最终会构建Lucene中已有的大部分内容,因此使用Lucene.NET或Solr可能更容易。
https://stackoverflow.com/questions/8379848
复制相似问题