我必须使用Python2.x在web2py中构建一个文本挖掘应用程序。app的目的是从网站收集数据,将它们保存在一个文本文件中,然后将该文本文件传递给程序进行文本到矩阵的转换,最后我必须对该数据应用聚类。
我的问题是,我可以使用什么开源库或API来涵盖文本到矩阵的转换,并在Python2.x上对其应用集群?
发布于 2014-01-14 07:50:31
我认为scikit-learn应该能满足您的需求。如果不确切知道你的数据会是什么样子,那就很难说了,但是在scikit-learn的API中有许多文本操作函数和内置的聚类算法。
https://stackoverflow.com/questions/20368164
复制相似问题