我正在使用Python语言,我收到了twitter上的推特消息。现在我要做的下一件事是从这个tweet中提取特征,比如: 1.特性A(统计特性):一条tweet消息中的单词数,以及查询词在一条tweet中的位置。2.特征B(关键词特征):推文中的单词。3.特征C(单词上下文特征):查询词前后的单词。例如:特征A: 7个字在推特上,查询词是第五个特征B: I,am,在日本,对,现在特征C:日本,对吗?
建议我一些好的方法来提取这些特征。因为我找不到正确的方法来提取特征
发布于 2016-05-07 08:30:34
您应该查看以下库:
根据你需要做的事情,两者之间的混合可以让你走上一段很长的路。
另外,关于自然语言处理的介绍,我推荐这本书 (免费在线阅读)。
https://stackoverflow.com/questions/37085706
复制相似问题