我是自然语言处理领域的新手。我唯一的经验是使用standford nlp来获取句子的词性。
问题:我必须找出在一组产品反馈中给出的前10个建议。
输入:它由大约100个反馈组成,作为对某些产品的建议。
我不知道该从哪里开始做这项工作。我应该在什么基础上创建排名前十的建议?
发布于 2013-09-17 17:38:26
当您说您有一组反馈时,如果涉及到任何分隔符字符串或其他内容,则可以使用正则表达式来分隔不同的反馈。你可以参考这个链接
https://sites.google.com/site/gothnlp/links/regular-expressions
http://docs.python.org/2/library/re.html
如果分隔符类似于提交反馈的人员的姓名,那么您可以查看名为命名实体识别的概念,它可以分隔人员的姓名。
如果您可以使用NLTk工具包,那么我建议您使用它。
http://www.slideshare.net/japerk/nltk-in-20-minutes
以下是可以帮助您的链接
另外,这个博客可能会对你有所帮助
http://blog.kaggle.com/2012/09/26/impermium-andreas-blog/
https://stackoverflow.com/questions/18795543
复制相似问题