目的:我正在尝试做一个关于自然语言处理(NLP)的项目,在那里我想提取信息并以图形形式表示它。
描述:
有可能吗?
发布于 2015-05-31 07:08:21
如果想使用nltk,可以启动这里。它对标记化、词性标注、语法分析等有一些解释。
检查此页面以获得使用nltk进行命名实体检测的示例。
图形表示可以使用艾格图或matplotlib执行。
而且,scikit-learn有一个很好的文本特征提取方法,如果您想运行一些更复杂的模型。
发布于 2017-10-10 02:09:59
第一步是试着用铅笔亲手完成这项工作。试试看,不仅是一个,而是一个新闻故事集。你真的必须这样做,而不是仅仅想一想。绘制图形就像你想要的电脑一样。
这将迫使您创建关于信息如何转换为图形的规则。这并不总是可能的,所以用手去做是一个很好的测试。如果你不能这样做,那么你就不能编程一台电脑来完成它。
假设你找到了纸和铅笔的方法。我喜欢做的是反向工作。您的方法从文本开始。不是的。从绘制图形所需的数字开始。然后你想想这些数字在故事中的位置,我需要看什么词才能得到这些数字。你的工作现在更像是一次狩猎之旅,你知道数据在那里,但如何找到它。
很抱歉缺乏细节,但我不知道你的确切问题,但这在每一种情况下都有效。首先,学会在纸上自己做这项工作,然后从输出到输入进行反向工作。
如果你试图朝前向设计这个软件,你很快就会陷入困境,因为你不可能知道如何处理你的文本,因为你不知道你需要什么,这就像推一根绳子--它不起作用。去另一头拉绳子。先做图形工作,然后从新闻报道中提取所需的数据。
https://stackoverflow.com/questions/30554687
复制相似问题