我想知道关于这些问题的一般想法,在数据分析和NLP领域。包括哪些步骤?如果我想从任何特定领域的文本中检索有意义的信息,并理解任何文本的一般概念。
另一个问题是,被分析的文本越大,结果越好?
原谅我的无知。我想了解更多,如果你建议一些教程或阅读材料,这将对我有很大的帮助。
发布于 2015-10-05 19:45:46
我建议丹尼尔·尤拉夫斯基和詹姆斯·H·马丁的“言语和语言处理”。最后一章是关于信息提取和总结。
至于你关于文本大小的问题,这取决于。根据我的经验,信息提取在短句中效果更好。但是,您需要一个大的数据集来训练您的系统识别相关模式。
https://stackoverflow.com/questions/32939186
复制相似问题