我试图从不太自然的文本中提取实体(名称、地址、组织),比如银行电汇交易中的评论。使用NLTK、OpenNLP和CoreNLP显然效果不佳。
知道如何提高结果吗?
文字看起来像,
..。
参考研究工作或现有产品也会有所帮助。
发布于 2016-05-25 09:20:27
如果您正在使用opennlp,并且知道如何进行培训,您应该在培训数据中给出15000个示例,这些示例如下所示
<START:name> EVERITT <END> <START:Address> 620122T NAT <END> <START:Organisation> ABC INDIA LTD <END>
.......
....(15000 lines)然后你可以期待一些好的结果!
发布于 2016-05-06 17:02:10
在我看来,你得用字典/数据库。
您可以尝试使用这样的过程来生成一个程序:http://www.cs.columbia.edu/~mcollins/papers/eacl2014.pdf
但是你仍然需要有一种方法来定义候选的“短语”--论文中的例子,例如大写单词,在这里显然行不通。
https://stackoverflow.com/questions/37044399
复制相似问题