我正在尝试使用CRFSuite,但我不知道如何使用示例/ner.py和pos.py
准确地说,我如何输入表单:
# Ner.py
fields = 'y w pos chk'或
# Pos.py
fields = 'w num cap sym p1 p2 p3 p4 s1 s2 s3 s4 y'例如,我可以从CoNNL模型中获得"y w pos“,但pos.py中的"chk”部分和所有这些字段我并没有真正得到。
另外,如果我有一个经过训练的模型,有没有办法用CRFSuite处理原始文本(没有所有这些标签)?
发布于 2013-07-18 06:11:48
@米歇尔是对的。此任务需要另一个数据集。我相信数据集已经在这里了:http://www.cnts.ua.ac.be/conll2003/ner/
发布于 2012-02-21 23:09:55
不能对本教程作者提供的数据使用ner.py或pos.py。您需要一个合适的CoNLL-2000数据集。:)
仅作为示例,您可以找到它的here
我希望我正确地回答了你的问题。
发布于 2014-09-25 18:07:29
事实证明,稍微修改pos.py文件来做它应该做的事情会更简单。现在pos.py的输入格式是'w y',而特性'num cap sym p1 p2 p3 p4 s1 s2 s3 s4'都是由脚本本身生成的。这应该可以解决pos.py问题。要点如下:
https://gist.github.com/fnl/21116fa57527946c5dbe
至于ner.py脚本,@Legend已经回答了,可以找到相关的输入数据格式,例如:
http://www.cnts.ua.ac.be/conll2003/ner/
https://stackoverflow.com/questions/8370366
复制相似问题