到目前为止,我只读过关于CRF的理论,我想在我的硕士论文中使用python crfsuite从食谱中提取成分。感谢您的每一次帮助。
据我所知,我可以以下面图片的形式向crfsuite提供训练数据,其中w提供当前单词的身份,wi相对于i的世界,以及相对于i的词性标签。

然后crfsuite根据给定的属性训练自己的特征函数。
但我找不到一种方法来提供自定义功能函数,如"wi在字典中“(例如,食谱成分字典)或”在句子中是一个否定“(例如,”不“或”不“)。
一般来说,好的教程很受欢迎,因为在我看来,手册(https://python-crfsuite.readthedocs.io/en/latest/或http://www.chokkan.org/software/crfsuite/manual.html)对初学者并不友好
发布于 2016-10-30 02:57:05
使用python-crfsuite (或sklearn-crfsuite)训练数据不一定要采用您所描述的形式;单个训练序列应该是{"feature_name": <feature_value>"}字典的列表,每个序列元素都有特征(例如,句子中的标记)。功能不一定是单词或POS标签。还有一些其他受支持的功能格式(请参阅http://python-crfsuite.readthedocs.io/en/latest)。
有关更完整的示例,请查看https://github.com/TeamHG-Memex/sklearn-crfsuite/blob/master/docs/CoNLL2002.ipynb -它使用自定义功能。
https://stackoverflow.com/questions/40263252
复制相似问题