我在文本语料库注释工具上检查了这个老问题,那里有很多好的工具,但是那里的工具似乎没有解决我的问题。
我有一个线性的文本分割问题,在这个问题中,文本需要在不同的部分(主题)中被分割。我正在为它建立一个模型,但我没有训练数据。因此,团队决定手动标记一些文本,在代表每个部分的文本中对块进行注释。我尝试了一些NER或POS标签工具,但是它们不太方便选择几行和段落来注释标签。
是否有一个很好的文本切分的人工注释工具?
发布于 2018-04-20 08:03:44
由于找不到合适的工具,所以我制作了一个文本主题切分工具。
对于任何对这个问题感兴趣的人,我分叉了YEDDA的实体识别项目,并对其进行了相应的更改。您可以在GitHub:https://github.com/ThiagoSousa/YEEDASeg中查看它。我的项目叫做YEDDASeg。
编辑:人们提到使用BRAT,但是选择一个单词和带有标签的标签是很好的。我的情况有点复杂,因为它可以是很多段落。在YEDDASeg中,您只需单击文本并按一个键在文本中标注主题即可。为此目的,它更简单。
https://datascience.stackexchange.com/questions/30155
复制相似问题