我有一个由文本片段和相应标签组成的带标签的数据集。每个标签由三个部分组成,可以有多个或零个标签分配给给定的文本段。
Sample Data is given below:
text segment action performed person
--- --- --- ---
"I went outside to play and not drink." {play,drink} {yes,no} {1st,1st}
"He is not playing." play no 3rd
"The weather is cold today." N/A N/A N/A该任务是为任何给定的文本片段预测标签,其中每个标签由三个部分(动作、执行、人员)组成,并且一个文本片段可能有零个或多个标签。
有15个用于操作的分类器,两个用于执行的分类器,以及两个用于人的分类器。带注释的数据大小为6000个文本段,其中4000个文本段被分配至少一个标签。
这种类型的文本分类叫什么(不是多类标签)?
另外,对于这种类型的分类问题,推荐使用哪种分类方法?
发布于 2019-12-08 05:15:55
这不是一个分类问题。尽管您可能会为此目的而折磨分类模型,但您需要的NLP技术是“依赖关系解析”和“语义角色标记”。Spacy是一个很好的进行依赖解析的python库。
https://stackoverflow.com/questions/59227070
复制相似问题