我想知道FastText是否能够处理多个标签的数据?有人能分享一个简单的例子和混淆矩阵(真实的和预测的标签)吗?我已经看过了FastText文档页面。
提前谢谢你
发布于 2022-03-13 19:01:03
处理多个标签的一种方便方法是对每个标签使用独立的二进制分类器。这可以用-loss one-vs-all或-loss ova来完成。
准备训练数据
在安装fastText一节的末尾已经描述了
文本文件的每一行都包含标签的列表,后面是对应的文档。所有标签都以___label ___前缀开头,这是fastText识别什么是标签还是什么是单词的方式。
发布于 2022-03-03 16:35:22
docs &提供标记文本的格式,似乎只提到每个文本一个标签。
您可以尝试在培训数据中多次重复相同的文本,每次使用适当的标签之一。(您可能需要重新洗牌培训数据,这样重复的文本就不会直接出现在彼此旁边。)
https://stackoverflow.com/questions/71338326
复制相似问题