我是新来的。关于这个图书馆,我已经有几个问题了,对某些人来说,这些问题似乎是显而易见的,但我真的想得到正确的直觉。你的帮助将不胜感激。
首先,我要说的是文本分类部分。根据这里提供的教程,我们预测给定文本的不同标签。我们真的给给定的测试文本分配了每一个标签的概率是否符合这个标签呢?
第二个问题,是否有人能澄清/解释P@1 (精确度在1)和R@1 (回忆1)的含义,这是在Fasttext中使用的度量标准?我找到了一个答案,这里。但是这个答案引起了我更多的疑问:
在教程提供的例子中,P@1和R@1是什么,他们计算了P@5和R@5,对吗?
提前谢谢你,
发布于 2018-07-13 13:35:37
是的,不同的标签被分配了一个概率。通过运行以下命令,您可以看到每个标签的概率,其中my_model.bin和data.test被替换为适当的名称,k是数据集中标签的数量:
发布于 2019-03-26 15:51:19
首先,精度是正确预测的标签数量与模型预测的标签数量的比率,而@1是指时代。默认情况下,fastText运行5次。其次,召回是验证数据集中正确预测的标签数量与实际标签数量的比率。
例如:数据集中输入的实际标签: A,B,C,D,E
模型输入的预测标签: A,B,C,G
正确预测标签: A,B,C
精密度:3/4= 0.75
召回:3/5= 0.6
https://stackoverflow.com/questions/49159874
复制相似问题