对于语言标识,我使用以下教程:
执行命令后,如教程中所示:./ valid.txt测试langdetect.bin valid.txt
我有以下输出:n 10000 P@1 0.967 R@1 0.967
在此之后,哪些命令将预测语言?如何输入其他语言的文本?
我对这种语言检测非常陌生。我可以找到大量用于python预测的教程,但在linux命令行中找不到。
提前谢谢。
发布于 2019-10-10 11:32:48
语言检测是使用监督模型(在这里您可以找到教程)进行文本分类的一种特殊情况。
根据本教程,您可以通过键入以下内容来预测新的示例:
./fasttext predict-prob langdetect.bin - -1 0.5
(我们希望尽可能多的预测(参数-1),我们只想要概率更高或等于0.5的标签)
然后输入句子。
如果您有一个带有待分类句子的txt文件,您可以键入:
$ ./fasttext predict-prob langdetect.bin test.txt k其中k是要显示的类数。
这个小本子可能也很有用。
https://stackoverflow.com/questions/58319996
复制相似问题