我正在处理一个通过分析MFCC对鸟类进行分类的问题。我已经为两种鸟类建立了一个包含13个MFCC的数据集。我用朴素的Bayes & KNN模型训练数据。然而,当我尝试第三种鸟类的预测模型时,它被归类为这两种鸟类之一。我想知道如何才能将未知物种预测为未知数?我知道我现有的分类模式可能行不通。那么,什么样的模型可能会有帮助呢?SSL对我的情况有用吗?还是把这些未知数当作离群人?但如何将其应用于MFCC?
发布于 2020-08-23 08:44:02
如果你想预测一只鸟是属于你的两个类别中的一个还是未知的,你需要三个类别:[bird A, bird B, unknown]。对于未知类,您需要来自既不是bird A也不是bird B的鸟类的数据。您应该确保这三个类中的每个类的行数大致相同。
如果您没有鸟类的数据,既不是bird A,也不是bird B,您可以使用异常检测来检测鸟类是否是unknown,然后再预测是class A还是class B。
发布于 2020-08-23 13:49:11
我对MFCC没有太多的经验,但是你可以从图像处理中获得灵感,建立一个像模型一样的暹罗网络,在你的样本和不同的类之间给出一个距离度量。
然后,您可以选择最高的距离度量,并设置一个较低的阈值来将其归类为未知,如果现有的任何类都没有给出足够高的相似度。
之后,您所要做的就是分析未知的示例并创建一个jew类。
https://datascience.stackexchange.com/questions/80656
复制相似问题