在weka中运行SMO分类器时,如果我输入的训练标签为0和5 (二进制集合),那么在测试数据上运行分类器模型时,输出的是0到5之间的一些十进制值,在后面的步骤中会明显地分类到两个二进制标签中,还是没有中间的十进制值?
如果它们存在,如何获得这些中间十进制值?
(例如,在上面的模型中,smo/svm分类器是否在给定范围内分配1、2、3和4之类的值,或者其他一些小数/浮点值,然后将这些值适当地分组到0和5值类中)。
发布于 2016-06-27 03:19:56
在分类中没有“标签值”的概念。标签只是一个标识符,而不是可比较的对象,它被分配给你的问题中的特定实例。"0“和"5”也可以是“狮子”和“大象”。
特别是支持向量机(WEKA对科学界做了一件可怕的事情,让人们称支持向量机为SMO,因为这是内部使用的求解器算法...)每个标签都转换为"-1“和"+1”。在内部,支持向量机确实有支持的概念,因为它将线性投影您的数据点,从而从整个R (-inf,+inf)获得值,并根据符号分配标签。在非常粗略的意义上,这是一种模型的确定性(但是没有在任何概率意义上校准,因此" 0.01“除了”小于0.02“之外没有任何含义,但甚至不能说0.01比0.02的点更不确定,因为这些值没有合理的缩放比例。
在“纯”weka中,有返回这些值的classifier.distributionForInstance()。在weka explorer中的classify选项卡上,单击More options...并勾选Output predictions以获取它们。
https://stackoverflow.com/questions/38040949
复制相似问题