我已经调用python上的KS测试函数来比较两个特性:大小和持续时间,我在解释输出时有点不知所措。这是我的代码:
from scipy.stats import ks_2samp
import csv
ds1=getColumn("TraceBG.csv",5)
ds2=getColumn("TraceFG.csv",5)
ds11=getColumn("TraceBG.csv",6)
ds12=getColumn("TraceFG.csv",6)
print "size: | ",ks_2samp(ds1,ds2)
print "duration: | ",ks_2samp(ds11,ds12)我得到这个作为输出:
大小:x (0.25583333333333336,0.0039023335557401583) 持续时间:x (0.11504409325067666,0.092596990959821421)
我从KS-test的and网页上知道,第一个是统计值,第二个是p值。但是如何从这些值中确切地解释哪个特性更好呢??
发布于 2014-08-11 19:03:02
KS检验与一个零假设相关联:被比较的群体是从同一个群体中抽样的。
如果零假设为真,则p值为观察抽样组之间的特定偏差的概率。
对于尺寸,在0.3%的样本运行中,所观察到的偏差水平是预期的。
在持续时间内,偏离的程度是9%的时间。
什么特征更好?如果任务是试图区分一个群体和另一个群体,那么规模可能会更好。
https://stackoverflow.com/questions/25247315
复制相似问题