LIBSVM有一个python函数grid.py,据我所知,它使用一个名为grid-search的方法应用参数选择。
用法: grid.py grid_options数据集
需要多长时间?我有一个巨大的数据集(csv文件,80K行),它需要超过24小时到现在。有办法让剧本写得更快吗?
发布于 2014-04-20 08:05:57
极限范围
-log2c {begin,end,step | "null"} : set the range of c (default -5,15,2)
-log2g {begin,end,step | "null"} : set the range of g (default 3,-15,-2)减少n倍交叉验证的次数。
-v n : n-fold cross validation (default 5)当然,仍然需要优化代码,但只需首先限制范围。
更新
尝试subset.py来减少数据集,然后运行grid.py。我会给你快速的洞察力!
发布于 2014-05-19 17:27:13
在grid.py中,您可以找到参数
telnet_workers = []
ssh_workers = []
nr_local_worker = 1可以在其中配置外部帮助程序和本地线程数。尝试增加本地线程的数量,直到您的计算机(接近) 100%加载。
https://stackoverflow.com/questions/23179775
复制相似问题