我正在开发一个系统,它可以优化支持向量机(LIBSVM工具箱)的参数和最佳特性(输入)。我的优化技术是和谐搜索或遗传算法。在将数据插入到系统( Maxmin或美白)之前,我已将其规范化,因此您知道,我必须设置
-g gamma : set gamma in kernel function
-c cost : set the parameter C of C-SVC, epsilon-SVR, and nu-SVR我有一个金融数据库的二进制分类问题。此外,有时我还使用“PCA”等降维技术和其他技术。
那么,您建议的伽马参数和成本参数搜索间隔是多少?
第二个问题:你认为我应该用优化技术来优化LIBSVM的其他参数吗?
谢谢。
PS.我的核心函数是"RBF“
发布于 2014-05-12 11:37:12
那么,您建议的伽马参数和成本参数搜索间隔是多少?
基本上,你应该做一个启发式的网格搜索,通过对网格单元的大小进行一些有知识的猜测,希望找到一个好的最佳选择。查看LIBSVM包中的Grid.py文件。它将为您提供有关这些值的一些提示。有更先进的技术来做到这一点,但这是第一件值得尝试的事情。
第二个问题:你认为我应该用优化技术来优化LIBSVM的其他参数吗?
这取决于您选择的内核。请注意,γ并不会影响所有内核类型(例如,线性内核类型)。也许还有其他的东西你可以尝试调整,但从这两件事开始,看看它是如何进行的。
发布于 2014-05-12 23:56:50
我建议你看一下林利布线性的技巧和技巧博士提供的教程。除非您有很强的理由使用特定的内核,尝试使用所有可用的内核。同样,我也会尝试使用非规范化/非规模化的数据进行培训/测试。记住,这些(缩放)是启发式的,没有人知道您的需求的参数集是什么。探索一切。
https://stackoverflow.com/questions/23605729
复制相似问题