我一直在使用h2o.ai自动函数解决一些问题,并取得了相当大的成功,但遇到了一些障碍。
我遇到了一个问题,它使用500多个预测器(都是浮点数)映射到6个响应(同样都是浮点数)。
所需数据参数 y:这个参数是响应列的名称(或索引)。
3.16博士
自动化库似乎只处理一个响应。我是不是遗漏了什么?甚至在术语上?
在我不是的情况下,我的计划是构建6个独立的领导板,每个响应一个,并使用结果启动一个手动网络搜索。
理论上,我想我可以单独运行6种自动模型来获得矢量响应,但这感觉是一种奇怪的方法。
任何有洞察力的人都会感激的,干杯。
发布于 2017-12-27 12:29:12
不仅仅是AutoML,而且一般情况下,H2O只会让您预测一件事情。
如果没有更多关于这6个输出所代表的内容以及它们之间的关系的信息,我可以想到3种方法。
方法1:如您所建议的6不同模型。
方法2:训练自动编码器将6维压缩到1维.然后训练你的模型来预测这个单一的值。那就把它放回去。(例如,通过对培训数据的查找表(例如,如果您的模型预测1.123,并且1,2,3,4,5,6由1.122表示,以及3.14,0,3,14,0,0由1.125表示,您可以选择1,2,3,4,5,6,或这2种最接近的匹配的加权平均值)。(其他降维方法,如PCA,也是相同的想法。)
方法3:如果您的6个浮点数的可能组合是一个(相对较小的)有限集,则可以有一个显式查找表,用于N个类别。
我假设每个变量都是连续变量,这就是为什么它们是浮动的,所以我认为方法3将不如方法2。如果这6个输出之间的相关性/关系很小,那么方法1将是最好的。
https://stackoverflow.com/questions/47984428
复制相似问题