首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >H2O.ai H2O-3自动算法在AWS SageMaker:分类列上的分类

H2O.ai H2O-3自动算法在AWS SageMaker:分类列上的分类
EN

Stack Overflow用户
提问于 2019-10-20 01:08:30
回答 2查看 362关注 0票数 0

我正在尝试使用H2O.a的H2O-3 Automl算法在AWS SageMaker上使用控制台训练一个模型。

我的模型的目标是预测是否会根据年份、犯罪类型和地点进行逮捕。

我的数据有8列:

  • primary_type:enum
  • description:enum
  • location_description:enum
  • arrest:enum (真/假),这是目标column
  • domestic:enum (true/false)
  • year:number
  • latitude:number
  • longitude:number

当我在AWS上使用SageMaker控制台并使用H2O-3 Automl算法创建一个新的培训作业时,我将primary_typedescriptionlocation_descriptiondomestic列指定为绝对列。

然而,在培训作业的日志中,我总是看到以下两行:

代码语言:javascript
复制
Converting specified columns to categorical values:
[]

这使我相信,categorical_columns超参数中的training属性没有被考虑在内。

我每次都尝试使用日志中相同输出的以下超参数:

代码语言:javascript
复制
{'classification': 'true', 'categorical_columns':'primary_type,description,location_description,domestic', 'target': 'arrest'}
代码语言:javascript
复制
{'classification': 'true', 'categorical_columns':['primary_type','description','location_description','domestic'], 'target': 'arrest'}

我以为分类列的列表应该用逗号分隔,然后用逗号分隔成一个列表。

我期望在日志中输出分类列名列表,而不是空列表,如下所示:

代码语言:javascript
复制
Converting specified columns to categorical values:
['primary_type','description','location_description','domestic']

有人能帮我弄清楚如何让这些分类列应用到我的模型的培训中吗?

而且-我认为这是在我训练我的模型时运行的代码,但我还没有确认:https://github.com/h2oai/h2o3-sagemaker/blob/master/automl/automl_scripts/train#L93-L151

EN

回答 2

Stack Overflow用户

发布于 2020-02-28 16:33:41

这似乎是h2o包的一个bug。https://github.com/h2oai/h2o3-sagemaker/blob/master/automl/automl_scripts/train#L106中的代码显示它直接从超参数读取categorical_columns,而不是嵌套在训练字段下。然而,当将categorical_columns字段向上移动一个级别时,该算法无法识别它。所以解决不了这个问题。

票数 1
EN

Stack Overflow用户

发布于 2019-10-21 22:04:50

它似乎是基于下面的代码:https://github.com/h2oai/h2o3-sagemaker/blob/master/automl/automl_scripts/train#L106

该参数正在寻找逗号分隔的字符串。例如"cat,dog,bird"

我会尝试:"primary_type,description,location_description,domestic"作为输入参数,而不是['primary_type', 'description'... etc]

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58469273

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档