首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >H2O无人驾驶AI是否内置了对合并多个数据集和使用合并数据集进行培训的支持?

H2O无人驾驶AI是否内置了对合并多个数据集和使用合并数据集进行培训的支持?
EN

Stack Overflow用户
提问于 2020-10-06 06:46:31
回答 1查看 91关注 0票数 0

假设我们有三个数据集包含一个公司的数据。

  1. employee.csv:此数据集包含在公司工作的员工的详细信息,如员工ID、员工姓名、他所在部门的部门id、他来自哪个国家的国家代码以及他的年薪。
  2. dept.csv:此数据集包含有关公司部门的信息,如部门id、部门名称、部门专门化。
  3. country.csv:该数据集包含一些带有国家代码和国家首都的国家名称。

在H2O无人驾驶AI中是否有我们可以上传这些数据集(不使用python合并)并将其合并到H2O无人驾驶AI平台并使用重叠列进行培训的特性?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-10-12 06:33:41

是的,您可以使用数据配方来处理数据集(包括加入它们)。有关数据菜谱的更多信息,请参见文档。您可以创建连接数据集的菜谱。

代码语言:javascript
复制
# Let's join a `employee.csv` (X) to `dept.csv` (Y1) and `country.csv` (Y2)
# Define and read locations of datasets for Y1/Y2
Y_file_name1 = "./tmp/user/location_of_dept.csv.bin"
Y_file_name2 = "./tmp/user/location_of_country.csv.bin"
Y1 = dt.fread(Y_file_name1)
Y2 = dt.fread(Y_file_name2)

# Set key and join Y1
key1 = ["dept_id"]
Y1.key = key1
X = X[:, :, dt.join(Y1)]

# Set key and join Y2
key2 = ["country_code"]
Y2.key = key2
X = X[:, :, dt.join(Y2)]

return X

这个食谱作为将一个数据集连接到另一个数据集的示例。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64220636

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档