首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法使用要素工具处理数据

无法使用要素工具处理数据
EN

Stack Overflow用户
提问于 2020-06-24 20:46:13
回答 1查看 44关注 0票数 0

这是我在尝试使用要素工具时的数据集

代码语言:javascript
复制
data
    Unit Price  Customer Name   Product Category    Region  Profit  Quantity ordered new    Sales   Order ID
0   2.88    Janice Fletcher Office Supplies Central 1.320000    2   5.90    88525
1   2.84    Bonnie Potter   Office Supplies West    4.560000    4   13.01   88522
2   6.68    Bonnie Potter   Office Supplies West    -47.640000  7   49.92   88523
3   5.68    Bonnie Potter   Office Supplies West    -30.510000  7   41.64   88523
4   205.99  Bonnie Potter   Technology  West    998.202300  8   1446.67 88523

9426 rows × 8 columns

returns
    Order ID    Status
0   65  Returned
1   612 Returned
2   614 Returned
3   678 Returned
4   710 Returned

1634 rows × 2 columns

users
    Region  Manager
0   Central Chris
1   East    Erin
2   South   Sam
3   West    William

代码语言:javascript
复制
entities = {
"data" : (data, "Order ID"),
"returns" : (returns, "Status"),
"users" : (users, "Manager")

}

代码语言:javascript
复制
relationships = [
('data', 'Order ID', 'returns', 'Order ID'),
('data', 'Region', 'users', 'Region')

]

代码语言:javascript
复制
combined_table, features_defs = ft.dfs(entities = entities,
                                  relationships = relationships,
                                  target_entity = "Unit Price")

combined_table

这就是我收到的错误消息

代码语言:javascript
复制
AssertionError: Index is not unique on dataframe (Entity data)

有人能告诉我我做错了什么吗?enter image description here

EN

回答 1

Stack Overflow用户

发布于 2020-06-26 03:17:56

每个实体上的索引值必须是唯一的。在您的数据实体上,所有订单ID值的indize都为空。

此外:

代码语言:javascript
复制
target_entity = "Unit Price"

将不起作用,因为您必须提供一个实体(数据、返回或用户),而不是表/实体的列。Featurtools在每次运行时只在一个表/实体上生成特征,而不是在所有表/实体上生成特征。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62555372

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档