我正在尝试使用特征工具来生成一些新的特征,这些新特征仅使用泰坦尼克号数据集的一些指定列。在我的例子中,我想对年龄、Pclass和log10splitfare做一个'add_numeric‘和'multiply_numeric’的转换。据我所知,我遵循了here提供的语法,但没有用。下面的代码不会出错,但它不会生成任何额外的列。我还使用了这个堆栈溢出link作为参考。
es = ft.EntitySet(id = 'Titanic')
es.entity_from_dataframe(entity_id = 'data', dataframe = ftdataset_cleaned,
make_index = False, index = 'index')
# Run deep feature synthesis with transformation primitives
feature_matrix, feature_defs = ft.dfs(entityset = es, target_entity = 'data',
trans_primitives = ['add_numeric', 'multiply_numeric'],
primitive_options= {('add_numeric', 'multiply_numeric'):{"include_entities": ['Age','PClass','log10SplitFare']}}
)发布于 2020-06-04 21:44:29
可以使用include_variables选项指定实体中用于特定基元的列
feature_matrix, feature_defs = ft.dfs(
entityset=es,
target_entity='data',
trans_primitives=['add_numeric', 'multiply_numeric'],
primitive_options={
('add_numeric', 'multiply_numeric'): {
'include_variables': {'data': ['Age', 'PClass', 'log10SplitFare']}}})This guide更深入地介绍了控制如何应用原语的不同方法。
https://stackoverflow.com/questions/62193884
复制相似问题