我一直试图构建一个预处理管道,但我正在努力为每一列生成一个索引列表,该列表是一个对象dtype。我已经能够使用以下代码将每个名称输入到数组中:
categorical_features = [col for col in input.columns if input[col].dtype == 'object']是否有一种简单的方法可以将这些列的索引从原始的输入数据easy输入到一个列表中,比如我手工构建的这个列表?
c = [1,3,4,5,6,7,8,9,10,11,12,14,15,16,17,18,19,20,21,22,23,24,25,28,29,
30,31,38,39,40,41,42,43,44,45,50,51,55,56]发布于 2022-03-13 17:02:08
我想你需要select.dtypes和enumerate
df = pd.DataFrame({'A' : ['A', 'B', 'C'], 'B' : [1,2,3], 'C' : [1, '2', '3']})
print(df)
A B C
0 A 1 1
1 B 2 2
2 C 3 3
idx_cols = [idx for idx, col in enumerate(df.select_dtypes('object').columns) ][0, 1]发布于 2022-03-13 17:00:57
使用df.select_dtypes + df.columns.get_indexer
categorical_features = df.columns.get_indexer(df.select_dtypes('object').columns)df.select_dtypes只返回指定的dtype列的df副本(您可以指定多个,例如,df.select_dtypes(['object', 'int'])).df.columns.get_indexer返回指定列的索引。发布于 2022-03-13 17:00:24
enumerate可以在这方面提供帮助:
categorical_features_indexes = [i for i, col in enumerate(input.columns) if input[col].dtype == 'object']https://stackoverflow.com/questions/71458916
复制相似问题