我用tf.data.dataset解决了两个问题:
我想知道是否有可能将tf.data.dataset转换为pandas数据帧?
此外,我想知道是否可以将tf.data.dataset用于其他模型(除了tf神经网络),例如,我可以使用tf.data.dataset来训练xgboost、LGBMClassifier、RandomForest分类器等。
你能帮忙吗?
发布于 2021-01-27 20:47:44
您可以使用tfds.as_dataframe
import tensorflow_datasets as tfds
import pandas as pd
iris_dataset, info = tfds.load('iris', with_info=True, split='train')
df = tfds.as_dataframe(iris_dataset, info)
df[['feature1','feature2', 'feature3', 'feature4']] = \
pd.DataFrame(df['features'].tolist(), index= df.index)
df = df.drop('features', axis=1)
df.head() label feature1 feature2 feature3 feature4
0 0 5.1 3.4 1.5 0.2
1 2 7.7 3.0 6.1 2.3
2 1 5.7 2.8 4.5 1.3
3 2 6.8 3.2 5.9 2.3
4 0 5.2 3.4 1.4 0.2或者更一般地,只是将数据集转换为NumPy数组,以便在另一个库中使用它。
https://stackoverflow.com/questions/65915295
复制相似问题