我有一个数据集,其中包含不同引擎的特性,显示它们何时失败。我想要建立一个监督学习模型,以预测一个发动机是否会有一定里程的故障。不幸的是,我有一些引擎从未失败的数据,我需要将它们添加到我的数据集中(这些引擎确实从未发生过故障,但它们将帮助模型更好地查看引擎的生存期)。有谁能帮我把这些非故障数据添加到失败数据中吗?
最好的
发布于 2019-09-05 16:44:52
据我所知,您希望将两个数据集组合起来用于培训?
如果是,您需要在另一个数据中附加一个数据。您需要确保培训所需的所有列/特性都存在于两个DFs中。在此之后,您可以简单地附加DFs。
Python示例:
>>> df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
>>> df
A B
0 1 2
1 3 4
>>> df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('AB'))
>>> df.append(df2)
A B
0 1 2
1 3 4
0 5 6
1 7 8https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.append.html
https://datascience.stackexchange.com/questions/58732
复制相似问题