我正在处理一个大型数据集,我希望将其数据标准化,以便与CNN一起使用。
keras有没有一个快速的工具来标准化一个列的数字块,你可以在Sequential模型中使用它?我之所以这样问,是因为我希望最终数据能够在线使用,所以理想情况下,这种标准化功能可以用于传入数据,即均值和标准差的拖尾移动平均值,以标准化传入数据。
import numpy as np
import pandas as pd
np.random.seed(42)
col_names = ['Column' + str(x+1) for x in range(5)]
training_data = pd.DataFrame(np.random.randint(1,10 **6, 50).reshape(-1,5), columns = col_names)发布于 2020-06-25 07:16:48
我不确定在线,但使用sklearn的StandardScaler()应该做正确的事情,正如here所描述的那样,似乎是正确的事情。
发布于 2020-06-25 07:17:45
我们可以通过sklearn来实现
from sklearn.preprocessing import StandardScaler
training_data[:]= StandardScaler().fit_transform(training_data.T).Thttps://stackoverflow.com/questions/62565448
复制相似问题