问为什么深度学习模式不符合加州房价数据呢？
EN

Stack Overflow用户

提问于 2019-06-23 05:07:31

回答 2查看 717关注 0票数 1

我刚开始深造，一般都是机器学习。我试图通过将8个特性中的每一个特性传递到一个5层网络和关于价格输出的培训来处理加利福尼亚房价数据集。我使用MSE损失和准确度作为度量，以2000年代为标准。损失开始是可以理解的大，减少到一定程度，并被困在相同的价值。对于所有的2000个历代，精度都保持在0。

我在网上看到了一些解决方案，比如把房间总数除以家庭数量来找出每个家庭的平均房间数。我看到这样的特性工程可以帮助模型更快地收敛，但是我希望模型能够在没有特性工程的情况下收敛。

据我所知，神经网络是函数逼近器，它从数据集的输入到输出建立一个函数。理想情况下，我希望它也能找到复杂的特性，比如在线解决方案中手工计算的特性。我有这些期望是错的吗？模型不收敛的原因是什么？

train_data = pd.read_csv('./sample_data/california_housing_train.csv', sep=',')
test_data = pd.read_csv('./sample_data/california_housing_test.csv', sep=',')

model = tf.keras.models.Sequential([
  layers.Dense(8),
  layers.Dense(5, activation=tf.nn.relu),  
  layers.Dense(7, activation=tf.nn.relu),  
  layers.Dense(5, activation=tf.nn.relu),
  layers.Dropout(0.2),
  layers.Dense(1)
])

model.compile(optimizer='adam', loss='mean_squared_error', shuffle=True, metrics=['accuracy'])

model.fit(train_data.values[:, 0:8], train_data.values[:, 8], epochs=2000)

输出