文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Numpy对数据进行分库以简化线性回归

问使用Numpy对数据进行分库以简化线性回归
EN

Stack Overflow用户

提问于 2017-02-17 10:04:09

回答 1查看 553关注 0票数 1

每个图像都标有左和右运动控制。我已经在下面的图表中绘制了它们。

我使用Keras和TensorFlow作为后端，使用ConvNets进行回归。

很明显，如果我能够删除可见回归左边的训练样本，回归可以变得简单得多。

加载图片和标签的代码非常简单，如下所示：

filenames = glob.glob("../data/*.jpg")

labels = []

images = []

for filename in filenames:
    # Timestamp-LeftMotorControl-RightMotorControl.jpg

    filename = filename.replace('.jpg', '')

    parts = filename.split('-')

    if float(parts[1]) == 0. or float(parts[2]) == 0.:
        continue

    images.append(filename)

    labels.append([float(parts[1]), float(parts[2])])

首先，有没有一种很好的方法从训练样本中剔除超出可见回归界限的数据？

此外，我在脑海中有一个不同的方法，那就是创建具有0到1边缘的100数据箱，然后从每个箱中抽取50个样本，以便我的数据是平衡的。

有没有一种numpy方法可以把数据放入容器中，这样我就不需要使用一些自定义函数了？

numpy

linear-regression

keras

conv-neural-network

python

回答 1

Stack Overflow用户

发布于 2017-02-17 10:30:57

回答第一个问题：

对整个数据集进行线性回归拟合
移除具有最大残差1和2的点，直到所有残差都适当地变小

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42288142

复制

相似问题

问使用Numpy对数据进行分库以简化线性回归
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Numpy对数据进行分库以简化线性回归EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Numpy对数据进行分库以简化线性回归
EN