文章/答案/技术大牛

发布

社区首页 >问答首页 >Fit功能不能用灵活的类型执行减缩

问Fit功能不能用灵活的类型执行减缩
EN

Stack Overflow用户

提问于 2017-10-06 20:33:48

回答 1查看 728关注 0票数 0

我有42套公寓的面积和价格的数据集。我使用python和databricks，并以,作为列分隔符加载了一个csv文件。后来，我指定面积为整数，价格为双倍。然后导入图形库并进行回归：

import matplotlib.pyplot as plt
from sklearn import linear_model

后来，我读了我的数据库：

aptos=sqlContext.read.format('csv').options(header='true',
interSchema='true').load('/FileStore/tables/yl3r1mgv1507304115516/aptos_dataset-5ad32.csv')
display(aptos)

使用下面的行，我从数据库中创建了具有列的输入变量：

X=aptos.select("area").collect()
Y=aptos.select("precio").collect()

然后我创建了回归模型：

regr = linear_model.LinearRegression()

在这一点上我没有问题。但是当我运行以下一行时：

regr.fit(X,Y)

我得到了错误：

TypeError: cannot perform reduce with flexible type

我可以看到更多细节：

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<command-2158797891361999> in <module>()
      1 
      2 
----> 3 regr.fit(X,Y)

/databricks/python/local/lib/python2.7/site-packages/sklearn/linear_model/base.pyc in fit(self, X, y, sample_weight)
    517         X, y, X_offset, y_offset, X_scale = self._preprocess_data(
    518             X, y, fit_intercept=self.fit_intercept, normalize=self.normalize,
--> 519             copy=self.copy_X, sample_weight=sample_weight)
    520 
    521         if sample_weight is not None:

/databricks/python/local/lib/python2.7/site-packages/sklearn/linear_model/base.pyc in _preprocess_data(X, y, fit_intercept, normalize, copy, sample_weight, return_mean)
    197             else:
    198                 X_scale = np.ones(X.shape[1])
--> 199         y_offset = np.average(y, axis=0, weights=sample_weight)
    200         y = y - y_offset
    201     else:

/databricks/python/local/lib/python2.7/site-packages/numpy/lib/function_base.pyc in average(a, axis, weights, returned)
    933 
    934     if weights is None:
--> 935         avg = a.mean(axis)
    936         scl = avg.dtype.type(a.size/avg.size)
    937     else:

/databricks/python/local/lib/python2.7/site-packages/numpy/core/_methods.pyc in _mean(a, axis, dtype, out, keepdims)
     63         dtype = mu.dtype('f8')
     64 
---> 65     ret = umr_sum(arr, axis, dtype, out, keepdims)
     66     if isinstance(ret, mu.ndarray):
     67         ret = um.true_divide(

TypeError: cannot perform reduce with flexible type

对不起，我不能分享我的数据库。我是Python的新手，我对R有更多的专业知识，我会感谢你的帮助。

python

linear-regression

databricks

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-10-08 20:16:34

多亏了Abdou。在读取我的数据库时出现了键入错误，这是正确的方法：

    aptos=sqlContext.read.format('csv').options(header='true', inferSchema='true').load('/FileStore/tables/yl3r1mgv1507304115516/aptos_dataset-5ad32.csv')

现在回归起作用了：

regr.fit(X,Y)
Out[4]: LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46613560

复制

相似问题

问Fit功能不能用灵活的类型执行减缩
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Fit功能不能用灵活的类型执行减缩EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Fit功能不能用灵活的类型执行减缩
EN