首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >线性回归模型中未知参数估计的最佳方法

线性回归模型中未知参数估计的最佳方法
EN

Data Science用户
提问于 2015-06-01 13:10:41
回答 1查看 971关注 0票数 6

给出一些预测数据集,

例如,我有不同的房价预测数据:

数据集1: 100培训和100个测试样本,50个特征

数据集2:100个培训和100个测试样本,120个特性

数据集3:1000个训练和1000个测试样本,50个特征

数据集4:1000个训练和1000个测试样本,5000功能

如何从这些数据集的下列数据中选择最佳的方法来估计线性回归模型中的未知参数(预测价格)?

  • 普通最小二乘
  • 逐步回归
  • 主成分回归
  • 偏最小二乘回归

我应该一个接一个地对这些数据进行实验,并比较结果,还是根据数据集对何时使用它们有任何规则?

请帮帮忙

EN

回答 1

Data Science用户

发布于 2015-10-04 10:47:49

在数据处理之后,这是预测模型上最困难的任务。然而,为了回答这个问题,我们需要更多的细节。你说“最好的模特”是什么意思?你想要精确和长时间的训练吗?你需要速度快、精度低的东西吗?他们俩之间有什么事吗?你的特征是什么?你是刚刚拿走了它们,还是从它们中创建了新的特性?

无论如何,我建议您花一些时间阅读微软关于机器学习的完美教程。为了理解我的意思,本教程的一部分:

回归

  1. 序数回归:排序类别中的数据
  2. Poisson回归:预测事件数
  3. 快速森林分位数回归:预测分布
  4. 线性回归:快速训练,线性模型
  5. 贝叶斯线性回归:线性模型,小数据集
  6. 神经网络回归:精度高,训练时间长
  7. 决策森林回归:准确性,快速训练
  8. 增强决策树回归:准确性,快速训练

当我有一个类似的问题,我不知道选择哪一个时,我通常会根据微软的备忘单或科学知识-学习上的一个不同的算法得出3-4个不同的算法,试着所有这些算法,并选择一个或两个结果最好的算法。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/5973

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档