首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何判断一个问题是否应该使用回归或分类模型?

如何判断一个问题是否应该使用回归或分类模型?
EN

Data Science用户
提问于 2016-12-21 08:26:43
回答 3查看 2.9K关注 0票数 1

一旦我们知道这个问题需要用监督学习来解决,我们如何知道是否要用回归分析或分类算法来解决这个问题呢?有什么可以使用的拇指规则吗?

大部分资源在线给出了标准房价的回归模型和恶性/良性肿瘤地块的分类模型。这对我没多大帮助。

是否有概念方法来分析给定的问题?

EN

回答 3

Data Science用户

发布于 2016-12-21 09:14:16

一个好的经验法则是查看目标/响应变量的测量水平。如果在标称尺度上测量响应,那么这个问题就是分类问题。例如,名义上的价值是一个类别的标签,这些类别没有自然秩序,比如政治学中的政党,生物学中的物种,或者语法中的词类。

如果以比率或间隔尺度衡量响应,则存在回归问题。区间尺度上的值是指可以比较值之间的差值程度的值,但不能比较它们之间的比率,例如温度(在Farenheit或摄氏尺度上,但不能用开尔文),或者日历中的日期值。比例尺上的数值可以与差别程度和比率相比较,就像开尔文尺度上的质量、速度或温度等大多数物理量一样。

序数尺度更难放置在任何一个角落。我通常会说,你有一个排序问题的顺序反应。然而,排序问题可以使用两种分类,例如使用比较器,和回归,如序数回归。序数尺度上的值是有序的,或者是排序的,但是对于任何两个值之间的差异程度,你不能说任何有意义的东西,例如在一场比赛中赛车手的排名。

票数 7
EN

Data Science用户

发布于 2016-12-21 16:29:51

从一组示例中学习到xy的映射可以概念化为查找函数f,这样:

代码语言:javascript
复制
y = f(x)
x is vector of features, for e.g., car_model, car_version, city as vector of features for price prediction of used car.
y is output variable, for e.g., price of car x sold at.

如果y是连续的,则该问题是一个回归问题,如果y是离散的,则该问题是一个分类问题。

连续隐含y可以取实尺度上的任意值我,j,离散隐含y可以取{a,b,…,d}集合的值。

票数 1
EN

Data Science用户

发布于 2016-12-21 15:12:37

目标值是否已排序?那就很可能是倒退。

否则分类。

测量水平

示例

回归

  • 价格预测
  • 评级预测

分类

  • 预测用户的性别
  • 预测等级(狗,猫,房子,飞机,.)图像中的对象

然而,我要说的是,对于两门课来说,这并没有什么大的区别。在预测用户性别的情况下,您也可以预测用户是女性的可能性。这只是同一个问题的一个微小的变化(忽略)。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/15847

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档