首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >房价的数据集解释连续vs分类

房价的数据集解释连续vs分类
EN

Stack Overflow用户
提问于 2020-07-03 23:30:32
回答 1查看 41关注 0票数 0

我正在使用英国的房价数据集,并希望创建一个ML模型来预测基于城市(加上其他一些类别)的房价。

作为这一切的新手,我被难住了。我可以创建具有连续变量的模型,甚至可以对其他一些有4个不同选项(例如房屋类型)的类别执行一次性编码(虚拟变量)。

然而,当涉及到城市时,数据集中大约有1200个不同的城市,所以我不确定如何设计数据来处理这一问题。

非常感谢任何对此有任何想法的人!

不管我搜索了多少次,我都找不到答案,但这可能是因为我不知道到底要搜索什么。

EN

回答 1

Stack Overflow用户

发布于 2020-07-04 00:05:27

对我来说,你需要在每个城市有一个城市等级和一个房子的价格。

例如:

代码语言:javascript
复制
Country     | City Grade 
------------+------------
Los Angeles |    1
New York    |    4

House       | Price
------------+------------
Option1     | $200,000
Option2     | $300,000

然后根据城市等级乘以房价*城市等级计算出房价。

因此,这意味着在洛杉矶的Option1房子仍然是20万美元,但在纽约将是120万美元。

你不需要担心1200个城市,它很容易在数据库中查询。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62718526

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档