首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在机器学习模型中将位置代码表示为一个特征?

如何在机器学习模型中将位置代码表示为一个特征?
EN

Data Science用户
提问于 2018-07-30 19:52:55
回答 2查看 510关注 0票数 1

我试图预测地震后建筑物的破坏,数据集中包含“区域编号”作为特征。我认为这个特性在预测标签方面有着重要的意义,但我不知道如何最好地表示它。

有什么想法吗?

EN

回答 2

Data Science用户

回答已采纳

发布于 2018-07-30 20:10:04

你可以随心所欲地发挥创造力,但这里有两种对我有用的一般方法。

  1. 将数据聚为已知的地理区域,并创建虚拟变量。例如,在美国,一个人可以使用邮政编码。
  2. 找到已知集群的中心(即邮政编码),或者通过类似的无监督集群,使用经度和纬度。

你选择如何增加这些信息取决于你到底想要预测什么。

票数 1
EN

Data Science用户

发布于 2018-07-30 20:23:41

假设地区数字在它们所代表的事物中是绝对的,而不是序数,那么区域数字应该被表示为一个分类特征。最简单的方法是使用n个二进制变量来表示每个可能的区域。

为了提高结果,我也会尝试找到一个间隔类型的特性,比如纬度和经度。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/36220

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档