文章/答案/技术大牛

发布

社区首页 >问答首页 >相关模型的算法建议

问相关模型的算法建议
EN

Data Science用户

提问于 2022-10-05 23:51:10

回答 1查看 23关注 0票数 0

我正在寻找关于如何继续预测独立但相关的模型的建议。

我将使用的例子是住房数据。我有三项投入：

纬度
经度
1-谷歌街景图像

我想要建立模型来预测这样的事情：

面积(回归)
房价(回归)
楼层数(分类)
出售与否(二进制)

数据集是有监督的，因此我们得到了7个特征。该模型在生产中将只有3个输入(lat，长，图像)。理想情况下，我们可以通过对每个模型使用6个输入特性来解决这种依赖，但是生产将只使用3个输入。

因此，如果我开始创建四个独立的模型(平方英尺，价格，地板，销售/不销售)，仅基于3个投入，我可能会遇到一些潜在的问题。例如，模型可以独立地预测一个小的面积和大量的地板在家里。因此，作为一个手动评审员，我可以这样说：“嘿，其中一个模型可能是错的，我希望它们能考虑到彼此的预测和信心水平。”

我试着在任何文献中读到这是如何做到的，但我真的找不到合适的术语来搜索。

到目前为止，我的想法：

可能只在三个具有四种多输出/输出类型的输入上创建一个模型，可能是某种类型的NN。
另一个想法是使用所有其他6个输入创建每个模型，并使用一个处理丢失数据的模型(朴素贝叶斯？)。
某种后集成模型，它可以查看所有四个模型的输出。

我确信这类问题以前在统计学学习中已经被研究过，我只是不知道该去哪里看。

model-selection

回答 1

Data Science用户

发布于 2022-10-07 03:32:21

总的来说，这是使用地理空间数据科学方法的一个主要机会。在某些情况下，它们比ML模型更复杂，有时更简单。

在这种情况下，如果你有足够的例子充分填充你整个研究区域的随机分布，你可以使用实际数据中的变量作为地图上的点，并在整个景观中创建有价值的网格，并使用它来插值你想要预测的四个独立结果的值。

QGIS，一个开源的地理空间建模应用程序和一些youtube搜索是解决这个问题的好地方。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/114948

复制

相似问题

问相关模型的算法建议
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问相关模型的算法建议EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问相关模型的算法建议
EN