文章/答案/技术大牛

发布

社区首页 >问答首页 >请找几个主意

问请找几个主意
EN

Data Science用户

提问于 2023-05-19 16:07:44

回答 2查看 56关注 0票数 1

我有一些按邮区分列的数据，包括：

邮政编码
每平方英尺平均租金价值
品牌亲和力1
品牌亲和力2
品牌亲和力3
品牌亲和力4…诸若此类

品牌亲和力数据是从0到100之间的一个值，它显示居住在该邮政编码中的人与某个特定品牌的亲和力有多大。大约有50个品牌。

我对这个的灵感有点不足。有没有人对如何处理这些数据有任何想法？

具体而言-任何数据分析，ML

谢谢!

machine-learning

regression

data-science-model

data-analysis

回答 2

Data Science用户

发布于 2023-05-19 21:49:59

分析这些数据的一个想法是探讨平均租金价值与品牌亲缘关系之间的相关性。这可能涉及使用统计方法，如回归分析，看看这两个变量之间是否有关系。

此外，聚类算法可用于根据邮政区域的品牌亲密度对其进行分组，这可以提供对消费者行为的深入了解，并有助于确定不同品牌的潜在目标市场。

另一种方法是使用机器学习模型，如决策树或随机森林，根据其他变量(如平均租金值或人口数据)预测品牌亲缘关系。这可能对市场营销和广告目的有用。

票数 0

Data Science用户

发布于 2023-05-20 14:23:04

请注意，我对消费市场漠不关心。我对SARS-CoV-2的了解比人们通常理解的消费者品牌要多(我听说过可口可乐)。

因此--因为我不知道这些数据将如何运行--我会使用一种对方差、不平衡和稀疏数据鲁棒的算法。因此，它必须是XGBoost。不过，如果需要转换的话，我还是不知道。在我看来是标准的序数数据，所以没有。

如果您想确定哪些产品/品牌对邮编变化最敏感，以及与其他品牌选择相关的品牌类型：

XGBoost -精度，AUC-ROC，精确/召回/F1
特征选择
交互分析

邮编是针对品牌偏好进行培训的目标。会有丢失的数据，可能会有很多缺失的数据--不管怎么说，它都会工作的。因此，就像洗衣机可能排在第一位，最大的相关重量，简单地说，富有的邮编购买高端机器品牌，其他邮编购买经济型品牌。这可能与其他家用电器(如炊具和冰箱)形成互动。

数据类型可能是‘品牌’，所以只需将我的术语“炊具”转换为给定的“炊具/家用电器品牌”(我不知道任何炊具或家电品牌)。

对品牌选择的关注是，每个品牌内部都会出现频率问题，因此，对于数据的某些部分，方差将不是均匀的，而对于其他部分，则是同质的。我不知道，汽车-邮编在某些地区将购买更多的汽车更频繁。另一方面，像洗衣粉或牙膏这样的必需品可能是免税的。这需要考虑一下。

如果有成千上万的邮政编码这是行不通的，就需要有一个外部的标准--比如房价--将相等的邮政编码组合在一起。如果采用这种办法，就需要对地域偏见进行控制。如果有一定数量的邮政编码，那就好了。

一旦你有了自己的权重，那么某些消费者的选择在识别邮编方面有更强的分类能力，从而能够在未来针对某一特定的消费者选择目标广告之类的东西。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/121645

复制

相似问题

问请找几个主意
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问请找几个主意EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问请找几个主意
EN