我有整个德国的零售数据,比如啤酒收入。现在,我想找到一种方法,根据每个城市的人均GDP和每个城市的消费支出,将这个数字划分为596个德国城市。在那之后,我可以得到德国每个城市的啤酒收入。
我的假设是:城市啤酒=城市消费支出*x+城市人均国内生产总值* y.然后城市啤酒之和=全国啤酒
你能建议一下用Python的哪种算法或一种方法吗?非常感谢。
发布于 2022-07-14 08:03:07
你的假设不太好。一些城市的啤酒消费占其总消费量的比例可能更大。
我认为一个更好的假设是,这是啤酒总消费量的一个可变部分,比方说,城市I消费占全国啤酒消费的一小部分,习在某种程度上依赖于GDP和城市消费。
要找到习,首先将GDP规模划分为三角洲、1-三角洲,三角洲是一个非常接近于零的正数,并保持其相对顺序。要做到这一点,考虑到最大的GDP是GDPmax,最小的GDP是GDPmin。然后,将每个GDPi映射到
scaleGDPi = (GDPi - GDPmin) *(1-2* delta)/(GDPmax-GDPmin) + delta。
以类似的方式,也将消费规模扩大到德尔塔,1-三角洲.
然后,考虑xi = scaleGDPi * scaleConsumationi *x,您将得到(城市啤酒)i= scaleGDPi * scaleConsumationi *x*国家啤酒。
通过强制规定城市啤酒的总和等于国家啤酒,你就可以得到:
X=1/ (sum scaleGDPi * scaleConsumationi)。
因此,城市啤酒= (scaleGDPi * scaleConsumationi *国家啤酒)/(sum scaleGDPi * scaleConsumationi)。
我认为这将是一个更充分的模型化你的问题。
发布于 2022-07-14 07:53:22
假设您有一些文件文本或csv中的销售数据,并根据我们可以在城市中划分的行进行一些列。
因此,您可以逐行读取此文件,并在字典中添加记录,该字典的键是您的城市名称或城市id,值可以是属于该城市的销售数据列表列表。所以现在这本字典会把你所有的销售数据都分在城市里。应该有点像
dict = {
'city1': [[col1,col2,col3],[col1,col2,col3],[col1,col2,col3]],
'city2': [[col1,col2,col3],[col1,col2,col3],[col1,col2,col3]]
}https://stackoverflow.com/questions/72976377
复制相似问题