我有一个包含市场信息的数据集。该数据集包含以下内容:市场数量、购买量、所有天数的平均购买量、跨天和跨市场的平均购买量以及该市场相对于所有市场的平均价格百分比。
数据如下所示:
market volume numPurchases transDate avgDailyPurchases AvgDailyPurchasesAll
JFK 500 32 20190102 50 75
JFK 500 60 20190103 50 75
ATL 450 40 20190102 40 75
avgPercentCheaperThanAll
.22
.22
.75我想做的是对市场进行排名。顶级市场的定义是,avgDailyPurhcases相对于其交易量高,而avgPercentCheaperThanAll也高。所以在上面的数据中,ATL将是一个比JFK更好的市场,尽管JFK有更多的avgDailyPurchases,ATL比所有的市场都便宜得多。
我尝试使用IMDB公式对电影进行排序,但我使用了自己的变量表示(例如:
weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
v = volume of market
m = minimum volume required to be in the list
R = avgDailyPurchases
C = AvgDailyPurchasesAll这给了我一个几乎很好的列表,但它缺少一个主要因素: avgPercentCheaperThanAll。我怎样才能把它加到方程中才能得到更好的结果呢?
发布于 2019-05-31 06:38:52
在设计评级方程或任何等式之前,应该考虑的几点是。
您将能够从上述步骤推导出所需的等式,并且该公式将对您更加清楚,并更适合您的情况。否则,您可以复制任何评分方程,并根据您的需要修改它,但每个等式将提供不同的结果,您将无法控制他们时,更多的输入变量到达。
希望这能有所帮助。
https://stackoverflow.com/questions/56388515
复制相似问题