文章/答案/技术大牛

发布

社区首页 >问答首页 >市场排序算法

问市场排序算法
EN

Stack Overflow用户

提问于 2019-05-31 04:02:13

回答 1查看 42关注 0票数 0

我有一个包含市场信息的数据集。该数据集包含以下内容:市场数量、购买量、所有天数的平均购买量、跨天和跨市场的平均购买量以及该市场相对于所有市场的平均价格百分比。

数据如下所示：

market volume  numPurchases   transDate  avgDailyPurchases  AvgDailyPurchasesAll  
JFK    500     32             20190102   50                 75
JFK    500     60             20190103   50                 75
ATL    450     40             20190102   40                 75

avgPercentCheaperThanAll
.22
.22
.75

我想做的是对市场进行排名。顶级市场的定义是，avgDailyPurhcases相对于其交易量高，而avgPercentCheaperThanAll也高。所以在上面的数据中，ATL将是一个比JFK更好的市场，尽管JFK有更多的avgDailyPurchases，ATL比所有的市场都便宜得多。

我尝试使用IMDB公式对电影进行排序，但我使用了自己的变量表示(例如：

weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 
v = volume of market
m = minimum volume required to be in the list
R = avgDailyPurchases
C = AvgDailyPurchasesAll

这给了我一个几乎很好的列表，但它缺少一个主要因素: avgPercentCheaperThanAll。我怎样才能把它加到方程中才能得到更好的结果呢？

machine-learning

statistics

algorithm

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-31 06:38:52

在设计评级方程或任何等式之前，应该考虑的几点是。

标识输入变量：可以理解它。 avgDailyPurhcases，AvgDailyPurchasesAll，avgPercentCheaperThanAll，音量，一个最小的音量阈值
规范了输入变量：从上述数据可以推断出，成交量在100年代左右，平均每日购买量为10倍，而较便宜的变量是小数。如果你试图在一个方程中直接使用这些变量而不进行归一化，那么你的评级就会有偏差，并且主要由体积因素驱动。因此，您应该考虑规范它们，使用这个链接来了解更多的规范化数据。
avgPercentCheaperThanAll赋值权值：您希望具有比avgDailyPurchases变量更高的偏好，这可以通过为变量分配适当的权重来实现。
定义关系：您应该考虑定义变量之间的关系，无论它们是否与您的评等直接相关或间接相关。
导出方程：最后一步是导出方程。从上面的步骤，这将是非常容易的，只要结合所有的关系，然后你将留下一个类型的方程:评级=变量1的权重*归一化变量1值+.等等。

您将能够从上述步骤推导出所需的等式，并且该公式将对您更加清楚，并更适合您的情况。否则，您可以复制任何评分方程，并根据您的需要修改它，但每个等式将提供不同的结果，您将无法控制他们时，更多的输入变量到达。

希望这能有所帮助。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56388515

复制

相似问题

问市场排序算法
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问市场排序算法EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问市场排序算法
EN