首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何构建多元排名系统?

如何构建多元排名系统?
EN

Stack Overflow用户
提问于 2015-09-13 18:56:23
回答 1查看 1.3K关注 0票数 1

我在电子商务平台上有各种卖家的数据。我正在尝试根据各种特征来计算卖家排名分数,例如

1]订单完成率数字

2]订单取消率数字

3]用户评分1-5 { 1-2 :最差,3:一般,5:良好}分类

4)确认订单所需的时间。(越短越好的卖家)数字

我的第一个直觉是对所有特征进行标准化,然后将参数/特征乘以一定的权重。对于每个卖家得分,将它们加在一起。最后,根据这个分数找到卖家的相对排名。

我的卖家得分公式看起来像这样

卖家得分= w1*订单完成率-w2*订单取消率+ w3 *用户评分+ w4 *订单确认时间

其中,w1、w2、w3、w4是权重。

我的问题有三个方面

有没有更好的算法/方法来解决这个问题?也就是说,我线性添加了各种功能,我想知道更好的方法来建立排名系统?

如何获得权重的值?

除了使用上述功能,我能想到的更多的是正面与负面评论的比率,损坏商品的比率等。这些将如何适合我的评分方程?

如何结合数字和分类变量来寻找卖家排名得分?(我几乎没有分类变量)

有没有一种公认的方法来衡量这样的多变量系统?

EN

回答 1

Stack Overflow用户

发布于 2015-09-16 17:59:57

我建议采取以下方法:

首先,将所有可用的特性保存在一个矩阵中,无论您是否认为它们有用。

(提示:分类变量通过简单的编码转换为数值变量。因此,您可以轻松地合并它们(以您编码用户评级的确切方式)。

然后,您必须应用降维算法,例如奇异值分解(SVD),以保留最重要的变量。应用SVD可能会让您大吃一惊,知道哪些功能重要,哪些功能不重要。

在应用SVD后,为您决定保留的n个最重要的特征选择正确的权重,这真的取决于您,因为它纯粹是定性的,并且与领域相关,哪些特征更重要。

你可以用形式主义的方式计算权重的唯一方法是如果特征直接连接到某个东西,例如。收入。由于这很难做到,我建议手动应用权重,但对于归一化抖动,请设置:

w1 + w2 + ... + wn =1

也就是说,将“总重要性”拆分到您选择的特征。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32548952

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档