文章/答案/技术大牛

发布

社区首页 >问答首页 >卡方和佐克-选择了哪一个？

问卡方和佐克-选择了哪一个？
EN

Stack Overflow用户

提问于 2014-11-25 05:40:49

回答 1查看 1.2K关注 0票数 0

我在stat stack exchange上发布了问题，但不幸的是到目前为止还没有得到答案，所以我在这里克隆了它，希望有人能帮上忙。

我是机器学习方面的新手。最近，我试图从中学到一些东西，并得到了以下的关注：

我有按类别分类的产品。此外，我有用户与性别和设备模型的信息。

首先，我做了一个卡方检验，以检查类别和性别+设备信息是否相关。例如，我的p值是0.000012，所以我说用户(性别+设备)与类别相关。

因此，如果一个新用户带着他的性别(女性)+设备(IPhone)而来：

作为卡方检验的结果，性别+设备与类别之间应该有关联。所以我选择了使用iPhone的女性消费的前10大类。我拿到了清单，例如: 1.时尚，2.移动设备. 3.照相机，4.家庭家具，5.自行车等。
我还对类别进行了z测试(没有任何用户信息)，并得到了列表(较高的z得分将位于榜首)，例如: 1.移动设备，2.自行车，3.时尚，4.笔记本电脑等。

那么在这种情况下，我应该给那个用户哪个列表呢？或者有没有可能把它们结合起来？还是我做错什么了？

预先多谢:-)

machine-learning

classification

recommendation-engine

chi-squared

回答 1

Stack Overflow用户

发布于 2014-11-25 11:24:27

严格地说，所有的测试都是不合适的。在这两个测试中，您都有一个空假设(性别和模式与类别无关)，并且您正在试图找出这个假设是错误的可能性。然而，这两种检验都是参数检验，即要使结果正确，就必须知道概率服从特定的分布(分别为卡方分布和正态分布)。在您的情况下，您不能作出这样的假设，所以测试是不合适的。如果你想使用显着性检验，你应该使用非参数检验，威尔克森和弗里德曼检验是最常见的。然而，在问题解决后，通常使用显着性测试来检查所取得的结果是否可以归因于运气。他们不是用来解决这个问题的。

如果你想要找出性别、模型和类别之间的相关性，应该使用一些相关系数，如Pearson相关和类内相关。但是，你还没有详细描述你的数据，所以我不知道你想要实现什么。基于性别和模式，您可以做的最安全和最简单的事情可能是返回使用iPhone的女性访问次数最多的类别(发生次数)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/27119526

复制

相似问题

问卡方和佐克-选择了哪一个？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问卡方和佐克-选择了哪一个？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问卡方和佐克-选择了哪一个？
EN