我在一个学术研究项目的背景下使用IBM Watson Personality Insights。
从到目前为止的分析,我注意到相同推文的原始分数和百分位数分数通常有很大的差异,在某些情况下,分数甚至在相反的两端(例如,宜人性原始分数: 0.21,宜人性百分位数分数0.76)。此外,在我的样本群体的总体水平上,百分位数得分的人格特质内的方差要高得多,而原始得分的方差非常低(每个性状的所有观察值都在0.1-0.2的范围内)。
我知道百分位数是归一化分数,对分数的解释是不同的。我的问题是,旨在将其应用于回归分析的研究人员通常使用哪个分数(例如,个人的个性特征-成功)?在我看到的应用人格洞察力的论文中,作者的论文没有讨论他们使用的分数。如果你对此有一些想法,并能与Personality Insights分享更详细地讨论他们的方法的任何研究,那就太好了。
非常感谢您的指导!
发布于 2018-09-07 22:02:48
你说得对,分数有不同的解释。原始分数就是这样,当归一化分数超过更大的总体时。虽然一个性状的原始分数的范围在0-1之间,但在实践中并不总是如此,并且分数可能集中在较窄的范围内。这就是为什么在上面的例子中,原始分数的一个小的变化可以在百分位数的分数中有更大的变化。
请注意,为了计算百分位数,我们为更大的人群(100k)运行了配置文件,在那里您将观察到这些趋势,这些趋势可能在较小的样本中不会显示。
至于你的另一个问题,你会使用哪个分数取决于。一般而言,大多数人使用百分位数得分,因为它可以让你了解给定人群与总体人群的比较情况。例如,如果我有兴趣了解一组人与另一组人的比较情况,使用百分位数得分更容易直观地理解差异( 25%的宜人性差异比0.1%的原始差异更容易理解,因为你不知道这是否显着)。另一方面,原始分数主要用于创建更大的模型并将PI分数用作1个特征时。在这种情况下,使用原始分数通常很有帮助,因为您可以从较大的模型中得出自己的结论。
https://stackoverflow.com/questions/52220604
复制相似问题