我有一个关于熵的解释的问题。对于我的数据集中的每个人,我都有一个17个字符(年份)的字符串/序列。我特别感兴趣的是在这个观察期内发生了多大的变化。
我正在考虑使用R的TraMineR包来计算序列内的熵。我知道这是可以归一化的,所以最大熵变成1(显然是最小的0 )。我的问题是,是否有任何经验法则来说明什么是高熵,什么是低熵(例如,在相关系数的情况下)。例如,0.4是高值还是低值?
谢谢。
发布于 2016-02-18 15:59:46
序列内熵是强烈依赖于上下文的。为了确定一个特定序列的熵是高还是低,我建议将其与其他序列的熵或平均内熵进行比较。
同样,一个组的平均序列内熵,将其与其他组的平均熵进行比较。例如,你可以得出这样的结论,比如女性的职业熵比男性更高。
https://stackoverflow.com/questions/35201565
复制相似问题