首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TraMineR是否适用于具有不同序列长度的数据?

TraMineR是否适用于具有不同序列长度的数据?
EN

Stack Overflow用户
提问于 2020-09-18 23:12:42
回答 1查看 120关注 0票数 1

我的数据包含每个学生在学习会话期间的页面访问行为的顺序。例如(下面)学生1阅读说明,访问了三个页面(“访问-访问-访问”),并重新访问了其中一个页面(“重新访问”)。学生2阅读说明并访问了两个页面,没有任何重读。

学生1:说明-访问-重访

学生2:说明-访问-访问

学生3:

我的问题是,TraMineR包适用于这种类型的数据,其中不同的个体具有不同的序列长度(学生1有5,学生2有3,等等)。TraMineR vignette (https://cran.r-project.org/web/packages/TraMineR/vignettes/TraMineR-state-sequence.pdf)中讨论的样本数据"mvad“具有在特定时间段(93年7月至1999年6月)捕获的状态信息,这意味着所有个体的序列长度数量都是相同的。考虑到这种差异,我不确定是否可以使用TraMineR来分析我的数据。

我在我的数据上尝试了几个TraMineR函数(seqdef,seqfplot等)。到目前为止,这些结果对我来说是有意义的,但我想在进一步做更多事情之前确定一下(聚类分析等)。如果任何人有使用TraMineR处理这类数据的经验,我将非常感谢您的意见。如果TraMineR不适合这样做,有什么替代方法的建议吗?我的目标是识别和可视化数据中的主要行为模式,可能使用聚类分析。提前感谢!

EN

回答 1

Stack Overflow用户

发布于 2021-03-29 22:40:54

是的,您可以使用traMineR来分析具有不同序列长度的数据,因为traMineR是序列分析工具的集合。

当你有不等长的序列时,重要的是你使用的是什么距离算法。我认为最优匹配(OM)是默认的,也是经常使用的标准,它接受长度不相等的序列,因为它使用indel (插入/删除)操作来“使”序列具有相同的长度。然而,诸如汉明距离(HAM或DHD)之类的其它类型的距离算法不允许长度不等的序列。这些算法通常在计时很重要时使用,通过插入状态使序列长度相等,计时方面是不对称的。

所以简而言之,答案是肯定的,但请务必阅读您正在使用的距离算法的类型,以便您了解您正在测量的是什么,以及它将以何种方式影响您的解释。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63958397

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档