这可能是一种草率的方式来看待它,但我想知道,纵向数据集 (例如,在ggplot2中使用)的想法是否符合第一种范式中的数据标准。我知道后者来自关系数据库字段,但我会看到数据库中的实体,这是第一个正常的纵向数据格式。说得通吗?
发布于 2017-07-17 16:57:44
宽/胖/短和长/瘦/高都是多重抽样数据的有效表示,每个数据都有各自的优缺点。这两种表示都是R中的有效纵向数据集,也是关系数据库中的表。
有些人认为,一种或另一种形式违反了数据库规范化概念,但我没有看到。例如,有些人认为long/tall窗体重复或重复键(违反1NF),但我认为长窗体中真正的行键实际上是一个较大的复合键(即包含另一列),因此不违反第一范式,因为复合键不违反规范化。在宽格式中,对抽样数据的逻辑约束必须跨多个列进行复制,这是排序的重复,但并不违反第一范式。
总之,我们可以在数据库中看到宽的和长的表示,而不违反第一范式。
https://softwareengineering.stackexchange.com/questions/352944
复制相似问题