我读到Json或XML是非结构化数据;Json或XML数据还是用来标记数据的工具?
我从维基百科页面(https://en.wikipedia.org/wiki/Semi-structured_数据)了解到,半结构化数据是没有正式数据库结构的数据,但仍然有一些标记;
发布于 2018-12-03 16:19:48
JSON和XML不是工具。它们是数据格式。例如,要了解有关JSON的更多信息,可以查找RFC描述,该描述指定如何格式化JSON文件:
https://www.rfc-editor.org/rfc/rfc7159
它解释了如何标记数据。还有一些工具可以验证JSON和XML文件,看看它们是否符合需求,或者有一些工具可以将JSON转换成另一种格式,或者将JSON读入内存中,放入某个对象或类。
发布于 2018-12-03 16:24:18
欢迎来到现场!
JSON和XML是用于表示文本数据的文件格式,因此它们是表示文本数据的标准方法。由于它们是非常通用的,因此有许多更精确的格式可以在这些格式的基础上指定特定用途。由于XML已经存在了很长时间,因此很容易想到它的示例。考虑到HTML (事实上,HTML比XML松散,所以更正确的例子是XHTML,它是严格兼容XML的HTML的变体)和OpenDocument格式作为构建在XML上的文件格式的示例。
XML总是用于类似文档的结构,而JSON实际上表示的是一棵树,其中每个节点都是一个键值对。树中的分支是值是另一棵树的分支(或者如果您喜欢另一个JSON)。虽然人们可能不会发现这与XML有很大的不同,但格式创建者的初衷略有不同。
XML和JSON被认为是表示半结构化数据的文件格式,因为它们都代表分层(树状)结构中的数据。对于类似树状结构的示例,请考虑DOM,它表示层次结构,而通常用于HTML。它还可以更一般地归因于任何XML和JSON文档。
是否使用树状结构来表示非结构化或半结构化数据,可能会引起一些争论。在数据库上下文中,这些树也可以称为文档,其中关系数据库 (即SQL)被认为是结构化的。它们之所以被普遍认为是非结构化的,是因为类似树的结构是非常松散的限制,而且实际上,通过id引用(id-ref) -其他的,非典型的树子结构(如循环或快捷方式)也是可能的。此外,XML和JSON指定了这个通用结构,但没有指定它包含哪些标签或子结构。因此,它们通常被认为是非结构化的。
https://datascience.stackexchange.com/questions/42056
复制相似问题