首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >半结构化数据的例子?

半结构化数据的例子?
EN

Data Science用户
提问于 2018-12-03 15:43:08
回答 3查看 2.4K关注 0票数 0

我读到Json或XML是非结构化数据;Json或XML数据还是用来标记数据的工具?

我从维基百科页面(https://en.wikipedia.org/wiki/Semi-structured_数据)了解到,半结构化数据是没有正式数据库结构的数据,但仍然有一些标记;

EN

回答 3

Data Science用户

回答已采纳

发布于 2018-12-03 16:19:48

JSON和XML不是工具。它们是数据格式。例如,要了解有关JSON的更多信息,可以查找RFC描述,该描述指定如何格式化JSON文件:

https://www.rfc-editor.org/rfc/rfc7159

它解释了如何标记数据。还有一些工具可以验证JSON和XML文件,看看它们是否符合需求,或者有一些工具可以将JSON转换成另一种格式,或者将JSON读入内存中,放入某个对象或类。

票数 1
EN

Data Science用户

发布于 2018-12-03 16:24:18

欢迎来到现场!

JSONXML是用于表示文本数据的文件格式,因此它们是表示文本数据的标准方法。由于它们是非常通用的,因此有许多更精确的格式可以在这些格式的基础上指定特定用途。由于XML已经存在了很长时间,因此很容易想到它的示例。考虑到HTML (事实上,HTML比XML松散,所以更正确的例子是XHTML,它是严格兼容XML的HTML的变体)和OpenDocument格式作为构建在XML上的文件格式的示例。

XML总是用于类似文档的结构,而JSON实际上表示的是一棵树,其中每个节点都是一个键值对。树中的分支是值是另一棵树的分支(或者如果您喜欢另一个JSON)。虽然人们可能不会发现这与XML有很大的不同,但格式创建者的初衷略有不同。

XML和JSON被认为是表示半结构化数据的文件格式,因为它们都代表分层(树状)结构中的数据。对于类似树状结构的示例,请考虑DOM,它表示层次结构,而通常用于HTML。它还可以更一般地归因于任何XML和JSON文档。

是否使用树状结构来表示非结构化或半结构化数据,可能会引起一些争论。在数据库上下文中,这些树也可以称为文档,其中关系数据库 (即SQL)被认为是结构化的。它们之所以被普遍认为是非结构化的,是因为类似树的结构是非常松散的限制,而且实际上,通过id引用(id-ref) -其他的,非典型的树子结构(如循环或快捷方式)也是可能的。此外,XML和JSON指定了这个通用结构,但没有指定它包含哪些标签或子结构。因此,它们通常被认为是非结构化的。

票数 1
EN

Data Science用户

发布于 2018-12-03 19:59:34

杰森XML是文件格式/文件类型,通常用于从网站或网页共享信息。JSON代表JavaScript对象表示法,而XML代表eXtended标记语言。

通常,在数据科学中,需要共享半结构化数据集,这类文件类型非常有用。共享半结构化数据集的选择在很大程度上取决于用户,使用这些格式也很容易与web框架进行接口。

数据可以存储在这些文件格式中,并可以解析为字典或DataFrame。DataFrames格式的结构化数据易于处理和使用。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/42056

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档