首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >非结构化数据是什么意思?在使用ETL工具处理数据方面?

非结构化数据是什么意思?在使用ETL工具处理数据方面?
EN

Stack Overflow用户
提问于 2015-09-01 17:29:06
回答 1查看 904关注 0票数 1

我和一个队友在讨论我们的工作经验,他说他在一个叫做Informatica的工具中工作。他的工作包括从EDI文件中提取所需的信息并进行转换,然后将它们加载到数据库中。他说,EDI文件具有非结构化数据,而不是像.CSV和.SQL这样的格式,而在EDI文件中,列由“\”符号分隔。

在我看来,EDI和CSV没有任何区别,只有CSV是',‘分离’和EDI是‘\’分开的,那么为什么EDI文件会被归类为非结构化数据呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-09-02 13:47:10

传统的EDI不是非结构化的。EDI通常遵循特定定义数据结构的某种标准(X12、EDIFACT、TRADACOMS等)。XML、CSV和分隔文件也是结构化的。它们有一个已定义的字段分隔符和一个记录终止符。

一个非结构化数据的例子是一个Excel文件,该文件具有多个专有格式的数据。不会有记录标识符,数据解析器也无法理解数据是什么。它将显示为数据/文本流,但映射程序不需要转换/集成任何上下文。一个词文档或PDF也可以被认为是“非结构化”。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32337612

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档