我和一个队友在讨论我们的工作经验,他说他在一个叫做Informatica的工具中工作。他的工作包括从EDI文件中提取所需的信息并进行转换,然后将它们加载到数据库中。他说,EDI文件具有非结构化数据,而不是像.CSV和.SQL这样的格式,而在EDI文件中,列由“\”符号分隔。
在我看来,EDI和CSV没有任何区别,只有CSV是',‘分离’和EDI是‘\’分开的,那么为什么EDI文件会被归类为非结构化数据呢?
发布于 2015-09-02 13:47:10
传统的EDI不是非结构化的。EDI通常遵循特定定义数据结构的某种标准(X12、EDIFACT、TRADACOMS等)。XML、CSV和分隔文件也是结构化的。它们有一个已定义的字段分隔符和一个记录终止符。
一个非结构化数据的例子是一个Excel文件,该文件具有多个专有格式的数据。不会有记录标识符,数据解析器也无法理解数据是什么。它将显示为数据/文本流,但映射程序不需要转换/集成任何上下文。一个词文档或PDF也可以被认为是“非结构化”。
https://stackoverflow.com/questions/32337612
复制相似问题