首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用apache spark解析EDIFACT文件数据?

如何使用apache spark解析EDIFACT文件数据?
EN

Stack Overflow用户
提问于 2018-11-12 21:29:42
回答 1查看 566关注 0票数 1

有人能建议我如何使用Apache spark解析EDIFACT格式的数据吗?

我有一个要求,因为每天的EDIFACT数据将写入亚马逊网络服务s3桶。我正在尝试找到一种使用Apache spark将这些数据转换为结构化格式的最佳方法。

EN

回答 1

Stack Overflow用户

发布于 2018-11-12 22:28:12

如果您有EDIFACT格式的发票,您可以使用RDD将每个发票读取为一个字符串。然后,您将拥有一个代表分布式发票收款的RDDString。看看https://github.com/CenPC434/java-tools,您可以将EDIFACT字符串转换为XML.这个repo https://github.com/databricks/spark-xml展示了如何使用XML格式作为输入源来创建数据帧,并执行多个查询,聚合...等。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53263234

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档