我在hdfs中有ebcdic文件--我想加载数据以激发数据,处理它并将结果加载为orc文件,我发现有一个开源解决方案是cobrix 纤毛,它允许从ebcdic文件中获取数据,但是开发人员必须提供一个作为模式定义的版权文件。
我的ebcedic文件的几行显示在所附的图像中。我想得到ebcdic文件的文案格式,本质上我想读vin his的长度是17,vin_data的长度是3,最后是vin_val的长度是100。

发布于 2020-09-21 11:16:03
根据您在问题中的评论,并查看输入文件,您可以从以下内容开始。
01 VIN-RECORD.
05 VIN PIC X(17).
05 VIN-COUNT PIC S9(5) COMP-3.
05 VIN-VALUE PIC X(100).我猜第二个字段是COMP-3,基于这六个例子,都以C字节结尾。这表明一个正的COMP-3值.D字节将是负COMP-3值.一个F字节表示一个无符号的COMP-3值.
第三个字段是可变长度和右填充空格。
发布于 2020-09-21 10:46:49
如何定义ebcdic数据的文案文件?
你没有。
抄写簿可以用作记录定义(=如何存储数据),它与可能存储在其中的数据的编码无关。
这就产生了一个问题:“如何定义记录结构?”
您需要字段的数量、它们的长度和类型(可能不仅仅是USAGE DISPLAY),然后用一些花哨的名字来定义它。理想情况下,您只需要从编写文件的COBOL程序中获得原始记录定义,如果它还没有在其中,则将其放入一个文案中,并使用它。
你的链接有样本,它显示了一个文案的样子,如果你在定义上挣扎,那么请用你定义的文案来编辑你的问题,我们也许能帮上忙。
https://stackoverflow.com/questions/63990208
复制相似问题