首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Informatica :平面文件读取问题

Informatica :平面文件读取问题
EN

Stack Overflow用户
提问于 2017-02-15 19:24:59
回答 3查看 1.8K关注 0票数 0

我需要从包含自由文本数据的平面文件中读取数据(即每列的列长为32000,文件中有8-9列)。由于列具有自由文本数据,因此用户可以在数据中添加任何可能违反分隔符的值,以防我在informatica映射中定义分隔符。此外,由于源码级别的字段长度很大,因此使用固定宽度属性并不容易。

有没有人能帮我一下,有没有办法在固定宽度的属性中定义分隔符?

数据示例:

Column1|自由文本字段1|自由文本字段2| John|你多大了?你住在哪里?|性别男性|女性,工作:是|否

EN

回答 3

Stack Overflow用户

发布于 2017-02-15 21:21:20

在您提供的示例中,您一开始使用管道作为分隔符,然后有人决定使用管道来指定备用值……这让你可以选择开发复杂的代码变通方法来适应这些异常(例如,在将平面文件读取到informatica之前对已知异常进行标记,然后在稍后的映射中取消标记它们),或者选择从设计空间获得协议,以避免使用管道来表示替代选择(可以使用/代替),并在freetext输入字段上进行验证,以禁止管道字符(也可以对现有模板进行一些修改,以防止输入这些字符)

票数 0
EN

Stack Overflow用户

发布于 2017-02-16 17:16:22

一种方法是使用复杂的多字符分隔符。我不确定您是否可以在源代码中强制执行这一点。

票数 0
EN

Stack Overflow用户

发布于 2017-02-21 08:18:42

你有9列,每列大小是32000,你的固定文件定义应该有1-32000|32001-64002|......|,加载平面文件后,你应该截断右边或左边的空格。

固定的平面文件将具有固定的列长度,您不能在固定格式中指定任何分隔符,如果您这样做了,那么它将不再是固定的文件格式。

谢谢MKrishnan

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42248009

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档