首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用apache-pig在特定数据文件中加载具有多个分隔符的数据(仅在某些情况下

使用apache-pig在特定数据文件中加载具有多个分隔符的数据(仅在某些情况下
EN

Stack Overflow用户
提问于 2018-05-13 02:15:47
回答 1查看 10关注 0票数 0
代码语言:javascript
复制
150060275,NON-CRIMINAL,LOST PROPERTY,Monday,01/19/2015,14:00,MISSION,NONE,18TH ST / VALENCIA ST,-122.42158168137,37.7617007179518,"(37.7617007179518, -122.42158168137)",15006027571000
150098210,ROBBERY,"ROBBERY, BODILY FORCE",Sunday,02/01/2015,15:45,TENDERLOIN,NONE,300 Block of LEAVENWORTH ST,-122.414406029855,37.7841907151119,"(37.7841907151119, -122.414406029855)",15009821003074

在第二行,第三个字段之间有一个',‘,它不应该被当作delimiter.How,我要解决这个问题吗?

如果我使用STRPLIT(),那么它对第二行有效,但对第一行产生错误的结果。

EN

回答 1

Stack Overflow用户

发布于 2018-05-14 03:54:12

将其加载到单个字段中,将逗号和空格替换为|,然后在每行上使用strsplit。

代码语言:javascript
复制
A = LOAD 'data.txt' USING TextLoader() AS (line:chararray);
B = FOREACH A GENERATE REPLACE(line,', ','|');
C = FOREACH B GENERATE STRSPLIT(B.$0,',',13);-- Assuming there are 13 fields.

或者,您可以使用CSVExcelStoragePiggyBank

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50309335

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档