我有数据集,它被制表符分开,行以新行结束。每行包含5个选项卡分隔的数据。例如数据集,
XXXX1 XXXX2 XXXX3 XXXX4 XXXX5现在,我必须创建一个包含3列的表,前两列分别存储第一行的值XXXX1和XXXX2,第三列应该包含剩余的值XXXX3 XXXX4 XXXX5。
我使用下面的查询创建了表,但是在第三列中只保存了XXXX3,剩下的两个数据没有加载到表中。
create table x(
id string, name string,country string, emails string
) row format delimited fields terminated by '\t';请建议一下。
发布于 2017-08-17 20:35:07
('serialization.last.column.takes.rest'='true') 属性
create table x
(
id string, name string,country string, emails string
)
row format delimited
fields terminated by '\t'
stored as textfile
tblproperties ('serialization.last.column.takes.rest'='true')
;https://stackoverflow.com/questions/45742315
复制相似问题