我试着运行一个简单的链s3-pipeline-redshift,但是我已经完全搞不懂输入数据格式了。这是我的文件:
1,丰田公园,伊利诺伊州布里奇维尤
2,哥伦布船员体育场,哥伦布,俄亥俄州
3,RFK体育场,华盛顿特区
4,CommunityAmerica棒球场,堪萨斯城,KS
5,吉列体育场,马萨诸塞州福克斯伯勒
新泽西州东卢瑟福,纽约巨人队体育场6号
7,BMO Field,多伦多,ON
8,The Home Depot Center,Carson,CA
9,Dick's体育用品公园,商业城,科罗拉多州
10,必胜客公园,Frisco,德克萨斯州
下面是我使用的表格:
create table venue_new(
venueid smallint not null,
venuename varchar(100) not null,
venuecity varchar(30),
venuestate char(2),
venueseats integer not null default '1000');当我使用|作为分隔符时,我收到错误1214 -找不到分隔符,当我使用逗号相同的东西时,当我将文件转换为utf-8时,我得到“无效的数字,值‘.,位置0,类型:短’”。我没主意了。那玩意儿到底有什么问题?有没有人可以给我输入文件的例子,或者告诉我哪里做错了?提前谢谢。附注:我还发现示例文件在bucket awssampledb中可用,但我不知道如何获取它们。
发布于 2014-02-20 19:37:01
基于文件示例中的数据。您需要记住,您的表中有5个字段,并且在任何数据中都没有第5个字段-但它是一个非空字段。复制命令需要引用语句开头提供的4列。
copy venue_new(venueid, venuename, venuecity, venuestate)
from 's3://mybucket/data/venue_noseats.txt'
credentials 'aws_access_key_id=<access-key-id>;aws_secret_access_key=<secret-access-key>'
delimiter ',';我发现上面的命令(来自AWS Docs COPY examples )对我很有效,让我在“venueseats”列中使用默认的1000。
https://stackoverflow.com/questions/21891056
复制相似问题