首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >aws athena-读取值包含逗号的csv文件

aws athena-读取值包含逗号的csv文件
EN

Stack Overflow用户
提问于 2021-08-13 10:58:05
回答 1查看 217关注 0票数 0

我有一张这样的桌子

代码语言:javascript
复制
CREATE EXTERNAL TABLE IF NOT EXISTS something (
  ...
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
   'separatorChar' = ',',
   'quoteChar' = '\"',
   'escapeChar' = '\\'
   ) 
LOCATION 's3://...'
TBLPROPERTIES ('has_encrypted_data'='false');

但有些字段包含逗号(8-10,99),不带引号。csv太大,无法在excel上打开。有没有办法改变分隔符或者让athena读这个文件?

EN

回答 1

Stack Overflow用户

发布于 2021-08-17 09:08:11

如果字段以逗号分隔,但包含逗号但没有转义,则任何自动化工具都无法区分表示字段之间的分隔符的逗号和表示内容的逗号。换句话说,这些文件格式不正确,必须进行修复。如果您可以选择再次生成文件,请确保字段包含引号,或者使用字段中不会出现的分隔符,例如制表符。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68771113

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档