我有很多拼花文件。我需要通过Amazon读取它们,然后为正在读取的表提供列名。
问题是,拼花已经有了列名,正在被爬虫读取,并显示在表中。是否可以在胶水中为这些拼花文件提供我的列名?
发布于 2018-09-26 15:15:25
若要将检测到的列名替换为您自己的名称,您可以:
有关详细信息,请参阅Scala或Python ETL编程指南。
或者尝试手动更新数据目录字段名,如果不需要继续重新抓取数据(或者如果需要,则可以防止胶水爬虫通过爬行器配置更新现有的数据目录表)。
或者,如果您的需求更加离散,则可以使用map转换将DynamicFrame中的每个DynamicRecord转换为您选择的新DynamicRecord。
https://stackoverflow.com/questions/52425820
复制相似问题