我们已经暂存了外部阶段s3中的日志文件。暂存的日志文件位于CEF文件format.How中,用于解析来自阶段的CEF文件以将数据移动到snowflake?
发布于 2021-07-11 20:16:10
如果文件具有固定的格式(即有记录和字段分隔符,并且每条记录具有相同的列数),则可以将其视为文本文件并创建适当的文件格式。
如果文件是半结构化格式,那么您应该能够将其加载到变量列中--您是可以为每个文件创建多行,还是只创建一行取决于文件结构。如果每个文件只能创建一条记录,那么您可能会遇到文件大小问题,因为变量列具有最大文件大小。
一旦数据位于variant列中,您应该能够对其进行处理以从中提取有用的数据。如果有Snowflake可以处理的结构(例如xml或json),那么您可以使用原生功能。如果没有可识别的结构,那么您必须在存储过程中编写自己的解析逻辑。
或者,您可以尝试找到另一个工具,将您的文件转换为xml/json格式,然后Snowflake可以轻松地处理这些文件。
https://stackoverflow.com/questions/68335926
复制相似问题