如果我有一个包含“数字”的列,如果模式指定该列为整数还是字符串,那么存储成本是否会发生变化?
示例:我将数十兆字节的数字数据存储为字符串。如果我需要对该列执行数学运算,那么在查询时进行转换就很容易了。但是,如果我更改了模式,那么数据的存储方式会不会有任何不同,以便在休息时消耗更少的数据,从而降低成本呢?
发布于 2020-09-03 22:42:17
给定BigQuery电荷字符串/INT64 64列为
字符串2字节+ UTF-8编码字符串大小
INT64 =8字节
根据我的直觉,您不确定如何将数字数据编码成字符串,除非大多数数值小于16位,否则将它们作为字符串存储而不是以INT64的形式存储不会获得多大收益。
但是,如果您有较小的数字,这不仅节省了存储成本,而且还节省了查询成本,如果您用扫描过的字节付款,这可能比大量扫描数据更节省存储费用。
https://stackoverflow.com/questions/63731814
复制相似问题