当我们在Upsolver中创建蜂巢或雅典娜输出时,属性显示一个。这个属性到底是做什么的,我们应该把它设置为是还是不是?
发布于 2022-11-22 17:32:47
我们的建议是保留Yes,因为它提高了总体性能。
这适用于您的输出是Upsert输出时,我们建议使用Upsert分区字段= Yes。这样处理效率更高,并且在旧分区中维护历史记录。视图总是给出最新的记录。目录会自动更新,以指向最近的记录。例如,如果Upsert为userId,并且为同一个userId获得了新事件,则它将只支持当前分区(如果按日期进行分区,则让日日期分区)并更新目录,则不会触及旧日期分区中相同userId的历史记录。基础表将拥有所有记录,视图将拥有最新记录。
使用Upsert分区字段=否,最终只会维护大多数最近的副本(表/视图最终会有点相似),但是处理效率很低,因为来自旧分区的旧记录将被删除。
https://stackoverflow.com/questions/74536840
复制相似问题