我有一个包含950万条记录的事实表。该表使用distyle=key,并托管在具有2个“小”节点的RedShift集群上。
我在表上执行了许多更新和删除操作,不出所料,我看到“实际”行数远远超过9.5M。
因此,我在表上运行了vacuum,令我惊讶的是,在vacuum完成后,我仍然看到表分配的“行数”没有回到950万条记录。
你能告诉我这种行为的原因是什么吗?
解决这个问题的最好方法是什么?
我的shell中的一些复制-粘贴:
我所说的事实表:
select count(1) from tbl_facts;
9597184数据库中的“实际”记录数:
select * from stv_tbl_perm where id= 332469;
slice | id | name | rows | sorted_rows | temp | db_id | insert_pristine | delete_pristine
-------+--------+--------------------------------------------------------------------------+----------+-------------+------+--------+-----------------+-----------------
0 | 332469 | tbl_facts | 24108360 | 24108360 | 0 | 108411 | 0 | 1
2 | 332469 | tbl_facts | 24307733 | 24307733 | 0 | 108411 | 0 | 1
3 | 332469 | tbl_facts | 24370022 | 24370022 | 0 | 108411 | 0 | 1
1 | 332469 | tbl_facts | 24597685 | 24597685 | 0 | 108411 | 0 | 1
3211 | 332469 | tbl_facts | 0 | 0 | 0 | 108411 | 3 | 0(总共有近1亿条记录)。
非常感谢!
发布于 2014-10-14 02:16:58
我认为您需要对特定的事实表运行analyze。在运行vacuum (或任何其他更改行数的命令)之后,Analyze将更新链接到事实表的统计信息。
一定要让我们知道这是不是这样(我手头没有可以测试的表格) :-)
https://stackoverflow.com/questions/22869620
复制相似问题