由于以下几个原因,必须周期性运行 VACUUM 命令:
恢复那些由已更新或已删除的行占据的磁盘空间。
更新 PostgreSQL 查询规划器使用的数据统计信息。
避免因为事务 ID 重叠造成的老数据丢失。
对上面每个条件进行 VACUUM 操作的频率和范围因不同的节点而不同。因此,数据库管理员必须理解这些问题并且开发出合适的维护策略。本节的重点就放在解释这些高级别的问题;至于命令语法的细节,请参阅 VACUUM 命令手册页。
VACUUM 的标准形式可以和普通的数据库操作并发进行。诸如 SELECT, INSERT, UPDATE, DELETE 之类的命令可以照常运行,但诸如 ALTER TABLE ADD COLUMN 之类修改表定义的命令不行。另外,VACUUM 需要大量的 I/O 操作,可能导致其它活动中的会话性能严重降低。有一些配置参数可以用于缓解这个问题,参见节17.4.4获取更多信息。
在 PostgreSQL 8.1 中增加了一个自动执行 VACUUM 的机制,参阅节22.1.4。
在正常的 PostgreSQL 操作里,对一行的 UPDATE 或 DELETE 并未立即删除旧版本的数据行。这个方法对于获取多版本并发控制的好处是必要的(参阅章12):如果一个行的版本仍有可能被其它事务看到,那么你就不能删除它。但到了最后,不会有任何事务对过期的或者已经删除的行感兴趣。而它占据的空间必须为那些新行的使用而回收,以避免对磁盘空间的无休止需求。这件事是通过运行 VACUUM 实现的。
很明显,那些经常更新或者删除行的表需要比那些较少更新的表清理的更频繁一些。所以,设置一个周期性的 cron 任务 VACUUM 那些选定的表,并忽略那些已知变化比较少的表。这个方法只是在你拥有大量更新频繁的表和大量很少更新的表的时候才有意义,因为清理一个小表的额外开销根本不值得担心。
VACUUM 命令有两个变种。第一种形式,叫做"懒汉 vacuum"或者就是 VACUUM ,在表和索引中标记过期的数据为将来使用;它并不试图立即恢复这些过期数据使用的空间(除非位于表末尾并且很容易锁定此表)。因此,表文件不会缩小,并且任何文件中没有使用的空间都不会返回给操作系统。这个变种的 VACUUM 可以和通常的数据库操作并发执行。
第二种形式是 VACUUM FULL 命令。这个形式使用一种更加激进的算法来恢复过期的行版本占据的空间。任何 VACUUM FULL 释放的空间都立即返回给操作系统。但是,这个形式的 VACUUM 命令在进行 VACUUM FULL 操作的时候要求一个排他锁。因此,经常使用 VACUUM FULL 会对并发数据库查询有非常糟糕的影响。
标准形式的 VACUUM 最适合用于维护磁盘用量比较稳定的情况。如果你需要把磁盘空间归还给操作系统,那么你可以使用 VACUUM FULL ,不过如果释放的磁盘空间又会很快再次被分配就没什么意义了。如果维护更新频繁的表,那么中等频率的多次标准 VACUUM 方法比很低频率的 VACUUM FULL 更好。
对于大多数节点而言,我们推荐的习惯是在一天中的低使用时段安排一次整个数据库的 VACUUM ,必要时外加对频繁更新的表的清理。有些环境下,对那些更新非常频繁的表可能会每几分钟就清理一次。如果你的集群中有多个数据库,别忘记对每个库进行清理;vacuumdb 脚本可能会帮上你的忙。
如果你知道自己刚删除掉一个表中大部分的行,那么建议使用 VACUUM FULL ,这样该表的稳态尺寸可以因为 VACUUM FULL 更富侵略性的方法而显著减小。日常的磁盘空间清理,请使用 VACUUM 而不是 VACUUM FULL 。
如果你有一个表,它的内容经常被完全删除,那么可以考虑用 TRUNCATE 而不是后面跟着 VACUUM 的 DELETE 。TRUNCATE 立即删除整个表的内容,而不要求随后的 VACUUM 或 VACUUM FULL 来恢复现在未使用的磁盘空间。
PostgreSQL 的查询规划器依赖一些有关表内容的统计信息用以为查询生成好的规划。这些统计是通过 ANALYZE 命令获得的,你可以直接调用这条命令,也可以把它当做 VACUUM 里的一个可选步骤来调用。拥有合理准确的统计是非常重要的,否则,选择了恶劣的规划很可能降低数据库的性能。
和为了回收空间做清理一样,经常更新统计信息也是对更新频繁的表更有用。不过,即使是更新非常频繁的表,如果它的数据的统计分布并不经常改变,那么也不需要更新统计信息。一条简单的拇指定律就是想想表中字段的最大跟最小值改变的幅度。比如,一个包含行更新时间的 timestamp 字段将随着行的追加和更新稳定增长最大值;这样的字段可能需要比那些包含访问网站的 URL 的字段更频繁一些更新统计信息。那些 URL 字段可能改变得一样频繁,但是其数值的统计分布的改变相对要缓慢得多。
我们可以在特定的表,甚至是表中特定的字段上运行 ANALYZE ,所以如果你的应用有需求的话,可以对某些信息更新得比其它信息更频繁。不过,在实际中,这种做法的有用性是值得怀疑的。因为 ANALYZE 使用了统计学上的随机采样的方法进行行采样,而不是把每一行都读取进来,所以即使在大表上也是一项相当快的操作。
【提示】尽管用 ANALYZE 针对每个字段进行挖掘的方式可能不是很实用,但你可能还是会发现值得针对每个字段对 ANALYZE 收集的统计信息的详细级别进行调整。那些经常在 WHERE 子句里使用的字段如果有非常不规则的数据分布,那么就可能需要比其它字段更细致的数据图表。参阅 ALTER TABLE SET STATISTICS 。
我们对大多数节点都建议在每天的低使用时段安排一次数据库范围的 ANALYZE ,这个任务可以有效地和每天的 VACUUM 组合在一起。不过,这对那些表统计信息改变相对缓慢的节点可能会过于夸张,而且少一些的 ANALYZE 也足够了。
PostgreSQL 的 MVCC 事务语意依赖于比较事务 ID(XID)的数值:一条带有大于当前事务 XID 的插入 XID 的行版本是"属于未来的",并且不应为当前事务可见。但是因为事务 ID 的大小有限(在我们写这些的时候是 32 位),如果集群一次运行的时间很长(大于 40 亿次事务),那么它就要受到事务 ID 重叠的折磨:XID 计数器回到零位,然后突然间所有以前的事务就变成看上去是在将来的,这意味着它们的输出将变得可见。简而言之,可怕的数据丢失。实际上数据仍然在那里,但是如果你无法获取数据,这么说也只是自我安慰罢了。
周期性的运行 VACUUM 可以解决这个问题的原因在于 PostgreSQL 可以辨别特殊的 XID(FrozenXID)。这个 XID 总是被认为比任何普通的 XID 旧。普通的 XID 使用 模-231 算法进行比较。这就意味着对于每个普通的 XID ,总是有二十亿个 XID 是"更旧"以及二十亿个 XID "更新";表达这个意思的另外一个方法是普通的 XID 空间是没有终点的环。因此,一旦某行带着特定的普通 XID 创建出来,那么该行将在以后的二十亿次事务中表现得是"在过去",而不管我们说的是哪个普通 XID 。如果该行在超过二十亿次事务之后仍然存在,那么它就会突然变成在将来的行。为了避免数据丢失,老的行必须在到达二十亿次事务的年龄之前的某个时候赋予 FrozenXID 。一旦它被赋予了这个特殊的 XID ,那么它们在所有普通事务面前表现为"在过去",而不管事务 ID 是否重叠,因此这样的行不管保存多长时间,直到删除之前都会完好。这个 XID 的重新赋值是 VACUUM 控制的。
VACUUM 的行为由配置参数 vacuum_freeze_min_age 控制:任何比 vacuum_freeze_min_age 旧的 XID 将被替换为 FrozenXID 。较大的 vacuum_freeze_min_age 值防止了事务信息变长,较小的值增加了在表必须被清理之前经过事务的数量。
表在清理之前允许执行的最大事务次数是 20 亿减去上次清理时的 vacuum_freeze_min_age 值。如果超过这个限制就很可能造成数据丢失。为了保证数据安全,必须在任何可能包含旧于 autovacuum_freeze_max_age 指定的 XID 的表上调用节22.1.4中描述的 autovacuum 。甚至在 autovacuum 被禁用的情况下也可以调用。
这就意味着,一个未被清理的表将会在大约 autovacuum_freeze_max_age 减去 vacuum_freeze_min_age 次事务后被自动清理。对于那些周期性清理以回收空间的表来说,这个并不重要。对于静态表(包括只插入不更新/删除的表),因为不需要回收空间的清理,所以可以尝试最大化强制清理的时间间隔,也就是增加 autovacuum_freeze_max_age 的值或减少 vacuum_freeze_min_age 的值。
增加 autovacuum_freeze_max_age 的唯一不利之处在于数据库集群的 pg_clog 子目录将会占用更多空间,因为它必须为所有 autovacuum_freeze_max_age 之后的事务存储提交状态。每个事务提交状态使用 2 字节,因此如果 autovacuum_freeze_max_age 的值略小于 20 亿,pg_clog 将会增加到大约 500M 。如果这个尺寸比起你的数据库来只是小菜一碟,我们推荐你将 autovacuum_freeze_max_age 设为允许的最大值。否则,如何设置将取决于你愿意给 pg_clog 多大的空间。默认值是 2 亿,大约需要 50MB 的 pg_clog 存储空间。
减小 vacuum_freeze_min_age 的不利之处是可能导致 VACUUM 做无用功:如果行在不久之后就被修改,那么将 XID 修改为 FrozenXID 就是在浪费时间,因为它很快就将获得一个新的 XID 。因此这个设置应当足够大以使得行不被过早的冻结。减小 vacuum_freeze_min_age 的另一个不利之处是事务插入或修改行的准确细节将会很快丢失。这个信息有时迟早会派上用场,特别是数据库本扩之后分析究竟发生了什么错误的时候。因为这两个原因,在完全静态的表上减小这个值是不明智的。
为了跟踪数据库中最老的 XID 寿命,VACUUM 在系统表 pg_class 和 pg_database 里存储了事务 ID 统计。尤其是一个数据库的 pg_class 行中的 relfrozenxid 字段包含了最后一个 VACUUM 命令使用的冻结终止 XID 。系统保证在该数据库中所有比这个终止 XID 老的普通 XID 都被 FrozenXID 代替。同样,一个数据库的 pg_database 行中的 datfrozenxid 字段是普通 XID 的下界,它只是数据库中每个表 relfrozenxid 的最小值。检查这个信息的一个便利方法是执行下面的查询
SELECT relname, age(relfrozenxid) FROM pg_class WHERE relkind = 'r'; SELECT datname, age(datfrozenxid) FROM pg_database;
age 字段用于测量从中止 XID 到当前事务 XID 的数目。VACUUM之后,age(relfrozenxid) 应当立即使用稍微大于 vacuum_freeze_min_age 的值(比 VACUUM 启动之后开始的事务数目稍大)。如果 age(relfrozenxid) 超过 autovacuum_freeze_max_age ,将会很快在表上强制进行自动清理。
如果从表中清理旧 XID 失败,那么当数据库的旧 XID 到达 1000 万以后,系统将发出类似下面这样的警告信息:
WARNING: database "mydb" must be vacuumed within 177009986 transactions HINT: To avoid a database shutdown, execute a full-database VACUUM in "mydb".
如果忽略了上面的警告信息,那么系统将在距离重叠小于 100 万次的时候关闭,并且拒绝执行任何新的事务:
ERROR: database is shut down to avoid wraparound data loss in database "mydb" HINT: Stop the postmaster and use a standalone backend to VACUUM in "mydb".
这个 100 万的事务安全边界留下来用于让管理员在不丢失数据的情况下进行恢复,方法是手工执行所需要的 VACUUM 命令。不过,因为一旦进入了安全关闭模式,系统就不能再执行命令,做这件事情的唯一的方法是停止主服务器,使用一个单独运行的后端来执行 VACUUM 。关闭模式不会强制于独立运行的后端。参阅 postgres 手册获取有关使用独立运行后端的细节。
从 PostgreSQL 8.1 开始,系统带有一个额外的可选服务进程,叫做 autovacuum 守护进程,它的目的是自动执行 VACUUM 和 ANALYZE 命令。在打开这个选项之后,autovacuum 守护进程将周期性运行并且检查那些有大量插入、更新、删除行操作的表。这些检查使用行级别的统计收集设施;因此,除非把 stats_start_collector 和 stats_row_level 设置为 true ,否则无法使用 autovacuum 守护。还有,在为 superuser_reserved_connections 选择数值的时候,不要忘记给 autovacuum 进程保留一个槽位。
如果打开了 autovacuum 守护,那么它会每隔 autovacuum_naptime 秒钟运行一次。在每次运行时将选择一个数据库进行处理,并且检查其中的每个表,看看是否需要运行 VACUUM 或 ANALYZE 命令。
那些 relfrozenxid 大于 autovacuum_freeze_max_age 的表将总是被清理。否则将使用两个条件来决定使用哪个操作。如果上次 VACUUM 之后的过期行的数量超过了"清理阈值",那么就清理该表。清理阈值定义为:
清理阈值 = 清理基本阈值 + 清理缩放系数*行数 (vacuum threshold = vacuum base threshold + vacuum scale factor * number of tuples)
这里的清理基本阈值是 autovacuum_vacuum_threshold ,清理缩放系数是 autovacuum_vacuum_scale_factor ,行数是 pg_class.reltuples ,过期行的数量是从统计收集器里面获取的,这是一个半精确的计数,由每次 UPDATE 和 DELETE 操作更新。半精确的原因是在重负载时有些信息可能会丢失。为了分析,使用了一个类似的条件:分析阈值,定义为
分析阈值 = 分析基本阈值 + 分析缩放系数*行数 (analyze threshold = analyze base threshold + analyze scale factor * number of tuples)
它会和上次 ANALYZE 插入、更新、删除的总行数进行比较。
缺省的阈值和伸缩系数是从 postgresql.conf 里面取得的,不过,可以针对每个表独立设置,方法是在系统表 pg_autovacuum 里输入记录。如果 pg_autovacuum 里面存在针对特定表的行,那么就使用该特定的设置;否则使用全局设置。参阅节17.9获取有关全局设置的更多细节。
除了基本阈值和缩放系数之外,在 pg_autovacuum 里还有 5 个参数可以为每个表进行设置。首先,pg_autovacuum.enabled 可以设置为 false 让 autovacuum 守护进程完全忽略某个表。这种情况下,autovacuum 只有在为了避免事务 ID 重叠必须清理整个数据库的时候才会动那个表。接下来两个参数,清理开销延迟(pg_autovacuum.vac_cost_delay)和清理开销限制(pg_autovacuum.vac_cost_limit),用于针对特定的表为基于开销的清理延迟特性设置数值。最后两个参数(pg_autovacuum.freeze_min_age)和(pg_autovacuum.freeze_max_age),用于针对特定的表为 vacuum_freeze_min_age 和 autovacuum_freeze_max_age 设置数值。
如果在 pg_autovacuum 里某个数值为负数,或者在 pg_autovacuum 里就根本没有出现特定表的数据行,那么使用 postgresql.conf 里面对应的数值。
目前只能手工向 pg_autovacuum 表中 INSERT 记录。这个特性将在以后的版本中改进,并且这个系统表的定义也很有可能会改变。
警告 |
目前,pg_autovacuum 的内容没有被 pg_dump 和 pg_dumpall 工具创建的转储所保存。如果你想在转储/恢复的过程中保留它们,那么要确信手工转储了这个系统表。 |