在每个会话中第一次调用 PL/pgSQL 函数时,调用处理器分析函数源文本生成二进制指令树。该指令树完全转换了 PL/pgSQL 语句结构,但是在函数内使用的独立 SQL 表达式和 SQL 命令并未立即转换。
在每个函数中用到的表达式和 SQL 命令在函数里首次使用的时候,PL/pgSQL 解释器创建一个预备执行规划(使用 SPI 管理器的 SPI_prepare
和 SPI_saveplan
函数)。随后对该表达式或者命令的访问都将使用已准备好的规划。因此,一个在条件代码中有许多语句并且可能需要执行规划的函数,只需要准备和保存那些真正在数据库连接期间使用到的规划。这样可以有效地减少为 PL/pgSQL 函数里的语句生成分析和执行规划的总时间。不过有个缺点是在特定表达式或者命令中的错误可能要到函数中的那部分被执行的时候才能发现。
一旦在 PL/pgSQL 函数里为一个命令制定了执行计划,那么它将在该次数据库连接的生命期内复用该规划。这么做在性能上通常会更好,但是如果你动态地修改数据库模式,那么就可能有问题。比如:
CREATE FUNCTION populate() RETURNS integer AS $$ DECLARE -- 声明段 BEGIN PERFORM my_function(); END; $$ LANGUAGE plpgsql;
如果你执行上面的函数,那么它将在为 PERFORM 语句生成的执行计划中引用 my_function()
的 OID 。之后,如果你删除然后重新创建 my_function()
,那么 populate()
就会再也找不到 my_function()
。这时候你只能重新创建 populate()
或者至少是重新开始一个新的数据库会话,好让该函数能重新编译一次。另外一个避免这种问题的方法是在更新 my_function
定义的时候使用 CREATE OR REPLACE FUNCTION (如果一个函数被"替换",那么它的 OID 将不会变化)。
因为 PL/pgSQL 用这种方法保存执行规划,所以那些在 PL/pgSQL 里直接出现的 SQL 命令必须在每次执行的时候引用相同的表和字段;也就是说,你不能拿一个参数用做 SQL 命令中的表或者字段的名称。要绕开这个限制,你可以用 PL/pgSQL 的 EXECUTE 语句动态地构造命令,代价是每次执行的时候都构造一个新的命令计划。
【注意】PL/pgSQL 的 EXECUTE 语句和 PostgreSQL 服务器支持的 EXECUTE 语句没有关系。服务器的 EXECUTE 语句不能在 PL/pgSQL 函数中使用(而且也没必要)。
SQL 是 PostgreSQL 和大多数其它关系型数据库的命令语言。它是可以移植的,并且容易学习使用。但是所有 SQL 语句都必须由数据库服务器独立地执行。
这就意味着你的客户端应用必须把每条命令发送到数据库服务器,等待它处理这个命令,接收结果,对结果进行一些处理,然后再给服务器发送另外一条命令。所有这些东西都会产生进程间通讯,并且如果你的客户端在另外一台机器上甚至还会导致网络开销。
如果使用了 PL/pgSQL ,那么你可以把一块运算和一系列命令在数据库服务器内部组成一个块,这样就拥有了过程语言的力量并且简化 SQL 的使用,因而节约了大量的时间,因为不需要进行客户端/服务器通讯。
消除了服务器和客户端之间的往返通信
客户端不需要的中间结果无需在服务器端和客户端来回传递。
不需要额外的语法分析步骤。
比起不使用存储函数来,这样做能够产生明显的性能提升。
同样,在 PL/pgSQL 里,仍然可以使用 SQL 的所有数据类型,操作符和函数。
使用 PL/pgSQL 所写的函数能够接受服务器支持的任何标量或数组数据类型作为参数,并且同样能够返回这些类型的结果,它们还可以接受或者返回任意用名字声明的复合类型(行类型)。还可以声明一个返回 record 类型(行类型)的 PL/pgSQL 函数,这个行的字段是在调用它的查询中指定的,就像在节7.2.1.4里讨论的那样。
PL/pgSQL 函数还可以声明为接受并返回多态的 anyelement 和 anyarray 类型。一个多态函数实际操作的数据类型可以在不同的调用环境中变化,如在节33.2.5里讨论的那样。一个例子是节37.4.1。
PL/pgSQL 还可以声明为返回一个任何单个实例的"集"(set),或者表。这样的函数通过为结果集每个需要返回的元素执行一个 RETURN NEXT 生成它的输出。
最后,PL/pgSQL 函数可以声明为返回 void ,如果它没啥有用的东西可以返回的话。
PL/pgSQL 函数也可以声明为输出某种类型的参数,代替明确的返回类型声明。这么做并未给该语言增加任何基础设施,只是通常更方便些,特别是返回多行数值的时候。