CREATE TYPE name AS ( attribute_name data_type [, ... ] ) CREATE TYPE name ( INPUT = input_function, OUTPUT = output_function [ , RECEIVE = receive_function ] [ , SEND = send_function ] [ , ANALYZE = analyze_function ] [ , INTERNALLENGTH = { internallength | VARIABLE } ] [ , PASSEDBYVALUE ] [ , ALIGNMENT = alignment ] [ , STORAGE = storage ] [ , DEFAULT = default ] [ , ELEMENT = element ] [ , DELIMITER = delimiter ] ) CREATE TYPE name
CREATE TYPE 为当前数据库注册一个新的数据类型。定义该类型的用户成为其所有者。
如果给出模式名,那么该类型是在指定模式中创建。否则它将在当前模式中创建。类型名必需和同一模式中任何现有的类型或者域不同。因为表和数据类型有联系,所以类型名也不能和同模式中的表名字冲突。
第一种形式的 CREATE TYPE 创建一个复合类型。复合类型是通过一列属性名和数据类型声明的。这样实际上和一个表的行类型一样,但是如果只是想定义一个类型,那么使用 CREATE TYPE 就可以避免直接创建实际的表。一个独立的复合类型做一个函数的参数或者返回类型是非常有用的。
第二种形式的CREATE TYPE 创建一种新的基本类型(标量类型)。参数可以按任意顺序出现,而不是上面显示的那样,并且大多数都是可选的。它要求要在定义类型之前先用 CREATE FUNCTION 注册两个或更多个函数。支持函数 input_function 和 output_function 是必须的,而函数 receive_function, send_function, analyze_function 是可选的。通常,这些函数必须用 C 或者其它低层语言编写。
input_function 函数将该类型的外部文本形式转换成可以被该类型的操作符和函数识别的内部形式。output_function 用途相反。输入函数可以声明为接受一个类型为 cstring 的参数,或者接受三个类型分别为 cstring, oid, integer 的参数。第一个参数是 C 字符串形式的输入文本,第二个参数是该类型自身的 OID(数组类型除外,这种情况下它们接受自身元素的类型 OID),第三个是目标字段的 typmod(如果未知则传递 -1)。输入函数必须返回一个自身数据类型的值。通常,输入函数应当被声明为 STRICT ,否则当读取 NULL 输入时将被使用第一个参数为 NULL 进行调用,并且必须仍然返回 NULL 或报错。这个特性主要是为了支持域输入函数,这种函数可能需要拒绝 NULL 输入。输出函数必须被声明为接受一个新数据类型的参数,并且必须返回 cstring 类型。输出函数不会被使用 NULL 调用。
可选的 receive_function 把该类型的外部二进制表现形式转换成内部表现形式。如果没有提供这个函数,那么该类型不能用二进制输入。二进制格式应该选取那种比较容易转换同时还有一定移植性的内部格式。比如,标准的整数数据类型使用网络字节序作为外部的二进制表现形式,而内部表现形式则是机器的本机字节序。例如,接收函数应该声明为接受一个类型为 internal 的参数,或者是三个类型分别为 internal, oid, integer 的参数。第一个参数是一个指向一个 StringInfo 缓冲区的、保存接受字节串的指针;可选的参数和文本输入函数一样。接收函数必须返回一个该类型的数据值。通常接收函数应当被声明为 STRICT ,否则否则当读取 NULL 输入时将被使用第一个参数为 NULL 进行调用,并且必须仍然返回 NULL 或报错。这个特性主要是为了支持域接收函数,这种函数可能需要拒绝 NULL 输入。同样,可选的 send_function 把类型的内部表现形式转换为外部二进制表现形式。如果没有提供这些函数,那么类型就不能用二进制方式输出。发送函数必须声明为接收一个新数据类型并且必须返回 bytea 结果。发送函数不会被以 NULL 值调用。
这个时候你应该觉得奇怪,输入和输出函数怎么可以声明为返回新类型的结果或者是接受新类型的参数,而且是在新类型创建之前就需要创建它们。答案是类型必须被首先定义为一个壳类型,它只是一个除了名称和属主之外没有其他属性的占位符类型。这可以通过没有其他额外参数的 CREATE TYPE name 命令来完成。然后就可以引用该壳类型定义输入输出函数。最后,CREATE TYPE 把这个壳类型替换成完整的、有效的类型定义,这样就可以使用新类型了。
可选的 analyze_function 为该数据类型的字段执行与该类型相关的统计信息收集。缺省的时,如果该类型有个缺省的 B-tree 操作符类,那么 ANALYZE 将尝试使用该类型的"等于"和"小于"操作符收集信息。对于非标量类型,这种行为很可能不合适,因此可以通过提供一个自定义的分析函数覆盖它。分析函数必须声明为接收单独一个 internal 类型的参数,并且返回一个 boolean 结果。分析函数的详细 API 在 src/include/commands/vacuum.h 里。
尽管新类型的内部表现形式只有输入输出函数和其它你创建来使用该类型的函数了解,但内部表现形式还是有几个属性必须为 PostgreSQL 声明。internallength 是最重要的一个。基本数据类型可定义成为定长,这时 internallength 是一个正整数,也可以是变长的,这时用把 internallength 设为 VARIABLE 表示(在内部,这个状态是通过将 typlen 设置为-1 实现的)。所有变长类型的内部形式都必须以一个四字节整数开头,这个整数给出此类型这个数值的全长。
可选的标记 PASSEDBYVALUE 表明该类型的数值是按值而不是引用传递。你不能传递那些内部形式大于 Datum 类型尺寸(大多数机器上是 4 字节,有些是 8 字节)的数据类型的值。
alignment 参数声明该数据类型要求的对齐存储方式。允许的数值等效于按照 1, 2, 4, 8 字节边界对齐。请注意变长类型必须有至少 4 字节的对齐,因为它们必须包含一个 int4 作为第一个部分。
storage 参数允许为变长数据类型选择存储策略(定长类型只允许使用 plain)。plain 声明该数据类型总是用内联的方式而不是压缩的方式存储。extended 声明系统将首先试图压缩一个长的数据值,然后如果它仍然太长的话就将它的值移出主表,但系统将不会压缩它。external 声明禁止系统进行压缩并且允许将它的值移出主表。main 允许压缩,但是不赞成把数值移动出主表(如果实在不能放在一行里的话,仍将移动出主表),它比 extended 和 external 项更愿意保存在主表里。
如果用户希望字段的数据类型缺省时不是 NULL ,那么可以在 DEFAULT 关键字里声明一个缺省值(可以被附着在特定字段上的 DEFAULT 子句覆盖)。
用 ELEMENT 关键字声明数组元素的类型。比如,ELEMENT = int4 定义了一个 4 字节整数(int4)的数组。有关数组类型的更多细节在下面描述。
可用 delimiter 指定用于这种类型数组的外部形式的数值之间的分隔符。缺省的分隔符是逗号(,)。请注意分隔符是和数组元素类型相关联,而不是数组类型本身。
在创建用户定义数据类型的时候,PostgreSQL 自动创建一个与之关联的数组类型,其名字由该基本类型的名字前缀一个下划线组成。分析器理解这个命名传统,并且把对类型为 foo[] 的字段的请求转换成对类型为 _foo 的字段的请求。这个隐含创建的数组类型是变长并且使用内建的 array_in 和 array_out 输入和输出函数。
你很可能会问如果系统自动制作正确的数组类型,那为什么还要有个 ELEMENT 选项?使用 ELEMENT 的场合有二:你定义的定长类型碰巧在内部是一个一定数目相同事物的数组,而你又想允许这 N 个事物可以通过下标直接关联;某些操作符将把该类型当做整体进行处理。 比如,构成 name 类型的 char 成员就允许用这种方法关联。一个二维的 point 类型也可以允许其两个浮点型构成成员按照类似 point[0] 和 point[1] 的方法关联。请注意这个功能只适用于定长类型,并且其内部形式是一个相同定长域的序列。一个可以下标化的变长类型必须有被 array_in 和 array_out 使用的一般化的内部表现形式。出于历史原因,定长数组类型的下标从 0 开始,而不是像变长类型那样的从 1 开始。
将要创建的类型名(可以有模式修饰)
复合类型的一个属性(字段)的名字
要成为一个复合类型的字段的现有数据类型的名字
一个函数的名称,将数据从外部文本形式转换成内部格式。
一个函数的名称,将数据从内部格式转换成适于显示的外部文本形式。
把数据从类型的外部二进制形式转换成内部形式的函数名称
把数据从类型的内部形式转换成外部二进制形式的函数名称
为该数据类型执行统计分析的函数名
一个数值常量,说明新类型的内部表现形式的长度。缺省假定它是变长的。
该数据类型的存储对齐要求。如果声明了,必须是 char, int2, int4(缺省), double 之一。
该数据类型的存储策略。如果声明了,必须是 plain(缺省), external, extended, main 之一。
该类型的缺省值。若省略则为 NULL
被创建的类型是数组;这个声明数组元素的类型。
数组元素之间分隔符
用户定义类型名不能以下划线(_)开头而且只能有 62 个字符长,或者说是 NAMEDATALEN-2 个(而不是其它名字那样的可以有 NAMEDATALEN-1 个字符)。以下划线开头的类型名被解析成内部创建的数组类型名。
因为一旦类型被创建之后对它的使用就没有限制,所以创建一个基本类型就等价于授予所有用户执行类型定义中指定的各个函数的权限,同时该类型的创建者也将是这些函数的拥有者。这对于大多数类型定义中指定的函数来说不会造成什么不良问题。但是如果你设计的新类型在内部形式和外部形式之间转换的时候使用"敏感信息",那么你仍然要再三考虑、多加小心。
在 PostgreSQL 8.2 之前的版本中,并不存在 CREATE TYPE name 语法。创建新的基本类型之前必须首先创建其输入函数。这样,PostgreSQL 将会首先把新类型的名字看作输入函数的返回类型并隐含创建壳类型,然后这个壳类型将被随后定义的输入输出函数引用。这种老式的方法目前仍然被支持,但已经反对使用,将来可能不再支持。同样,为了避免函数定义中的临时壳类型偶然地搞乱系统表,当输入函数用 C 语言书写时,将只能用这种方法创建壳类型。
在 PostgreSQL 7.3 以前,要通过使用占位伪类型 opaque 代替函数的前向引用来避免创建壳类型。7.3 之前 cstring 参数和结果同样需要声明伪 opaque 。要支持加载旧的转储文件,CREATE TYPE 将接受那些用 opaque 声明的输入输出函数,但是它将发出一条通知并且用正确的类型改变函数的声明。
这个例子创建一个复合类型并且在一个函数定义中使用它:
CREATE TYPE compfoo AS (f1 int, f2 text); CREATE FUNCTION getfoo() RETURNS SETOF compfoo AS $$ SELECT fooid, fooname FROM foo $$ LANGUAGE SQL;
这个命令创建 box 数据类型,并且将这种类型用于一个表定义:
CREATE TYPE box; CREATE FUNCTION my_box_in_function(cstring) RETURNS box AS ... ; CREATE FUNCTION my_box_out_function(box) RETURNS cstring AS ... ; CREATE TYPE box ( INTERNALLENGTH = 16, INPUT = my_box_in_function, OUTPUT = my_box_out_function ); CREATE TABLE myboxes ( id integer, description box );
如果 box 的内部结构是一个四个 float4 的数组,可以使用
CREATE TYPE box ( INTERNALLENGTH = 16, INPUT = my_box_in_function, OUTPUT = my_box_out_function, ELEMENT = float4 );
来允许一个 box 的数值成分成员可以用下标访问。否则该类型和前面的行为一样。
这条命令创建一个大对象类型并将其用于一个表定义:
CREATE TYPE bigobj ( INPUT = lo_filein, OUTPUT = lo_fileout, INTERNALLENGTH = VARIABLE ); CREATE TABLE big_objs ( id integer, obj bigobj );
更多的例子,包括合适的输入和输出函数,位于节33.11。