跳到主要内容

在 Cloudberry Database 中创建和管理表

Cloudberry Database 中的表类似于其他关系型数据库中的表,不过表的行数据分布在不同 Segment 上。创建表时,你需要指定表的分布策略。

创建表

使用 CREATE TABLE 命令创建表并定义表结构。创建表时会定义:

  • 表的列及其关联的数据类型。请参阅选择列数据类型
  • 用于限制列或表的约束。请参阅设置表和列约束
  • 表的分布策略,用于定义 Segment 之间划分数据的依据。
  • 表在磁盘上的存储方式。
  • 大表的表分区策略。

选择列数据类型

列的数据类型决定了该列可以包含的数据类型。优先选择占用空间小,并能约束数据的最佳数据类型。例如,字符串使用字符类型,日期使用日期或时间戳类型,数字使用数字类型。

对于包含文本数据的列,建议指定为 VARCHARTEXT 类型,不建议指定为 CHAR 类型。在 Cloudberry Database 中,使用 VARCHARTEXT 类型,添加到数据中的填充(即在最后一个非空格字符之后添加的空格字符)被处理为重要字符,而在 CHAR 类型中则不视为重要字符。

对数值类型进行选择时,确保该类型能容纳列上的数值数据,还支持后续扩展,在满足这两点条件后,选择一个最小的数据类型。例如,如果 INTSMALLINT 类型就足以容纳数值数据,那么使用 BIGINT 类型就会浪费存储空间。请注意,如果预计数值会随时间扩展,在加载大量数据后,从较小的数据类型更改为较大的数据类型会产生高成本。例如,当前的数据值适合 SMALLINT,如果预计数据会扩展,则 INT 是更好的长期选择。

对跨表连接中的列,请使用相同的数据类型。跨表连接通常涉及一张表中的主键和另一张表中的外键。当数据类型不同时,数据库需要转换数据类型使之相同,以便能够正确比较数据值,但这将增加不必要的开销。

设置表和列约束

为表和列设置约束,可以限制表中的数据。Cloudberry Database 对约束的支持与 PostgreSQL 相同,但有一些限制,包括:

  • CHECK 约束只能引用其定义的表。

  • UNIQUEPRIMARY KEY 约束必须与表的分布键和分区键(如果有)兼容。

    注意

    不允许在 Append-Optimized 表上使用 UNIQUEPRIMARY KEY 约束,因为 Append-Optimized 表不支持这些约束所创建的 UNIQUE 索引。

  • FOREIGN KEY 约束是允许的,但不会强制执行。

  • 在分区表上定义的约束适用于整个分区表。不能在表的各个部分上定义约束。

检查约束

检查 (Check) 约束指定某个列中的值必须满足布尔(真值)表达式。例如,以下表中,price 列只能包含正数值:

=> CREATE TABLE products 
( product_no integer,
name text,
price numeric CHECK (price > 0) );

非空约束

非空约束指定某个列不能采用空值。非空约束始终写成列约束的形式。例如:

=> CREATE TABLE products 
( product_no integer NOT NULL,
name text NOT NULL,
price numeric );

唯一约束

唯一约束可确保某列或一组列中包含的数据相对于表中的所有行是唯一的。表必须是哈希分布的或复制的(而不是随机分布的)。如果表是哈希分布的,则约束列必须与表的分布键列相同或是其子集。例如:

=> CREATE TABLE products 
( product_no integer `UNIQUE`,
name text,
price numeric)
DISTRIBUTED BY (product_no);

主键

主键约束是 UNIQUE 约束和 NOT NULL 约束的组合。表必须是哈希分布的(而不是随机分布的),而主键列必须与表的分布键列相同或是其超集。如果表有主键,则该列(或列组)默认为表的分布键。例如:

=> CREATE TABLE products 
( `product_no` integer `PRIMARY KEY`,
name text,
price numeric)
` DISTRIBUTED BY (``product_no``)`;

外键

Cloudberry Database 不支持外键。虽然在数据库中可以声明外键,但不会强制执行参照完整性。

外键约束指定某列或一组列中的值必须与另一张表的某一行中的值匹配,以保持两个相关表之间的参照完整性。在 Cloudberry Database 的分布表 Segment 之间,无法强制执行参照完整性检查。

排除约束

排除约束确保如果使用指定的运算符在指定的列或表达式上比较任意两行,至少其中一个运算符比较将返回 false 或 null。语法为:

CREATE TABLE circles (
c circle,
EXCLUDE USING gist (c WITH &&)
) DISTRIBUTED REPLICATED;

与唯一约束类似,排除约束仅适用于复制的表或当分布键列是约束的一部分,使用与分布键的哈希运算符类似的 = 运算符。

分区表不支持排除约束。

请参阅 CREATE TABLE ... CONSTRAINT ... EXCLUDE 以查看详情。

添加排除约束会自动创建约束声明中指定类型的索引。