PostgreSQL 的扩展可能是 PostgreSQL 最棒的功能之一。这些扩展为您的数据库添加额外的功能,通过修改和增强某些过程的执行。比如,在表扩容到数十亿行时依然保持高性能,而不必麻烦地更换到另一个数据库。
PostgreSQL 扩展可以像内置功能一样被加载到数据库中,并且多年来,一个丰富的扩展生态系统已经形成,其中包括 各种各样的扩展,涵盖了各种使用场景。在这篇文章中,我们将教你如何安装扩展并列出可用的扩展,并介绍八个你应该了解的 PostgreSQL 扩展。
如何安装 PostgreSQL 扩展插件在介绍我们最棒的扩展之前,先来看看如何在PostgreSQL中安装扩展。扩展为PostgreSQL提供了额外的功能,例如数据类型、函数和操作符。以下是安装PostgreSQL扩展的一般步骤:
1. 连接 PostgreSQL 数据库。首先,你需要连接到你想要安装该扩展的PostgreSQL数据库。你可以使用psql

使用 psql (PostgreSQL 命令行工具) -U 用户名 -d 数据库名

将 username
替换为您的数据库名称。
SELECT * FROM extensions;
-- 查询可用的 PostgreSQL 扩展
SELECT * FROM pg_available_extensions;
3. 安装扩展:
命令。例如,要安装 hstore
CREATE EXTENSION hstore; -- 创建扩展 hstore
4. 检查安装.
SELECT * FROM pg_extension;
以下是一个安装 hstore
SELECT * FROM pg_extension WHERE extname = 'hstore';
安装 hstore
CREATE EXTENSION hstore; -- 创建扩展 hstore; 这行代码用于安装hstore扩展。
确认 hstore
SELECT * FROM pg_available_extensions WHERE name = 'hstore';
连接到 PostgreSQL 数据库:
psql -U postgres -d mydatabase
备注- 您需要超级用户权限才能创建扩展程序。
- 某些扩展可能还需要额外的设置和配置。
- 扩展文件需要安装在服务器上。大多数常见的扩展通常会与 PostgreSQL 一起提供,但是有些扩展可能需要您单独下载并安装。
现在,要列出已安装的扩展程序,可以使用 psql 命令行工具中的 \dx
命令。执行该命令后,PostgreSQL 将显示当前安装在您数据库中的所有扩展列表,如下所示:
名称 | 版本 | 模式 | 描述
pg_trgm | 1.4 | public | 基于三元组的文本相似性测量及索引搜索
postgis | 3.0.1 | public | 支持地理对象
timescaledb | 2.0.0 | public | 支持时间序列查询
hstore | 1.6 | public | 用于存储 (key, value) 的数据类型
uuid-ossp | 1.1 | public | 生成全局唯一标识符 (UUIDs)
plpgsql | 1.0 | pg_catalog | PL/pgSQL 过程语言
列显示了这个扩展名,您可以使用它来安装这个扩展。 -
列告诉您扩展的当前版本。 -
列显示了扩展对象将被创建的默认架构。 description
命令的底层 SQL 查询非常简单。要得到相同的结果,可以运行下面的 SQL 语句:
SELECT * FROM pg_available_extensions;
SELECT * FROM pg_extension;
/* 查询数据库中的所有扩展信息 */
请注意,这些只是已安装的扩展,并不包括来自你的 PostgreSQL contrib
SELECT * FROM pg_available_extensions;
-- 查询可用的PostgreSQL扩展
SELECT pae.* FROM current_setting('extwlist.extensions') AS cs(e) CROSS JOIN regexp_split_to_table(e, ',') AS ext(allowed) JOIN pg_available_extensions AS pae ON (allowed=name) ORDER BY 1;
-- 从当前设置中获取扩展列表,并将其与可用扩展进行交叉连接,最后按顺序排列结果。
你应了解的PostgreSQL八大扩展 1. PostGISpostgis将 PostgreSQL 转变为能够高效处理空间数据的数据库系统。它引入了额外的数据类型,如几何、地理和栅格等,以及一系列针对这些空间类型的功能和操作符,以及索引功能。
使用 PostGIS,PostgreSQL 获得了执行复杂位置查询的功能,从而成为一个功能丰富、性能强大且稳定可靠的强大空间数据库管理系统。
要将 PostGIS 安装到您的 PostgreSQL 数据库中,可以运行,

要将 PostGIS 安装到您的 PostgreSQL 数据库中,可以运行
CREATE EXTENSION postgis; -- 创建扩展 postgis
-- 2016年1月1日,有多少辆出租车在时代广场400米范围内接单,并按半小时的时间段进行分组?
-- 注意:时代广场的坐标为(纬度, 经度): (40.7589, -73.9851)
SELECT time_bucket('30 分钟', pickup_datetime) AS thirty_min, COUNT(*) AS near_times_sq
FROM rides
WHERE ST_Distance(pickup_geom, ST_Transform(ST_SetSRID(ST_MakePoint(-73.9851,40.7589),4326),2163)) < 400
AND pickup_datetime < '2016-01-01 14:00'
GROUP BY thirty_min
ORDER BY thirty_min
- [条记录 1] :--------------------
thirty_min | 2016-01-01 00:00:00
near_times_sq | 74
- [条记录 2] :--------------------
thirty_min | 2016-01-01 00:30:00
near_times_sq | 102
- [条记录 3] :--------------------
thirty_min | 2016-01-01 01:00:00
near_times_sq | 120
- [条记录 4] :--------------------
thirty_min | 2016-01-01 01:30:00
near_times_sq | 98
- [条记录 5] :--------------------
thirty_min | 2016-01-01 02:00:00
near_times_sq | 112
2. pg_stat_statements
跟踪 Postgres 数据库执行的查询的统计信息。它将帮助你调试查询,找出慢查询,并提供更深入的查询运行信息。这些统计信息可通过名为 pg_stat_statements
🔥 如果你在使用 Timescale 平台,你还可以利用 Insights 来识别慢查询并解决数据库问题。
创建扩展 pg_stat_statements;
SELECT 查询语句, 调用次数(次), 总耗时, 返回的行数, 共享块缓存命中数, 共享块从磁盘读取数
FROM pg_stat_statements
ORDER BY 共享块从磁盘读取数 DESC, 调用次数(次) DESC
LIMIT 5 行;
记录 1:
查询 | SELECT * FROM customer_data WHERE created_at > $1
调用次数 | 500
总运行时间 | 23000
返回记录数 | 500000
共享缓存命中次数 | 100000
共享缓存读取次数 | 75000
记录 2:
查询 | SELECT name, address FROM orders WHERE status = $1
调用次数 | 450
总运行时间 | 15000
返回记录数 | 450000
共享缓存命中次数 | 95000
共享缓存读取次数 | 55000
记录 3:
查询 | SELECT COUNT(*) FROM transactions WHERE amount > $1
调用次数 | 300
总运行时间 | 12000
返回记录数 | 300000
共享缓存命中次数 | 85000
共享缓存读取次数 | 50000
记录 4:
查询 | SELECT product_id FROM inventory WHERE quantity < $1
调用次数 | 400
总运行时间 | 16000
返回记录数 | 400000
共享缓存命中次数 | 80000
共享缓存读取次数 | 45000
记录 5:
查询 | SELECT * FROM user_logs WHERE user_id = $1 AND activity_date > $2
调用次数 | 350
总运行时间 | 17500
返回记录数 | 350000
共享缓存命中次数 | 75000
共享缓存读取次数 | 40000
列显示一个代表性语句的文本。 -
表示该语句被调用的次数。 -
表示该语句的总执行时间(以毫秒为单位)。 -
显示语句检索或影响的总记录数。 -
表示该语句缓存命中的次数。 shared_blks_read
表示该语句读取的共享块数量,这直接反映了 I/O 负载。
和 shared_blks_read
这两个字段对于 I/O 分析至关重要。shared_blks_hit
表示磁盘块已在内存中找到的次数(因此不需要进行 I/O 操作),而 shared_blks_read
表示磁盘块需要读入内存的次数,这表明实际进行了 I/O 操作。shared_blks_read
的高值表明这些查询是 I/O 消耗最大的,可以作为优化性能的起点。
pgcrypto 是一个扩展,它通过在数据库系统内部提供加密功能,从而增强 PostgreSQL。此扩展提供了一系列用于创建哈希、加密和解密数据的功能,使您可以在 PostgreSQL 中执行安全的加密操作。
要在 PostgreSQL 数据库中启用 pgcrypto,运行:
Pgcrypto 查询示例下面是如何使用pgcrypto来加密和解密数据。比如你想存储加密的用户密码。首先,在插入密码到表中时进行加密。
INSERT INTO users (username, password) VALUES ('john_doe', crypt('my_secure_password', gen_salt('bf')));
-- 将用户名和加密后的密码插入到users表中
是 pgcrypto 提供的一个加密函数,用来通过 Blowfish 算法加密密码,这由 gen_salt('bf')
SELECT username FROM users WHERE username = 'john_doe' AND password = crypt('input_password', password);
4. pg_partman
是一个扩展,用于简化您 PostgreSQL 表的创建及维护。分区是一种关键的数据库技术,,它通过将一个大表拆分成更易管理的片段,同时允许您像访问单个表一样访问这些数据。这是一套保持大型 PostgreSQL 表快速且易于管理的强大工具。
使用 pg_partman,PostgreSQL 可以根据时间、序列 ID 或自定义值等不同标准来管理分区。这简化了与分区相关的维护任务,比如创建新分区和清理旧分区。这种自动化尤其对那些快速增长的大规模时间序列数据集特别有用。
💡 Pg_partman 可以帮助管理分区,但是,锁定数据库表仍然需要手动操作。如果你在寻找一种全自动且无需锁定的解决方案来分区大型 PostgreSQL 表,有一个更简单的方法:使用 hypertables。
要在 PostgreSQL 数据库中安装 pg_partman,您运行:
执行以下SQL命令来安装pg_partman扩展程序:CREATE EXTENSION pg_partman;
咱们来看一个例子,你有一个装满了物联网设备数据的表,你想要每天把数据分开。下面就是怎么用 pg_partman
给名为 device_data 的表每天分个区。
-- 创建一个名为device_data的表
CREATE TABLE device_data (
time timestamptz NOT NULL,
device_id int NOT NULL,
data jsonb NOT NULL
-- 调用partman.create_parent来设置device_data表的每日分区
SELECT partman.create_parent('public.device_data', 'time', 'partman', 'daily');
在这种情况下,create_parent 是 pg_partman 提供的一个函数,它接受父表名和用于分区的时间列,以及模式(partman)和每日分区间隔。
设置好分区后,pg_partman 将帮助你管理这些分区——但如前所述,你可以看看 Timescale 的 hypertables,以获得完全自动化的、无忧无虑的分区解决方案。
5. postgres_fdw (一个PostgreSQL的外部数据包装器)postgres_fdw
模块允许您使用 Foreign Data Wrapper 访问位于远程 Postgres 服务器上的表(因此得名 "fdw")。Foreign Data Wrapper 使您能够创建代理以查询存储在其他 Postgres 数据库中的数据,就像这些数据是当前数据库中表里的数据一样。
Postgres_fdw 让你在两个 Postgres 实例之间整合数据变得简单。
- 你有一个Postgres实例(A),并且使用
来访问远程Postgres实例(B)上的数据。 - 然后你可以在数据库层面而不是在应用层面运行结合实例A和B数据的查询。
在您的 psql 命令行中运行以下命令来获取 postgres_fdw
CREATE EXTENSION postgres_fdw;
执行以下SQL命令来添加扩展(如果尚未存在的话): CREATE EXTENSION postgres_fdw IF NOT EXISTS;
CREATE SERVER myserver FOREIGN DATA WRAPPER postgres_fdw OPTIONS (host '', dbname 'postgres', port '5432');
CREATE USER MAPPING FOR postgres -- 创建用户映射,为服务器myserver设置用户postgres和密码。
SERVER myserver
OPTIONS (user 'postgres', password 'password');
创建模式 `schema1`;
从 `myserver` 导入外部模式 `public` 到 `schema1`;
导入后,您现在可以在本地数据库中访问这些外部数据库的表,比如下面的例子,我们访问了 metrics 表,就像下面的例子所示。
SELECT * FROM schema1.metrics
WHERE time < now() - '2天'::interval; /* 从schema1.metrics表中选择所有时间小于两天前的数据 */
记得当 myserver
🔥 如果你正在开发一个AI应用,可以看看Timescale Vector——它的速度比pgvector快40到1500%。
要将 pgvector
集成到您的 PostgreSQL 中,您可以运行以下 SQL 命令。
创建 vector 扩展;
-- 注意:扩展名实际是 vector,不是 pgvector
Pgvector 查询示例
假设你有一个数据库,其中存储了使用机器学习模型提取的图像特征的向量。你想找到与给定特征向量最相似的图像。你可以使用 pgvector
-- 假设我们有一个存储有图像特征向量的表
-- 表:image_features
-- 列:id(整数),features(向量)
-- 给定一个查询向量,找到最相似的5张图片
SELECT id, features
FROM image_features
ORDER BY feature <-> 'query_vector'::vector -- 通过向量间的距离来计算相似度
操作符由 pgvector 提供,表示 <->
是你要搜索的图像特征的向量表示形式。此查询根据 query_vector
和 features
是 PostgreSQL 中的键值对存储,是一个扩展插件,它允许你在单一的 PostgreSQL 数据类型中存储一组键值对。它设计用于高效处理松散结构化的数据,并且可以灵活适应不同数量的属性,而无需修改表的结构。
使用 hstore
的一个主要好处是能够为键值对建立索引,从而加快搜索和检索,这使得它非常适合处理半结构化数据或稀疏属性的数据。它支持 GIN 索引,可以加速对 hstore 数据中键值的查询。
要在 PostgreSQL 数据库中使用 hstore
CREATE EXTENSION hstore; -- 创建 hstore 扩展
这里是如何用 hstore
-- 创建一个带有 hstore 列的表,用于存储产品属性
CREATE TABLE products (
id serial PRIMARY KEY,
name text NOT NULL,
attributes hstore
-- 将一个具有属性的产品插入表中
INSERT INTO products (name, attributes)
VALUES ('智能手机', 'color => "黑色", storage => "64GB", battery => "3000毫安时"');
-- 查询具有特定存储属性的产品
FROM products
WHERE attributes @> 'storage => "64GB"';
运算符被用来查询 hstore
列,以找到存储键值为 "64GB" 的产品。这种查询在根据产品的某些属性子集搜索时非常有用。
是一个 PostgreSQL 扩展,它将 Perl 兼容的正则表达式 (PCRE) 集成到 PostgreSQL 中。它提供了高级的字符串匹配功能,尤其在 PostgreSQL 内置的正则表达式功能不足以应对复杂模式匹配需求时特别有用和实用。
此扩展特别适合需要复杂文本分析或处理的应用程序,例如解析日志文件、搜索文本内容或验证字符串格式。与标准的 PostgreSQL 文本函数相比,pgpcre 具有更多的正则表达式功能,包括但不限于高级前瞻和后顾断言功能、回溯控制动词功能以及复杂的字符类别定义等功能。这些功能在 PostgreSQL 内置的正则表达式函数中是不可用的。
将 pgpcre
添加到您的 PostgreSQL 数据库中,您可以执行:
-- 创建扩展pgpcre
注释:PGPCRE 查询示例
-- 假设我们有一个名为 messages 的表,其中包含一个名为 content 的列
-- 表:messages
-- 列:content (text)
-- 使用 pgpcre 匹配 content 中的电子邮件
SELECT content, pcre_match('^\S+@\S+
在这个查询里,`pcre_match` 函数是 `pgpcre` 扩展的一部分,用于从消息表中的每一行文本内容中匹配并提取电子邮件地址。`pcre_match` 函数的第一个参数的正则表达式模式表示一个简单的电子邮件地址格式的模式。
# TimescaleDB 是不是 PostgreSQL 的一个扩展?
是的!TimescaleDB 是另一个值得了解的顶级⭐️扩展。它通过自动分区功能、查询计划增强、改进的物化视图、列式压缩等功能,为 PostgreSQL 增加了查询和数据插入的性能提升,使其适用于如时间序列数据等数据密集型应用。它还包括库来简化分析和高级功能,例如作业调度器,。
如果你用自己的硬件运行 PostgreSQL 数据库,你可以直接安装 TimescaleDB 扩展。如果你想在 AWS 上使用 Timescale,你可以在 Timescale 平台上注册一个免费账户。这只需要几秒钟,不需要信用卡。
## TimescaleDB 示例查询语句:
-- 假设有一个名为 sensor_readings 的表,包含 time、device_id 和 temperature 列
-- 表:sensor_readings
-- 列:time (时间戳(带时区)),device_id (INT),temperature (双精度浮点数)
-- 计算设备 ID 为 1 的每小时平均气温
SELECT time_bucket('1 hour', time) AS one_hour_bucket,
AVG(temperature) AS avg_temperature
FROM sensor_readings
WHERE device_id = 1
GROUP BY one_hour_bucket
ORDER BY one_hour_bucket;
# 在 Timescale 中给您的数据库添加 PostgreSQL 扩展模块
我们非常喜欢 PostgreSQL 的丰富扩展生态系统,因此毫不意外地,我们努力让用户可以通过我们的云平台用户界面简单访问这些扩展。Timescale 控制台列出了您数据库服务上所有可用的扩展及其启用方法。

安装指南

查找

请求部分

PostgreSQL 扩展是绕过 PostgreSQL 限制并为您的数据库添加新功能的一个好办法。在这篇文章里,我们列出了八个有用的 PostgreSQL 扩展、示例查询语句以及安装说明。要了解更多这些和其他扩展的内容,请访问这里了解更多超越 Postgres 基础的内容。
本文由 Avthar Sewrathan 和 Bryan Clark 撰写,最初发布在 Timescale 官方博客的这篇文章里。[_这里_](。发布时间是 2023 年 11 月 10 日,最后更新于 2024 年 6 月 19 日。
, content) AS email
FROM messages
WHERE pcre_match('^\S+@\S+
