过去几年,数据库与 AI 的融合一直是热门话题。但大多数方案都要求将数据导出到外部 ML 环境,处理完再写回。现在,PostgreSQL AI 运算符试图改变这一现状:直接在 SQL 中嵌入模型推理,让数据库自己变成 AI 引擎。
什么是 AI 运算符?
简单说,就是一组自定义的 SQL 函数和操作符,允许你在 SELECT、WHERE、ORDER BY 等子句中调用预训练模型。例如,similarity(embedding) > 0.8 或 predict(sentiment, text)。它们像普通运算符一样工作,但背后是 TensorFlow、PyTorch 或 ONNX 模型。
这并非一个官方 PostgreSQL 扩展,而是一个开源实验项目,由一群开发者基于 PostgreSQL 的 Foreign Data Wrapper 和 PL/Python 机制构建。目前支持文本嵌入、二分类、回归等常见任务。
核心用法与示例
安装后,你可以像使用内置函数一样使用 AI 运算符:
- 向量搜索:
SELECT * FROM items ORDER BY l2_distance(embedding, 'text') LIMIT 10; - 情感分析:
SELECT text, sentiment_score(text) FROM reviews WHERE sentiment(text) = 'positive'; - 实时分类:
UPDATE users SET segment = predict_segment(age, income);
这种模式最大的好处是消除数据搬运。所有推理在数据库进程内完成,延迟极低,且能利用 PostgreSQL 自身的索引和并行机制。
实际场景与价值
对数据科学家和 DBA 而言,这意味着更简单的架构。比如电商平台可以直接在订单查询中嵌入欺诈检测模型,无需单独搭建推理服务。再比如内容系统可以实时标记敏感文本,全部在 SQL 层面搞定。
不过,这并非万能。模型需要提前注册,且每个推理都会消耗数据库 CPU。对于高吞吐场景,可能还是需要专用推理引擎。
局限与展望
目前该项目仍处于 early stage,支持的模型格式有限,文档也偏少。另外,计算资源隔离是个问题:AI 推理可能拖慢其他查询。未来可能的改进方向包括 GPU 加速、模型热更新、以及更好的资源管控。
如果你已经在用 PostgreSQL,并且想快速尝试 AI 集成,这个项目值得一试。它展示了“数据不离库”的一种务实路径。











评论
暂无评论
成为第一个评论的人