PostgreSQL AI 运算符: 在数据库内直接运行AI推理

Hannah Foster

2026年6月20日

original

PostgreSQL 社区推出的 AI 运算符扩展，允许用户在 SQL 查询中直接调用机器学习模型，实现文本分类、情感分析、向量嵌入等操作。无需移动数据，即可将 AI 能力融入现有数据库工作流。本文介绍了其核心功能、使用场景和开发注意点。

过去几年，数据库与 AI 的融合一直是热门话题。但大多数方案都要求将数据导出到外部 ML 环境，处理完再写回。现在，PostgreSQL AI 运算符试图改变这一现状：直接在 SQL 中嵌入模型推理，让数据库自己变成 AI 引擎。

什么是 AI 运算符？

简单说，就是一组自定义的 SQL 函数和操作符，允许你在 SELECT、WHERE、ORDER BY 等子句中调用预训练模型。例如，similarity(embedding) > 0.8 或 predict(sentiment, text)。它们像普通运算符一样工作，但背后是 TensorFlow、PyTorch 或 ONNX 模型。

这并非一个官方 PostgreSQL 扩展，而是一个开源实验项目，由一群开发者基于 PostgreSQL 的 Foreign Data Wrapper 和 PL/Python 机制构建。目前支持文本嵌入、二分类、回归等常见任务。

核心用法与示例

安装后，你可以像使用内置函数一样使用 AI 运算符：

向量搜索：SELECT * FROM items ORDER BY l2_distance(embedding, 'text') LIMIT 10;
情感分析：SELECT text, sentiment_score(text) FROM reviews WHERE sentiment(text) = 'positive';
实时分类：UPDATE users SET segment = predict_segment(age, income);

这种模式最大的好处是消除数据搬运。所有推理在数据库进程内完成，延迟极低，且能利用 PostgreSQL 自身的索引和并行机制。

实际场景与价值

对数据科学家和 DBA 而言，这意味着更简单的架构。比如电商平台可以直接在订单查询中嵌入欺诈检测模型，无需单独搭建推理服务。再比如内容系统可以实时标记敏感文本，全部在 SQL 层面搞定。

不过，这并非万能。模型需要提前注册，且每个推理都会消耗数据库 CPU。对于高吞吐场景，可能还是需要专用推理引擎。

局限与展望

目前该项目仍处于 early stage，支持的模型格式有限，文档也偏少。另外，计算资源隔离是个问题：AI 推理可能拖慢其他查询。未来可能的改进方向包括 GPU 加速、模型热更新、以及更好的资源管控。

如果你已经在用 PostgreSQL，并且想快速尝试 AI 集成，这个项目值得一试。它展示了“数据不离库”的一种务实路径。

PostgreSQLAI运算符数据库机器学习向量搜索SQL推理文本分类开源扩展

暂无评论

成为第一个评论的人

探索更多

相似工具

Cursor

一款基于 VS Code 二次开发的智能代码编辑器，以“原生内置 AI”为核心卖点。它不依赖插件，而是将 AI 深度植入编辑器底层，能够理解整个项目的上下文代码库，支持无缝迁移 VS Code 的所有配置和插件。

Google Antigravity

Antigravity 支持多模型，包括 Gemini 3 Pro、Claude Sonnet 4.5、GPT-OSS，开发者可以在同一环境中选择最适合任务的模型。

Codex

OpenAI Codex 是由 OpenAI 开发的 AI 编程模型和助手，可将自然语言指令翻译成对应的源代码，为开发者提供智能补全、代码生成等功能。它最初于 2021 年作为 OpenAI API 的代码模型推出，曾为 GitHub Copilot 提供核心支持。随着 OpenAI 技术的迭代，Codex 在 2025 年以“AI 编程智能体”的全新姿态回归，能够理解复杂需求并自动编写、调试代码，显著提升开发效率和软件交付速度。

Kiro

Kiro 是由 AWS 推出的 AI 编程 IDE，采用规范驱动的开发模式，将自然语言需求转化为明确的规格文档和任务，再由内置 AI 代理生成代码并调试优化，全流程辅助大型项目开发。

Trae

Trae（官网 trae.ai）是由字节跳动（ByteDance）推出的一款 AI 原生集成开发环境（IDE）。它不是简单地作为一个编程助手，而是一个「协作伙伴」，通过深度整合大型语言模型（LLM），帮助开发者从需求、构建代码，到调试和部署，实现更智能化、自动化的软件开发。

Claude

Claude 是由美国人工智能公司 Anthropic 打造的智能语言交互平台，它融合了深度文本理解、信息整理、代码辅助和任务分析等能力，能在聊天对话之外应对更复杂的问题，例如长文摘要、图像解析、逻辑推理及编程协助等。相比一些单一问答机器人，Claude 更像一个具备推理逻辑、可扩展功能的智能工具。

开源项目

guidellm: 评估和优化 LLM 部署性能

guidellm 是一个开源工具，专为评估和优化大语言模型（LLM）在生产环境中的推理性能而设计。它支持压力测试、延迟分析、吞吐量评估等，帮助开发者识别瓶颈并调整部署配置。基于 vLLM 团队开发，适合需要精细化调优 LLM 服务的团队。

Kiln: 一站式 AI 系统评估与优化平台

Kiln 是一个开源 Python 工具，帮助开发者系统化地构建、评估和优化 AI 系统。它集成了 evals、RAG、智能体、微调、合成数据生成、数据集管理和 MCP 协议支持，让 AI 开发工作流更高效、更可控。适合需要深度调优 AI 性能的团队和个人。

jar-analyzer: JAR包GUI分析工具内置AI助手

Jar Analyzer 是一个开源的 JAR 包 GUI 分析工具，内置 AI 助手辅助分析，支持 JAR DIFF、方法调用关系搜索、DFS 调用链分析、污点分析、CFG 程序分析、JVM 栈帧分析等功能，适合 Java 开发者、安全研究人员进行代码审计和逆向分析。

terax-ai: 7MB终端优先AI开发工作台

terax-ai 是一个轻量级（仅7MB）的终端优先AI原生开发工作台，专为命令行爱好者设计。它集成了AI辅助能力，提供极快的启动速度和极小的资源占用，让开发者在熟悉的终端环境中高效编码、调试和实验。开源且易于安装，适合追求简洁与效率的开发者。

pydantic-ai: 用Pydantic方式构建AI Agent

pydantic-ai 是一个基于 Pydantic 的 AI Agent 框架，利用 Pydantic 的数据验证能力，让 Agent 的输入输出变得结构化、类型安全。适合 Python 开发者快速构建可靠、可测试的 AI 代理应用，支持多种 LLM 后端和工具调用。

Truss: 最简方式将 AI 模型部署到生产环境

Truss 是一个开源 Python 框架，旨在让 AI/ML 模型的部署变得像写几行代码一样简单。它抽象了 Docker、Kubernetes 等基础设施，支持 PyTorch、TensorFlow 等多种框架，并提供预热、批处理、监控等生产级功能。适合数据科学家和 ML 工程师快速将实验模型上线。