PostgreSQL AI 运算符: 在数据库内直接运行AI推理

PostgreSQL AI 运算符: 在数据库内直接运行AI推理

Hannah Foster
43
original

PostgreSQL 社区推出的 AI 运算符扩展,允许用户在 SQL 查询中直接调用机器学习模型,实现文本分类、情感分析、向量嵌入等操作。无需移动数据,即可将 AI 能力融入现有数据库工作流。本文介绍了其核心功能、使用场景和开发注意点。

过去几年,数据库与 AI 的融合一直是热门话题。但大多数方案都要求将数据导出到外部 ML 环境,处理完再写回。现在,PostgreSQL AI 运算符试图改变这一现状:直接在 SQL 中嵌入模型推理,让数据库自己变成 AI 引擎。

什么是 AI 运算符?

简单说,就是一组自定义的 SQL 函数和操作符,允许你在 SELECT、WHERE、ORDER BY 等子句中调用预训练模型。例如,similarity(embedding) > 0.8predict(sentiment, text)。它们像普通运算符一样工作,但背后是 TensorFlow、PyTorch 或 ONNX 模型。

这并非一个官方 PostgreSQL 扩展,而是一个开源实验项目,由一群开发者基于 PostgreSQL 的 Foreign Data WrapperPL/Python 机制构建。目前支持文本嵌入、二分类、回归等常见任务。

核心用法与示例

安装后,你可以像使用内置函数一样使用 AI 运算符:

  • 向量搜索:SELECT * FROM items ORDER BY l2_distance(embedding, 'text') LIMIT 10;
  • 情感分析:SELECT text, sentiment_score(text) FROM reviews WHERE sentiment(text) = 'positive';
  • 实时分类:UPDATE users SET segment = predict_segment(age, income);

这种模式最大的好处是消除数据搬运。所有推理在数据库进程内完成,延迟极低,且能利用 PostgreSQL 自身的索引和并行机制。

实际场景与价值

对数据科学家和 DBA 而言,这意味着更简单的架构。比如电商平台可以直接在订单查询中嵌入欺诈检测模型,无需单独搭建推理服务。再比如内容系统可以实时标记敏感文本,全部在 SQL 层面搞定。

不过,这并非万能。模型需要提前注册,且每个推理都会消耗数据库 CPU。对于高吞吐场景,可能还是需要专用推理引擎。

局限与展望

目前该项目仍处于 early stage,支持的模型格式有限,文档也偏少。另外,计算资源隔离是个问题:AI 推理可能拖慢其他查询。未来可能的改进方向包括 GPU 加速、模型热更新、以及更好的资源管控。

如果你已经在用 PostgreSQL,并且想快速尝试 AI 集成,这个项目值得一试。它展示了“数据不离库”的一种务实路径。

PostgreSQLAI运算符数据库机器学习向量搜索SQL推理文本分类开源扩展

分享

评论

0
0/500 字符

暂无评论

成为第一个评论的人

探索更多

相似工具

Cursor

Cursor

一款基于 VS Code 二次开发的智能代码编辑器,以“原生内置 AI”为核心卖点。它不依赖插件,而是将 AI 深度植入编辑器底层,能够理解整个项目的上下文代码库,支持无缝迁移 VS Code 的所有配置和插件。

Google Antigravity

Google Antigravity

Antigravity 支持多模型,包括 Gemini 3 Pro、Claude Sonnet 4.5、GPT-OSS,开发者可以在同一环境中选择最适合任务的模型。

Codex

Codex

OpenAI Codex 是由 OpenAI 开发的 AI 编程模型和助手,可将自然语言指令翻译成对应的源代码,为开发者提供智能补全、代码生成等功能。它最初于 2021 年作为 OpenAI API 的代码模型推出,曾为 GitHub Copilot 提供核心支持。随着 OpenAI 技术的迭代,Codex 在 2025 年以“AI 编程智能体”的全新姿态回归,能够理解复杂需求并自动编写、调试代码,显著提升开发效率和软件交付速度。

Kiro

Kiro

Kiro 是由 AWS 推出的 AI 编程 IDE,采用规范驱动的开发模式,将自然语言需求转化为明确的规格文档和任务,再由内置 AI 代理生成代码并调试优化,全流程辅助大型项目开发。

Trae

Trae

Trae(官网 trae.ai)是由 字节跳动(ByteDance)推出的一款 AI 原生集成开发环境(IDE)。它不是简单地作为一个编程助手,而是一个「协作伙伴」,通过深度整合大型语言模型(LLM),帮助开发者从需求、构建代码,到调试和部署,实现更智能化、自动化的软件开发。

Claude

Claude

Claude 是由美国人工智能公司 Anthropic 打造的智能语言交互平台,它融合了深度文本理解、信息整理、代码辅助和任务分析等能力,能在聊天对话之外应对更复杂的问题,例如长文摘要、图像解析、逻辑推理及编程协助等。相比一些单一问答机器人,Claude 更像一个具备推理逻辑、可扩展功能的智能工具。

开源项目

guidellm: 评估和优化 LLM 部署性能

guidellm 是一个开源工具,专为评估和优化大语言模型(LLM)在生产环境中的推理性能而设计。它支持压力测试、延迟分析、吞吐量评估等,帮助开发者识别瓶颈并调整部署配置。基于 vLLM 团队开发,适合需要精细化调优 LLM 服务的团队。

Kiln: 一站式 AI 系统评估与优化平台

Kiln 是一个开源 Python 工具,帮助开发者系统化地构建、评估和优化 AI 系统。它集成了 evals、RAG、智能体、微调、合成数据生成、数据集管理和 MCP 协议支持,让 AI 开发工作流更高效、更可控。适合需要深度调优 AI 性能的团队和个人。

jar-analyzer: JAR包GUI分析工具内置AI助手

Jar Analyzer 是一个开源的 JAR 包 GUI 分析工具,内置 AI 助手辅助分析,支持 JAR DIFF、方法调用关系搜索、DFS 调用链分析、污点分析、CFG 程序分析、JVM 栈帧分析等功能,适合 Java 开发者、安全研究人员进行代码审计和逆向分析。

terax-ai: 7MB终端优先AI开发工作台

terax-ai 是一个轻量级(仅7MB)的终端优先AI原生开发工作台,专为命令行爱好者设计。它集成了AI辅助能力,提供极快的启动速度和极小的资源占用,让开发者在熟悉的终端环境中高效编码、调试和实验。开源且易于安装,适合追求简洁与效率的开发者。

pydantic-ai: 用Pydantic方式构建AI Agent

pydantic-ai 是一个基于 Pydantic 的 AI Agent 框架,利用 Pydantic 的数据验证能力,让 Agent 的输入输出变得结构化、类型安全。适合 Python 开发者快速构建可靠、可测试的 AI 代理应用,支持多种 LLM 后端和工具调用。

Truss: 最简方式将 AI 模型部署到生产环境

Truss 是一个开源 Python 框架,旨在让 AI/ML 模型的部署变得像写几行代码一样简单。它抽象了 Docker、Kubernetes 等基础设施,支持 PyTorch、TensorFlow 等多种框架,并提供预热、批处理、监控等生产级功能。适合数据科学家和 ML 工程师快速将实验模型上线。