PostgreSQL AI 運算子: 在資料庫內直接執行AI推理

Hannah Foster

2026年6月20日

original

PostgreSQL 社羣推出的 AI 運算子擴充套件，允許使用者在 SQL 查詢中直接呼叫機器學習模型，實現文字分類、情感分析、向量嵌入等操作。無需移動資料，即可將 AI 能力融入現有資料庫工作流。本文介紹了其核心功能、使用場景和開發注意點。

過去幾年，資料庫與 AI 的融合一直是熱門話題。但大多數方案都要求將資料匯出到外部 ML 環境，處理完再寫回。現在，PostgreSQL AI 運算子試圖改變這一現狀：直接在 SQL 中嵌入模型推理，讓資料庫自己變成 AI 引擎。

什麼是 AI 運算子？

簡單說，就是一組自定義的 SQL 函式和操作符，允許你在 SELECT、WHERE、ORDER BY 等子句中呼叫預訓練模型。例如，similarity(embedding) > 0.8 或 predict(sentiment, text)。它們像普通運算子一樣工作，但背後是 TensorFlow、PyTorch 或 ONNX 模型。

這並非一個官方 PostgreSQL 擴充套件，而是一個開源實驗專案，由一群開發者基於 PostgreSQL 的 Foreign Data Wrapper 和 PL/Python 機制構建。目前支援文字嵌入、二分類、迴歸等常見任務。

核心用法與示例

安裝後，你可以像使用內建函式一樣使用 AI 運算子：

向量搜尋：SELECT * FROM items ORDER BY l2_distance(embedding, 'text') LIMIT 10;
情感分析：SELECT text, sentiment_score(text) FROM reviews WHERE sentiment(text) = 'positive';
實時分類：UPDATE users SET segment = predict_segment(age, income);

這種模式最大的好處是消除資料搬運。所有推理在資料庫程序內完成，延遲極低，且能利用 PostgreSQL 自身的索引和並行機制。

實際場景與價值

對資料科學家和 DBA 而言，這意味著更簡單的架構。比如電商平臺可以直接在訂單查詢中嵌入欺詐檢測模型，無需單獨搭建推理服務。再比如內容系統可以實時標記敏感文字，全部在 SQL 層面搞定。

不過，這並非萬能。模型需要提前註冊，且每個推理都會消耗資料庫 CPU。對於高吞吐場景，可能還是需要專用推理引擎。

侷限與展望

目前該專案仍處於 early stage，支援的模型格式有限，文件也偏少。另外，計算資源隔離是個問題：AI 推理可能拖慢其他查詢。未來可能的改進方向包括 GPU 加速、模型熱更新、以及更好的資源管控。

如果你已經在用 PostgreSQL，並且想快速嘗試 AI 整合，這個專案值得一試。它展示了「資料不離庫」的一種務實路徑。

PostgreSQLAI運算子資料庫機器學習向量搜尋SQL推理文字分類開源擴充套件

探索更多

相似工具

Cursor

一款基於 VS Code 二次開發的智慧程式碼編輯器，以「原生內建 AI」為核心賣點。它不依賴外掛，而是將 AI 深度植入編輯器底層，能夠理解整個專案的上下文程式碼庫，支援無縫遷移 VS Code 的所有配置和外掛。

Google Antigravity

Antigravity 支援多模型，包括 Gemini 3 Pro、Claude Sonnet 4.5、GPT-OSS，開發者可以在同一環境中選擇最適合任務的模型。

Codex

OpenAI Codex 是由 OpenAI 開發的 AI 程式設計模型和助手，可將自然語言指令翻譯成對應的原始碼，為開發者提供智慧補全、程式碼生成等功能。它最初於 2021 年作為 OpenAI API 的程式碼模型推出，曾為 GitHub Copilot 提供核心支援。隨著 OpenAI 技術的迭代，Codex 在 2025 年以「AI 程式設計智慧體」的全新姿態迴歸，能夠理解複雜需求並自動編寫、除錯程式碼，顯著提升開發效率和軟體交付速度。

Kiro

Kiro 是由 AWS 推出的 AI 程式設計 IDE，採用規範驅動的開發模式，將自然語言需求轉化為明確的規格文件和任務，再由內建 AI 代理生成程式碼並除錯優化，全流程輔助大型專案開發。

Trae

Trae（官網 trae.ai）是由位元組跳動（ByteDance）推出的一款 AI 原生整合開發環境（IDE）。它不是簡單地作為一個程式設計助手，而是一個「協作夥伴」，通過深度整合大型語言模型（LLM），幫助開發者從需求、構建程式碼，到除錯和部署，實現更智慧化、自動化的軟體開發。

Claude

Claude 是由美國人工智慧公司 Anthropic 打造的智慧語言互動平臺，它融合了深度文字理解、資訊整理、程式碼輔助和任務分析等能力，能在聊天對話之外應對更復雜的問題，例如長文摘要、影象解析、邏輯推理及程式設計協助等。相比一些單一問答機器人，Claude 更像一個具備推理邏輯、可擴充套件功能的智慧工具。

開源專案

guidellm: 評估和優化 LLM 部署效能

guidellm 是一個開源工具，專為評估和優化大語言模型（LLM）在生產環境中的推理效能而設計。它支援壓力測試、延遲分析、吞吐量評估等，幫助開發者識別瓶頸並調整部署配置。基於 vLLM 團隊開發，適合需要精細化調優 LLM 服務的團隊。

Kiln: 一站式 AI 系統評估與優化平臺

Kiln 是一個開源 Python 工具，幫助開發者系統化地構建、評估和優化 AI 系統。它整合了 evals、RAG、智慧體、微調、合成資料生成、資料集管理和 MCP 協議支援，讓 AI 開發工作流更高效、更可控。適合需要深度調優 AI 效能的團隊和個人。

jar-analyzer: JAR包GUI分析工具內建AI助手

Jar Analyzer 是一個開源的 JAR 包 GUI 分析工具，內建 AI 助手輔助分析，支援 JAR DIFF、方法呼叫關係搜尋、DFS 呼叫鏈分析、汙點分析、CFG 程序分析、JVM 棧幀分析等功能，適合 Java 開發者、安全研究人員進行程式碼審計和逆向分析。

terax-ai: 7MB終端優先AI開發工作臺

terax-ai 是一個輕量級（僅7MB）的終端優先AI原生開發工作臺，專為命令列愛好者設計。它整合了AI輔助能力，提供極快的啟動速度和極小的資源佔用，讓開發者在熟悉的終端環境中高效編碼、除錯和實驗。開源且易於安裝，適合追求簡潔與效率的開發者。

pydantic-ai: 用Pydantic方式構建AI Agent

pydantic-ai 是一個基於 Pydantic 的 AI Agent 框架，利用 Pydantic 的資料驗證能力，讓 Agent 的輸入輸出變得結構化、型別安全。適合 Python 開發者快速構建可靠、可測試的 AI 代理應用，支援多種 LLM 後端和工具呼叫。

Truss: 最簡方式將 AI 模型部署到生產環境

Truss 是一個開源 Python 框架，旨在讓 AI/ML 模型的部署變得像寫幾行程式碼一樣簡單。它抽象了 Docker、Kubernetes 等基礎設施，支援 PyTorch、TensorFlow 等多種框架，並提供預熱、批處理、監控等生產級功能。適合資料科學家和 ML 工程師快速將實驗模型上線。