PostgreSQL AI 運算子: 在資料庫內直接執行AI推理

PostgreSQL AI 運算子: 在資料庫內直接執行AI推理

Hannah Foster
43
original

PostgreSQL 社羣推出的 AI 運算子擴充套件,允許使用者在 SQL 查詢中直接呼叫機器學習模型,實現文字分類、情感分析、向量嵌入等操作。無需移動資料,即可將 AI 能力融入現有資料庫工作流。本文介紹了其核心功能、使用場景和開發注意點。

過去幾年,資料庫與 AI 的融合一直是熱門話題。但大多數方案都要求將資料匯出到外部 ML 環境,處理完再寫回。現在,PostgreSQL AI 運算子試圖改變這一現狀:直接在 SQL 中嵌入模型推理,讓資料庫自己變成 AI 引擎。

什麼是 AI 運算子?

簡單說,就是一組自定義的 SQL 函式和操作符,允許你在 SELECT、WHERE、ORDER BY 等子句中呼叫預訓練模型。例如,similarity(embedding) > 0.8predict(sentiment, text)。它們像普通運算子一樣工作,但背後是 TensorFlow、PyTorch 或 ONNX 模型。

這並非一個官方 PostgreSQL 擴充套件,而是一個開源實驗專案,由一群開發者基於 PostgreSQL 的 Foreign Data WrapperPL/Python 機制構建。目前支援文字嵌入、二分類、迴歸等常見任務。

核心用法與示例

安裝後,你可以像使用內建函式一樣使用 AI 運算子:

  • 向量搜尋:SELECT * FROM items ORDER BY l2_distance(embedding, 'text') LIMIT 10;
  • 情感分析:SELECT text, sentiment_score(text) FROM reviews WHERE sentiment(text) = 'positive';
  • 實時分類:UPDATE users SET segment = predict_segment(age, income);

這種模式最大的好處是消除資料搬運。所有推理在資料庫程序內完成,延遲極低,且能利用 PostgreSQL 自身的索引和並行機制。

實際場景與價值

對資料科學家和 DBA 而言,這意味著更簡單的架構。比如電商平臺可以直接在訂單查詢中嵌入欺詐檢測模型,無需單獨搭建推理服務。再比如內容系統可以實時標記敏感文字,全部在 SQL 層面搞定。

不過,這並非萬能。模型需要提前註冊,且每個推理都會消耗資料庫 CPU。對於高吞吐場景,可能還是需要專用推理引擎。

侷限與展望

目前該專案仍處於 early stage,支援的模型格式有限,文件也偏少。另外,計算資源隔離是個問題:AI 推理可能拖慢其他查詢。未來可能的改進方向包括 GPU 加速、模型熱更新、以及更好的資源管控。

如果你已經在用 PostgreSQL,並且想快速嘗試 AI 整合,這個專案值得一試。它展示了「資料不離庫」的一種務實路徑。

PostgreSQLAI運算子資料庫機器學習向量搜尋SQL推理文字分類開源擴充套件

分享

評論

0
0/500 字元

暫無評論

成為第一個評論的人

探索更多

相似工具

Cursor

Cursor

一款基於 VS Code 二次開發的智慧程式碼編輯器,以「原生內建 AI」為核心賣點。它不依賴外掛,而是將 AI 深度植入編輯器底層,能夠理解整個專案的上下文程式碼庫,支援無縫遷移 VS Code 的所有配置和外掛。

Google Antigravity

Google Antigravity

Antigravity 支援多模型,包括 Gemini 3 Pro、Claude Sonnet 4.5、GPT-OSS,開發者可以在同一環境中選擇最適合任務的模型。

Codex

Codex

OpenAI Codex 是由 OpenAI 開發的 AI 程式設計模型和助手,可將自然語言指令翻譯成對應的原始碼,為開發者提供智慧補全、程式碼生成等功能。它最初於 2021 年作為 OpenAI API 的程式碼模型推出,曾為 GitHub Copilot 提供核心支援。隨著 OpenAI 技術的迭代,Codex 在 2025 年以「AI 程式設計智慧體」的全新姿態迴歸,能夠理解複雜需求並自動編寫、除錯程式碼,顯著提升開發效率和軟體交付速度。

Kiro

Kiro

Kiro 是由 AWS 推出的 AI 程式設計 IDE,採用規範驅動的開發模式,將自然語言需求轉化為明確的規格文件和任務,再由內建 AI 代理生成程式碼並除錯優化,全流程輔助大型專案開發。

Trae

Trae

Trae(官網 trae.ai)是由 位元組跳動(ByteDance)推出的一款 AI 原生整合開發環境(IDE)。它不是簡單地作為一個程式設計助手,而是一個「協作夥伴」,通過深度整合大型語言模型(LLM),幫助開發者從需求、構建程式碼,到除錯和部署,實現更智慧化、自動化的軟體開發。

Claude

Claude

Claude 是由美國人工智慧公司 Anthropic 打造的智慧語言互動平臺,它融合了深度文字理解、資訊整理、程式碼輔助和任務分析等能力,能在聊天對話之外應對更復雜的問題,例如長文摘要、影象解析、邏輯推理及程式設計協助等。相比一些單一問答機器人,Claude 更像一個具備推理邏輯、可擴充套件功能的智慧工具。

開源專案

guidellm: 評估和優化 LLM 部署效能

guidellm 是一個開源工具,專為評估和優化大語言模型(LLM)在生產環境中的推理效能而設計。它支援壓力測試、延遲分析、吞吐量評估等,幫助開發者識別瓶頸並調整部署配置。基於 vLLM 團隊開發,適合需要精細化調優 LLM 服務的團隊。

Kiln: 一站式 AI 系統評估與優化平臺

Kiln 是一個開源 Python 工具,幫助開發者系統化地構建、評估和優化 AI 系統。它整合了 evals、RAG、智慧體、微調、合成資料生成、資料集管理和 MCP 協議支援,讓 AI 開發工作流更高效、更可控。適合需要深度調優 AI 效能的團隊和個人。

jar-analyzer: JAR包GUI分析工具內建AI助手

Jar Analyzer 是一個開源的 JAR 包 GUI 分析工具,內建 AI 助手輔助分析,支援 JAR DIFF、方法呼叫關係搜尋、DFS 呼叫鏈分析、汙點分析、CFG 程序分析、JVM 棧幀分析等功能,適合 Java 開發者、安全研究人員進行程式碼審計和逆向分析。

terax-ai: 7MB終端優先AI開發工作臺

terax-ai 是一個輕量級(僅7MB)的終端優先AI原生開發工作臺,專為命令列愛好者設計。它整合了AI輔助能力,提供極快的啟動速度和極小的資源佔用,讓開發者在熟悉的終端環境中高效編碼、除錯和實驗。開源且易於安裝,適合追求簡潔與效率的開發者。

pydantic-ai: 用Pydantic方式構建AI Agent

pydantic-ai 是一個基於 Pydantic 的 AI Agent 框架,利用 Pydantic 的資料驗證能力,讓 Agent 的輸入輸出變得結構化、型別安全。適合 Python 開發者快速構建可靠、可測試的 AI 代理應用,支援多種 LLM 後端和工具呼叫。

Truss: 最簡方式將 AI 模型部署到生產環境

Truss 是一個開源 Python 框架,旨在讓 AI/ML 模型的部署變得像寫幾行程式碼一樣簡單。它抽象了 Docker、Kubernetes 等基礎設施,支援 PyTorch、TensorFlow 等多種框架,並提供預熱、批處理、監控等生產級功能。適合資料科學家和 ML 工程師快速將實驗模型上線。