過去幾年,資料庫與 AI 的融合一直是熱門話題。但大多數方案都要求將資料匯出到外部 ML 環境,處理完再寫回。現在,PostgreSQL AI 運算子試圖改變這一現狀:直接在 SQL 中嵌入模型推理,讓資料庫自己變成 AI 引擎。
什麼是 AI 運算子?
簡單說,就是一組自定義的 SQL 函式和操作符,允許你在 SELECT、WHERE、ORDER BY 等子句中呼叫預訓練模型。例如,similarity(embedding) > 0.8 或 predict(sentiment, text)。它們像普通運算子一樣工作,但背後是 TensorFlow、PyTorch 或 ONNX 模型。
這並非一個官方 PostgreSQL 擴充套件,而是一個開源實驗專案,由一群開發者基於 PostgreSQL 的 Foreign Data Wrapper 和 PL/Python 機制構建。目前支援文字嵌入、二分類、迴歸等常見任務。
核心用法與示例
安裝後,你可以像使用內建函式一樣使用 AI 運算子:
- 向量搜尋:
SELECT * FROM items ORDER BY l2_distance(embedding, 'text') LIMIT 10; - 情感分析:
SELECT text, sentiment_score(text) FROM reviews WHERE sentiment(text) = 'positive'; - 實時分類:
UPDATE users SET segment = predict_segment(age, income);
這種模式最大的好處是消除資料搬運。所有推理在資料庫程序內完成,延遲極低,且能利用 PostgreSQL 自身的索引和並行機制。
實際場景與價值
對資料科學家和 DBA 而言,這意味著更簡單的架構。比如電商平臺可以直接在訂單查詢中嵌入欺詐檢測模型,無需單獨搭建推理服務。再比如內容系統可以實時標記敏感文字,全部在 SQL 層面搞定。
不過,這並非萬能。模型需要提前註冊,且每個推理都會消耗資料庫 CPU。對於高吞吐場景,可能還是需要專用推理引擎。
侷限與展望
目前該專案仍處於 early stage,支援的模型格式有限,文件也偏少。另外,計算資源隔離是個問題:AI 推理可能拖慢其他查詢。未來可能的改進方向包括 GPU 加速、模型熱更新、以及更好的資源管控。
如果你已經在用 PostgreSQL,並且想快速嘗試 AI 整合,這個專案值得一試。它展示了「資料不離庫」的一種務實路徑。











評論
暫無評論
成為第一個評論的人