Jalapeño: OpenAI 與 Broadcom 聯手打造 LLM 推理晶片

Jalapeño: OpenAI 與 Broadcom 聯手打造 LLM 推理晶片

Daniel Lee
204
original

OpenAI 與 Broadcom 聯合推出定製 AI 晶片 Jalapeño,專為大語言模型推理優化,宣稱在效能、能效和規模上實現顯著提升,有望降低 AI 部署成本並減少對英偉達 GPU 的依賴。

在 AI 硬體領域,英偉達的 GPU 長期佔據統治地位。但 OpenAI 與晶片巨頭 Broadcom 最近釋出了一款名為 Jalapeño 的定製晶片,直接將矛頭對準了大語言模型的推理環節。這款晶片並非用於訓練,而是專門為執行 LLM 時的計算負載而設計——這是一個務實且精準的切入點。

為什麼是推理晶片?

大語言模型的實際應用,比如 ChatGPT 的每次響應,都依賴推理計算。訓練雖然昂貴,但發生在開發階段;而推理是每次請求都在發生的事情,隨著使用者規模增長,推理成本會快速累積。OpenAI 顯然意識到了這一點。與其繼續租用大量英偉達 H100,不如自己造一顆更匹配自家模型的晶片。Jalapeño 的重點是 每瓦效能低延遲,兩個指標直接關聯運營成本和使用者體驗。

Broadcom 的定製晶片功底

Broadcom 並非新手。它在網路晶片和定製 ASIC 領域積累深厚,曾為 Google 和 Meta 設計過加速器。這次與 OpenAI 的合作,是它把定製能力推向 AI 推理的一次嘗試。雙方沒有公佈詳細架構,但從公開資訊看,Jalapeño 可能是一種 資料流架構,針對 Transformer 模型中的矩陣乘法和注意力機制做了硬體優化。這聽起來很合理——畢竟這些操作佔了推理計算量的絕大部分。

一個值得注意的背景是,OpenAI 此前也傳出過自研晶片的計劃,但選擇與 Broadcom 合作顯然能加快落地速度。這種「設計+製造」的分工模式在半導體行業很常見:OpenAI 提供 AI 負載的特性和需求,Broadcom 則負責把需求變成矽片。

對行業意味著什麼?

Jalapeño 的出現可能帶來三方面影響:

  • 減少對英偉達的依賴: 推理晶片如果效果顯著,OpenAI 可以大幅降低 GPU 採購量,這對整個供應鏈格局都是訊號。
  • 降低推理成本: 專用晶片往往比通用 GPU 更節能,長期看能降低每 token 的價格,最終惠及 API 使用者。
  • 推動定製化趨勢: 更多大模型公司可能會跟進,設計自己的推理加速器,形成百花齊放的硬體生態。

當然,也有現實的挑戰。Jalapeño 目前只針對 OpenAI 的模型優化,其他公司無法直接受益。而且晶片量產和部署需要時間,短期內很難看到大規模替代。

一些實用視角

對於關注 AI 基礎設施的讀者,幾點值得思考:

  • 不要期待 Jalapeño 會立刻改變市場——它更像一個長期戰略棋子,真正落地可能需要 12-18 個月。
  • 留意 OpenAI 的 API 定價變化。如果推理成本下降,API 呼叫費用可能隨之調整。
  • 這件事也提醒我們,軟體和硬體的深度協同(co-design)正成為 AI 競爭的關鍵護城河。

Jalapeño 是一步精妙的棋。它沒有試圖取代訓練晶片,而是專注推理這個更日常、更花錢的環節。隨著 AI 應用從炫技走向普及,成本控制或許比效能突破更能決定勝負。

OpenAIBroadcomJalapeñoAI晶片LLM推理定製ASIC推理加速晶片設計人工智慧硬體算力成本

分享

評論

0
0/500 字元

暫無評論

成為第一個評論的人

探索更多

相似工具

GeoInfer

GeoInfer

GeoInfer 是一款面向調查人員、記者、執法部門和安保專家的 AI 地理定位工具,通過分析照片中的建築、地形、植被等視覺線索,快速推斷拍攝地點。無需手動比對地圖,支援批量處理,適用於開源情報(OSINT)調查、災難響應和新聞事實核查。

Riskified

Riskified

Riskified 是基於人工智慧的電商欺詐防範與風險智慧平臺,幫助全球電商企業通過機器學習自動化稽覈交易,減少拒付損失並提升收入。平臺實時分析使用者行為,在安全與轉化率之間取得平衡,已服務眾多大型電商企業。

Fetcher

Fetcher

Fetcher是一款AI驅動的招聘工具,自動搜尋被動候選人,讓招聘者從繁瑣的蒐集中解放,專注於候選人體驗。支援多樣化搜尋,幫助團隊更高效地發現並接觸頂尖人才。

Kavout

Kavout

Kavout 是一款金融AI工具,允許使用者以自然語言提問的方式研究股票、ETF、加密貨幣和外匯。無需在多個平臺間切換,直接詢問「NVDA是否高估」或「尋找低負債、低於50美元的股息股」,即可獲得財務資料與分析。

PollenTracker

PollenTracker

PollenTracker是一款AI工具,實時更新美國及英國200多個城市的花粉、空氣質量和天氣資料,並給出戶外活動安全建議。適合過敏人群和關注健康者。

PixieBrix

PixieBrix

PixieBrix 是一個低程式碼平臺,讓你快速構建並部署上下文感知的瀏覽器擴充套件,無縫整合 AI、API 和企業資料,支援規模化管理和自定義工作流。

開源專案

ai-market-maker: 開源 AI 對衝基金作業系統

ai-market-maker 是一個基於 TypeScript 的開源 AI 對衝基金作業系統,通過智慧代理實現自動化交易決策。它支援多種策略配置和風險管理,適合量化交易開發者、金融科技愛好者以及希望探索 AI 賦能投資的研究者。專案活躍度較高,社羣正在成長。

OpenAlice: 開源AI全品種交易助手

OpenAlice 是一個開源 AI 交易代理,覆蓋股票、加密貨幣、大宗商品、外匯和巨集觀市場。它自動化從研究到倉位退出全流程,基於 TypeScript 構建,GitHub 星標超 5200,適合有程式設計能力的交易者。

OctoBot: 開源AI加密貨幣交易機器人,自動執行多種策略

OctoBot 是一個免費開源的加密貨幣交易機器人,支援 Binance、Hyperliquid 等 15+ 交易所,可自動執行 AI、網格、DCA 和 TradingView 策略。介面簡潔易用,無需程式設計即可配置,適合新手和進階交易者。

openmed: 開源醫療 AI 框架

openmed 是一個專注於醫療健康領域的開源人工智慧專案,基於 Python 開發,在 GitHub 上獲得了超過 3400 星標。它旨在為醫療資料分析和 AI 模型部署提供基礎工具,降低醫療 AI 的開發門檻,適合研究人員和開發者探索智慧診斷、醫學影像分析等場景。

AIRI: 自託管虛擬角色數字伴侶

AIRI 是一個面向自託管的虛擬角色 / 數字伴侶專案,具有語音、對話、遊戲代理等能力

ValueCell: 社羣驅動多智慧體金融投研平臺

ValueCell 是一個以社羣為驅動的、多智慧體系統平臺,專注於金融領域的應用。它旨在將多個智慧體(如市場分析、情緒分析、新聞分析、基本面分析等)組合協作,形成一種「智慧投研團隊」機制,為使用者提供統一的投資組合管理、風險監控與策略開發。