Jalapeño: OpenAI 與 Broadcom 聯手打造 LLM 推理晶片

Daniel Lee

2026年6月25日

204

original

OpenAI 與 Broadcom 聯合推出定製 AI 晶片 Jalapeño，專為大語言模型推理優化，宣稱在效能、能效和規模上實現顯著提升，有望降低 AI 部署成本並減少對英偉達 GPU 的依賴。

在 AI 硬體領域，英偉達的 GPU 長期佔據統治地位。但 OpenAI 與晶片巨頭 Broadcom 最近釋出了一款名為 Jalapeño 的定製晶片，直接將矛頭對準了大語言模型的推理環節。這款晶片並非用於訓練，而是專門為執行 LLM 時的計算負載而設計——這是一個務實且精準的切入點。

為什麼是推理晶片？

大語言模型的實際應用，比如 ChatGPT 的每次響應，都依賴推理計算。訓練雖然昂貴，但發生在開發階段；而推理是每次請求都在發生的事情，隨著使用者規模增長，推理成本會快速累積。OpenAI 顯然意識到了這一點。與其繼續租用大量英偉達 H100，不如自己造一顆更匹配自家模型的晶片。Jalapeño 的重點是 每瓦效能 和 低延遲，兩個指標直接關聯運營成本和使用者體驗。

Broadcom 的定製晶片功底

Broadcom 並非新手。它在網路晶片和定製 ASIC 領域積累深厚，曾為 Google 和 Meta 設計過加速器。這次與 OpenAI 的合作，是它把定製能力推向 AI 推理的一次嘗試。雙方沒有公佈詳細架構，但從公開資訊看，Jalapeño 可能是一種 資料流架構，針對 Transformer 模型中的矩陣乘法和注意力機制做了硬體優化。這聽起來很合理——畢竟這些操作佔了推理計算量的絕大部分。

一個值得注意的背景是，OpenAI 此前也傳出過自研晶片的計劃，但選擇與 Broadcom 合作顯然能加快落地速度。這種「設計+製造」的分工模式在半導體行業很常見：OpenAI 提供 AI 負載的特性和需求，Broadcom 則負責把需求變成矽片。

對行業意味著什麼？

Jalapeño 的出現可能帶來三方面影響：

減少對英偉達的依賴： 推理晶片如果效果顯著，OpenAI 可以大幅降低 GPU 採購量，這對整個供應鏈格局都是訊號。
降低推理成本： 專用晶片往往比通用 GPU 更節能，長期看能降低每 token 的價格，最終惠及 API 使用者。
推動定製化趨勢： 更多大模型公司可能會跟進，設計自己的推理加速器，形成百花齊放的硬體生態。

當然，也有現實的挑戰。Jalapeño 目前只針對 OpenAI 的模型優化，其他公司無法直接受益。而且晶片量產和部署需要時間，短期內很難看到大規模替代。

一些實用視角

對於關注 AI 基礎設施的讀者，幾點值得思考：

不要期待 Jalapeño 會立刻改變市場——它更像一個長期戰略棋子，真正落地可能需要 12-18 個月。
留意 OpenAI 的 API 定價變化。如果推理成本下降，API 呼叫費用可能隨之調整。
這件事也提醒我們，軟體和硬體的深度協同（co-design）正成為 AI 競爭的關鍵護城河。

Jalapeño 是一步精妙的棋。它沒有試圖取代訓練晶片，而是專注推理這個更日常、更花錢的環節。隨著 AI 應用從炫技走向普及，成本控制或許比效能突破更能決定勝負。

OpenAIBroadcomJalapeñoAI晶片LLM推理定製ASIC推理加速晶片設計人工智慧硬體算力成本

分享

評論

0

暫無評論

成為第一個評論的人

探索更多

相似工具

GeoInfer

GeoInfer 是一款面向調查人員、記者、執法部門和安保專家的 AI 地理定位工具，通過分析照片中的建築、地形、植被等視覺線索，快速推斷拍攝地點。無需手動比對地圖，支援批量處理，適用於開源情報（OSINT）調查、災難響應和新聞事實核查。

Riskified

Riskified 是基於人工智慧的電商欺詐防範與風險智慧平臺，幫助全球電商企業通過機器學習自動化稽覈交易，減少拒付損失並提升收入。平臺實時分析使用者行為，在安全與轉化率之間取得平衡，已服務眾多大型電商企業。

Fetcher

Fetcher是一款AI驅動的招聘工具，自動搜尋被動候選人，讓招聘者從繁瑣的蒐集中解放，專注於候選人體驗。支援多樣化搜尋，幫助團隊更高效地發現並接觸頂尖人才。

Kavout

Kavout 是一款金融AI工具，允許使用者以自然語言提問的方式研究股票、ETF、加密貨幣和外匯。無需在多個平臺間切換，直接詢問「NVDA是否高估」或「尋找低負債、低於50美元的股息股」，即可獲得財務資料與分析。

PollenTracker

PollenTracker是一款AI工具，實時更新美國及英國200多個城市的花粉、空氣質量和天氣資料，並給出戶外活動安全建議。適合過敏人群和關注健康者。

PixieBrix

PixieBrix 是一個低程式碼平臺，讓你快速構建並部署上下文感知的瀏覽器擴充套件，無縫整合 AI、API 和企業資料，支援規模化管理和自定義工作流。

開源專案

ai-market-maker: 開源 AI 對衝基金作業系統

ai-market-maker 是一個基於 TypeScript 的開源 AI 對衝基金作業系統，通過智慧代理實現自動化交易決策。它支援多種策略配置和風險管理，適合量化交易開發者、金融科技愛好者以及希望探索 AI 賦能投資的研究者。專案活躍度較高，社羣正在成長。

OpenAlice: 開源AI全品種交易助手

OpenAlice 是一個開源 AI 交易代理，覆蓋股票、加密貨幣、大宗商品、外匯和巨集觀市場。它自動化從研究到倉位退出全流程，基於 TypeScript 構建，GitHub 星標超 5200，適合有程式設計能力的交易者。

OctoBot: 開源AI加密貨幣交易機器人，自動執行多種策略

OctoBot 是一個免費開源的加密貨幣交易機器人，支援 Binance、Hyperliquid 等 15+ 交易所，可自動執行 AI、網格、DCA 和 TradingView 策略。介面簡潔易用，無需程式設計即可配置，適合新手和進階交易者。

openmed: 開源醫療 AI 框架

openmed 是一個專注於醫療健康領域的開源人工智慧專案，基於 Python 開發，在 GitHub 上獲得了超過 3400 星標。它旨在為醫療資料分析和 AI 模型部署提供基礎工具，降低醫療 AI 的開發門檻，適合研究人員和開發者探索智慧診斷、醫學影像分析等場景。

AIRI: 自託管虛擬角色數字伴侶

AIRI 是一個面向自託管的虛擬角色 / 數字伴侶專案，具有語音、對話、遊戲代理等能力

ValueCell: 社羣驅動多智慧體金融投研平臺

ValueCell 是一個以社羣為驅動的、多智慧體系統平臺，專注於金融領域的應用。它旨在將多個智慧體（如市場分析、情緒分析、新聞分析、基本面分析等）組合協作，形成一種「智慧投研團隊」機制，為使用者提供統一的投資組合管理、風險監控與策略開發。