Jalapeño: OpenAI 与 Broadcom 联手打造 LLM 推理芯片

Daniel Lee

2026年6月25日

204

original

OpenAI 与 Broadcom 联合推出定制 AI 芯片 Jalapeño，专为大语言模型推理优化，宣称在性能、能效和规模上实现显著提升，有望降低 AI 部署成本并减少对英伟达 GPU 的依赖。

在 AI 硬件领域，英伟达的 GPU 长期占据统治地位。但 OpenAI 与芯片巨头 Broadcom 最近发布了一款名为 Jalapeño 的定制芯片，直接将矛头对准了大语言模型的推理环节。这款芯片并非用于训练，而是专门为运行 LLM 时的计算负载而设计——这是一个务实且精准的切入点。

为什么是推理芯片？

大语言模型的实际应用，比如 ChatGPT 的每次响应，都依赖推理计算。训练虽然昂贵，但发生在开发阶段；而推理是每次请求都在发生的事情，随着用户规模增长，推理成本会快速累积。OpenAI 显然意识到了这一点。与其继续租用大量英伟达 H100，不如自己造一颗更匹配自家模型的芯片。Jalapeño 的重点是 每瓦性能 和 低延迟，两个指标直接关联运营成本和用户体验。

Broadcom 的定制芯片功底

Broadcom 并非新手。它在网络芯片和定制 ASIC 领域积累深厚，曾为 Google 和 Meta 设计过加速器。这次与 OpenAI 的合作，是它把定制能力推向 AI 推理的一次尝试。双方没有公布详细架构，但从公开信息看，Jalapeño 可能是一种 数据流架构，针对 Transformer 模型中的矩阵乘法和注意力机制做了硬件优化。这听起来很合理——毕竟这些操作占了推理计算量的绝大部分。

一个值得注意的背景是，OpenAI 此前也传出过自研芯片的计划，但选择与 Broadcom 合作显然能加快落地速度。这种“设计+制造”的分工模式在半导体行业很常见：OpenAI 提供 AI 负载的特性和需求，Broadcom 则负责把需求变成硅片。

对行业意味着什么？

Jalapeño 的出现可能带来三方面影响：

减少对英伟达的依赖： 推理芯片如果效果显著，OpenAI 可以大幅降低 GPU 采购量，这对整个供应链格局都是信号。
降低推理成本： 专用芯片往往比通用 GPU 更节能，长期看能降低每 token 的价格，最终惠及 API 用户。
推动定制化趋势： 更多大模型公司可能会跟进，设计自己的推理加速器，形成百花齐放的硬件生态。

当然，也有现实的挑战。Jalapeño 目前只针对 OpenAI 的模型优化，其他公司无法直接受益。而且芯片量产和部署需要时间，短期内很难看到大规模替代。

一些实用视角

对于关注 AI 基础设施的读者，几点值得思考：

不要期待 Jalapeño 会立刻改变市场——它更像一个长期战略棋子，真正落地可能需要 12-18 个月。
留意 OpenAI 的 API 定价变化。如果推理成本下降，API 调用费用可能随之调整。
这件事也提醒我们，软件和硬件的深度协同（co-design）正成为 AI 竞争的关键护城河。

Jalapeño 是一步精妙的棋。它没有试图取代训练芯片，而是专注推理这个更日常、更花钱的环节。随着 AI 应用从炫技走向普及，成本控制或许比性能突破更能决定胜负。

OpenAIBroadcomJalapeñoAI芯片LLM推理定制ASIC推理加速芯片设计人工智能硬件算力成本

分享

评论

0

暂无评论

成为第一个评论的人

探索更多

相似工具

GeoInfer

GeoInfer 是一款面向调查人员、记者、执法部门和安保专家的 AI 地理定位工具，通过分析照片中的建筑、地形、植被等视觉线索，快速推断拍摄地点。无需手动比对地图，支持批量处理，适用于开源情报（OSINT）调查、灾难响应和新闻事实核查。

Riskified

Riskified 是基于人工智能的电商欺诈防范与风险智能平台，帮助全球电商企业通过机器学习自动化审核交易，减少拒付损失并提升收入。平台实时分析用户行为，在安全与转化率之间取得平衡，已服务众多大型电商企业。

Fetcher

Fetcher是一款AI驱动的招聘工具，自动搜寻被动候选人，让招聘者从繁琐的搜集中解放，专注于候选人体验。支持多样化搜索，帮助团队更高效地发现并接触顶尖人才。

Kavout

Kavout 是一款金融AI工具，允许用户以自然语言提问的方式研究股票、ETF、加密货币和外汇。无需在多个平台间切换，直接询问“NVDA是否高估”或“寻找低负债、低于50美元的股息股”，即可获得财务数据与分析。

PollenTracker

PollenTracker是一款AI工具，实时更新美国及英国200多个城市的花粉、空气质量和天气数据，并给出户外活动安全建议。适合过敏人群和关注健康者。

PixieBrix

PixieBrix 是一个低代码平台，让你快速构建并部署上下文感知的浏览器扩展，无缝集成 AI、API 和企业数据，支持规模化管理和自定义工作流。

开源项目

ai-market-maker: 开源 AI 对冲基金操作系统

ai-market-maker 是一个基于 TypeScript 的开源 AI 对冲基金操作系统，通过智能代理实现自动化交易决策。它支持多种策略配置和风险管理，适合量化交易开发者、金融科技爱好者以及希望探索 AI 赋能投资的研究者。项目活跃度较高，社区正在成长。

OpenAlice: 开源AI全品种交易助手

OpenAlice 是一个开源 AI 交易代理，覆盖股票、加密货币、大宗商品、外汇和宏观市场。它自动化从研究到仓位退出全流程，基于 TypeScript 构建，GitHub 星标超 5200，适合有编程能力的交易者。

OctoBot: 开源AI加密货币交易机器人，自动运行多种策略

OctoBot 是一个免费开源的加密货币交易机器人，支持 Binance、Hyperliquid 等 15+ 交易所，可自动执行 AI、网格、DCA 和 TradingView 策略。界面简洁易用，无需编程即可配置，适合新手和进阶交易者。

openmed: 开源医疗 AI 框架

openmed 是一个专注于医疗健康领域的开源人工智能项目，基于 Python 开发，在 GitHub 上获得了超过 3400 星标。它旨在为医疗数据分析和 AI 模型部署提供基础工具，降低医疗 AI 的开发门槛，适合研究人员和开发者探索智能诊断、医学影像分析等场景。

AIRI: 自托管虚拟角色数字伴侣

AIRI 是一个面向自托管的虚拟角色 / 数字伴侣项目，具有语音、对话、游戏代理等能力

ValueCell: 社区驱动多智能体金融投研平台

ValueCell 是一个以社区为驱动的、多智能体系统平台，专注于金融领域的应用。它旨在将多个智能体（如市场分析、情绪分析、新闻分析、基本面分析等）组合协作，形成一种“智能投研团队”机制，为用户提供统一的投资组合管理、风险监控与策略开发。