Jalapeño: OpenAI 与 Broadcom 联手打造 LLM 推理芯片

Jalapeño: OpenAI 与 Broadcom 联手打造 LLM 推理芯片

Daniel Lee
204
original

OpenAI 与 Broadcom 联合推出定制 AI 芯片 Jalapeño,专为大语言模型推理优化,宣称在性能、能效和规模上实现显著提升,有望降低 AI 部署成本并减少对英伟达 GPU 的依赖。

在 AI 硬件领域,英伟达的 GPU 长期占据统治地位。但 OpenAI 与芯片巨头 Broadcom 最近发布了一款名为 Jalapeño 的定制芯片,直接将矛头对准了大语言模型的推理环节。这款芯片并非用于训练,而是专门为运行 LLM 时的计算负载而设计——这是一个务实且精准的切入点。

为什么是推理芯片?

大语言模型的实际应用,比如 ChatGPT 的每次响应,都依赖推理计算。训练虽然昂贵,但发生在开发阶段;而推理是每次请求都在发生的事情,随着用户规模增长,推理成本会快速累积。OpenAI 显然意识到了这一点。与其继续租用大量英伟达 H100,不如自己造一颗更匹配自家模型的芯片。Jalapeño 的重点是 每瓦性能低延迟,两个指标直接关联运营成本和用户体验。

Broadcom 的定制芯片功底

Broadcom 并非新手。它在网络芯片和定制 ASIC 领域积累深厚,曾为 Google 和 Meta 设计过加速器。这次与 OpenAI 的合作,是它把定制能力推向 AI 推理的一次尝试。双方没有公布详细架构,但从公开信息看,Jalapeño 可能是一种 数据流架构,针对 Transformer 模型中的矩阵乘法和注意力机制做了硬件优化。这听起来很合理——毕竟这些操作占了推理计算量的绝大部分。

一个值得注意的背景是,OpenAI 此前也传出过自研芯片的计划,但选择与 Broadcom 合作显然能加快落地速度。这种“设计+制造”的分工模式在半导体行业很常见:OpenAI 提供 AI 负载的特性和需求,Broadcom 则负责把需求变成硅片。

对行业意味着什么?

Jalapeño 的出现可能带来三方面影响:

  • 减少对英伟达的依赖: 推理芯片如果效果显著,OpenAI 可以大幅降低 GPU 采购量,这对整个供应链格局都是信号。
  • 降低推理成本: 专用芯片往往比通用 GPU 更节能,长期看能降低每 token 的价格,最终惠及 API 用户。
  • 推动定制化趋势: 更多大模型公司可能会跟进,设计自己的推理加速器,形成百花齐放的硬件生态。

当然,也有现实的挑战。Jalapeño 目前只针对 OpenAI 的模型优化,其他公司无法直接受益。而且芯片量产和部署需要时间,短期内很难看到大规模替代。

一些实用视角

对于关注 AI 基础设施的读者,几点值得思考:

  • 不要期待 Jalapeño 会立刻改变市场——它更像一个长期战略棋子,真正落地可能需要 12-18 个月。
  • 留意 OpenAI 的 API 定价变化。如果推理成本下降,API 调用费用可能随之调整。
  • 这件事也提醒我们,软件和硬件的深度协同(co-design)正成为 AI 竞争的关键护城河。

Jalapeño 是一步精妙的棋。它没有试图取代训练芯片,而是专注推理这个更日常、更花钱的环节。随着 AI 应用从炫技走向普及,成本控制或许比性能突破更能决定胜负。

OpenAIBroadcomJalapeñoAI芯片LLM推理定制ASIC推理加速芯片设计人工智能硬件算力成本

分享

评论

0
0/500 字符

暂无评论

成为第一个评论的人

探索更多

相似工具

GeoInfer

GeoInfer

GeoInfer 是一款面向调查人员、记者、执法部门和安保专家的 AI 地理定位工具,通过分析照片中的建筑、地形、植被等视觉线索,快速推断拍摄地点。无需手动比对地图,支持批量处理,适用于开源情报(OSINT)调查、灾难响应和新闻事实核查。

Riskified

Riskified

Riskified 是基于人工智能的电商欺诈防范与风险智能平台,帮助全球电商企业通过机器学习自动化审核交易,减少拒付损失并提升收入。平台实时分析用户行为,在安全与转化率之间取得平衡,已服务众多大型电商企业。

Fetcher

Fetcher

Fetcher是一款AI驱动的招聘工具,自动搜寻被动候选人,让招聘者从繁琐的搜集中解放,专注于候选人体验。支持多样化搜索,帮助团队更高效地发现并接触顶尖人才。

Kavout

Kavout

Kavout 是一款金融AI工具,允许用户以自然语言提问的方式研究股票、ETF、加密货币和外汇。无需在多个平台间切换,直接询问“NVDA是否高估”或“寻找低负债、低于50美元的股息股”,即可获得财务数据与分析。

PollenTracker

PollenTracker

PollenTracker是一款AI工具,实时更新美国及英国200多个城市的花粉、空气质量和天气数据,并给出户外活动安全建议。适合过敏人群和关注健康者。

PixieBrix

PixieBrix

PixieBrix 是一个低代码平台,让你快速构建并部署上下文感知的浏览器扩展,无缝集成 AI、API 和企业数据,支持规模化管理和自定义工作流。

开源项目

ai-market-maker: 开源 AI 对冲基金操作系统

ai-market-maker 是一个基于 TypeScript 的开源 AI 对冲基金操作系统,通过智能代理实现自动化交易决策。它支持多种策略配置和风险管理,适合量化交易开发者、金融科技爱好者以及希望探索 AI 赋能投资的研究者。项目活跃度较高,社区正在成长。

OpenAlice: 开源AI全品种交易助手

OpenAlice 是一个开源 AI 交易代理,覆盖股票、加密货币、大宗商品、外汇和宏观市场。它自动化从研究到仓位退出全流程,基于 TypeScript 构建,GitHub 星标超 5200,适合有编程能力的交易者。

OctoBot: 开源AI加密货币交易机器人,自动运行多种策略

OctoBot 是一个免费开源的加密货币交易机器人,支持 Binance、Hyperliquid 等 15+ 交易所,可自动执行 AI、网格、DCA 和 TradingView 策略。界面简洁易用,无需编程即可配置,适合新手和进阶交易者。

openmed: 开源医疗 AI 框架

openmed 是一个专注于医疗健康领域的开源人工智能项目,基于 Python 开发,在 GitHub 上获得了超过 3400 星标。它旨在为医疗数据分析和 AI 模型部署提供基础工具,降低医疗 AI 的开发门槛,适合研究人员和开发者探索智能诊断、医学影像分析等场景。

AIRI: 自托管虚拟角色数字伴侣

AIRI 是一个面向自托管的虚拟角色 / 数字伴侣项目,具有语音、对话、游戏代理等能力

ValueCell: 社区驱动多智能体金融投研平台

ValueCell 是一个以社区为驱动的、多智能体系统平台,专注于金融领域的应用。它旨在将多个智能体(如市场分析、情绪分析、新闻分析、基本面分析等)组合协作,形成一种“智能投研团队”机制,为用户提供统一的投资组合管理、风险监控与策略开发。