OpenAI 的财务状况很大程度上取决于基础设施成本,正是这一现实促使 OpenAI 开发了全新的定制芯片——OpenAI Jalapeño。这款专用集成电路 (ASIC) 由 OpenAI 与博通公司合作开发,旨在直接降低第三方硬件带来的巨额资本支出。api中转站的小编跟大家一起看看。
尽管英伟达目前高端处理器的利润率估计高达75%,但OpenAI的利润率却低得多,扣除巨额运营成本后,每产生1美元的收入,其利润仅约为33美分。大规模运行大型语言模型的财务负担十分沉重。
去年,OpenAI 为维持 ChatGPT 服务器的响应速度花费了高达 84 亿美元。如今,该平台每周吸引 9 亿用户,预计今年的运营成本将达到约 140 亿美元。未来八年,OpenAI 已承诺在计算能力方面投入约 1.4 万亿美元,对于一家目前年收入仅为 250 亿美元的公司而言,这是一笔巨额投资。
为LLM推理设计硬件
OpenAI 的 Jalapeño 芯片被誉为该公司首款“智能处理器”,专为大型语言模型 (LLM) 推理而设计,而非通用人工智能工作负载。OpenAI 基于其特定的模型路线图和服务系统提供了核心架构设计,而博通则负责芯片工程和高性能网络集成。
台积电负责台湾地区的硬件制造,而Celestica则负责电路板和机架系统的搭建。据OpenAI称,早期实验室样品已经能够以目标生产频率和功耗运行前沿工作负载,包括尚未发布的GPT-5.3-Codex-Spark模型。
OpenAI硬件项目负责人Richard Ho指出,该架构最大限度地减少了数据移动,从而使实际利用率更接近其理论峰值性能。与从传统AI工作负载改造而来的通用加速器不同,该架构专门平衡了计算、内存和网络资源,以解决交互式LLM服务中固有的数据移动瓶颈。
为了大规模实现这一点,该平台将博通公司的 Tomahawk 网络芯片直接集成到设计中,使定制处理器能够在庞大的集群数据中心环境中进行通信。
垂直整合飞轮
通过进军定制芯片领域,OpenAI 从一家单纯的软件公司转型为一家垂直整合的基础设施公司。这种全栈策略涵盖了整个流程:芯片架构、软件内核、内存系统、网络调度以及最终的应用层。与苹果公司将专有硬件与 iOS 紧密结合的做法类似,OpenAI 现在可以根据其精确的内部模型路线图来优化其基础设施。。
该集成为持续运行的飞轮提供动力。提高基础设施效率可以降低模型训练和服务成本。更经济实惠的服务带来更好、响应更快的产品,从而推动用户数量和收入的增长,并将这些增长再投资于下一代定制基础设施。。
克服后发优势
通过推出自主研发的芯片,OpenAI 进入了一个其主要竞争对手已投入近十年时间开发专有硬件的领域。谷歌于 2015 年开始部署其张量处理单元 (TPU),如今已控制了英伟达供应链之外约四分之一的全球人工智能计算能力。
亚马逊已出货超过一百万颗定制芯片,而 Meta 和微软则继续扩展其自身的基础设施。
OpenAI总裁兼联合创始人格雷格·布罗克曼表示:“Jalapeño是我们长期全栈基础设施战略的一部分,旨在提高计算能力。通过自主设计更多技术栈,我们可以更高效地提供更强大的智能服务。”
为了弥补时间上的差距,OpenAI加快了研发进程。OpenAI Jalapeño芯片从最初的设计到最终的流片(即正式量产前的最后一步),仅用了九个月的时间。工程团队之所以能够实现这一目标,是因为他们利用OpenAI自主研发的语言模型,实现了硬件设计流程部分环节的自动化和优化。
这形成了一个独特的反馈循环:提供给用户的模型正被积极用于构建运行未来迭代版本的物理基础设施。硬件在数据中心的初步部署计划于2026年底开始。
博通首席执行官 Hock Tan 证实,此次推广将与包括微软在内的基础设施合作伙伴共同扩展,为千兆瓦级数据中心集成做好准备。
版权:文章来源: 文章该内容为作者观点,Firekb仅提供信息存储空间服务,不代表Firekb观点或立场。版权归原作者所有,未经允许不得转载。对于因本网站图片、内容所引起的纠纷、损失等,Firekb不承担侵权行为的连带责任。如发现本站文章存在版权问题,请联系:ysdl@esdli.com
转载请注明出处:https://www.esdli.com/21607.html
