电话: 邮箱:

HG官网(HoGaming) 史上最大AI芯片IPO了!五位芯片老炮用十年赌AI算力爆发

发布日期:2026-05-15 08:45 作者:admin 来源:未知 点击:92

HG官网(HoGaming) 史上最大AI芯片IPO了!五位芯片老炮用十年赌AI算力爆发

常常咱们见到的电脑芯片独一指甲盖大小,GPU 也就巴掌大,好意思国加州一家叫 Cerebras 的公司造出的芯片跟一个大号餐盘差未几,直径跨越 200 毫米,面积 46,225 简单毫米,集成了 4 万亿个晶体管。

这家公司于 2026 年 5 月 14 日在纳斯达克上市,刊行价 185 好意思元,开盘价 350 好意思元,首日大涨 89%,市值冲到 750 亿好意思元。五位连合创举东谈主有四位来自一家被 AMD 收购的干事器公司 SeaMicro,另一位来自 MIT。他们从 2015 年运行寡言干了近十年,如今带着晶圆级芯片站到了 AI 算力竞赛的最前排。

Cerebras 的中枢产物叫晶圆级引擎,当今还是发展到第三代 WSE-3。传统芯片制造是把一派晶圆切成上百颗小芯片,Cerebras 反治其身,不切割,凯旋把整片晶圆作念成一颗芯片。这片晶圆上集成了 84 颗造谣晶粒,每颗晶粒包含粗略 10,700 个中枢,通盘芯片一共有 90 万个蓄意中枢。

这些中枢通过一个 2D 网格状的片上网罗贯串,每个中枢配有一个五端口的路由器,撑合手四个主义的数据传输和土产货的读写操作。通盘芯片的内存带宽达到每秒 21 拍字节,片上网罗带宽每秒 214 拍字节。

WSE-3 芯片罗致台积电 5 纳米工艺制造,每个蓄意中枢的面积粗略 3.8 万简单微米,其中一半是 48KB 的土产货 SRAM,另一半是逻辑电路。通盘芯片的 SRAM 总量达到 44GB。系数内存齐散布在各中枢傍边,数据从内存到蓄意单位的物理距离独一几十微米,不需要像传统 GPU 那样通过外部高带宽内存 HBM 来获取数据。Cerebras 宣称,在同等硅单方面积下,他们的内存带宽是 GPU 的粗略 200 倍。

这种架构很是适合处理神经网罗的非结构化零散,传统 GPU 无论权重是否为 0 齐会进行蓄意,Cerebras 的作念法是在发送端就把 0 值过滤掉,只把非 0 数据通过片上网罗传给对应的蓄意中枢。每个数据包包含 16 位数据和 16 位礼貌信息,收受端收到数据后自动触发乘加运算。这种样式幸免了精深无效蓄意,在零散度较高的模子上不错获取明显加快。

该公司的时候白皮书知道,关于 BLAS 级别低于通用矩阵乘法的运算,比如矩阵向量乘或向量标量乘,传统芯片受限于内存带宽常常无法满负荷运行,Cerebras 的架构因为内存带宽弥漫高,不错保合手高运用率。

Cerebras 的另一个中枢时候叫 Weight Streaming,教师大模子时模子权重不存储在芯片上,而是放在一个叫 MemoryX 的外部建立里,按需流式传输到 WSE-3 芯片。蓄意每一层网罗时,权重从外部 DRAM 和闪存中读取,通过芯片的输入输出接口送入蓄意中枢。

每个权重到达中枢后,与土产货的激活值批量作念乘加运算,蓄意完成后权重就被丢弃,HG官网(HoGaming)不在芯片上停留。这种要道使得模子大小不受芯片内存容量的放胆,不错撑合手万亿参数级别的超大模子。

在软件层面,Cerebras 提供了完满的编译器具链,不错把 PyTorch 或 TensorFlow 编写的模子自动映射到 90 万个中枢上。关于 Transformer 类模子,激活张量有三个维度,批大小、序列长度和隐蔽维度。编译器会把隐蔽维度切分到芯片的 X 主义,把批大小和序列长度切分到 Y 主义。

蓄意矩阵乘法时,权重按行播送到对应列的系数中枢,触发乘加运算,然后在列方进取进行部分和归约,最终效劳散布在芯片上准备下一层的蓄意。系数蓄意诊疗齐是静态设置的,提示在运行前一次性加载,实行流程中不再改动。

Cerebras 的五位连合创举东谈主均有较深的芯片和系统配景。

CEO Andrew Feldman 毕业于斯坦福大学,此前创办的微干事器公司 SeaMicro 被 AMD 以 3.57 亿好意思元收购。

CTO Sean Lie 领有麻省理工学院电子工程与蓄意机科学学士和硕士学历,在 SeaMicro 担任 IO 造谣化架构师,被 AMD 收购后成为 AMD 院士。

系统架构师 Jean-Philippe Fricker 领有洛桑联邦理工学院硕士学历,曾在 DSSD、SeaMicro、阿尔卡特朗讯和 Riverstone Networks 担任硬件架构职务。

先进时候首席架构师 Michael James 领有加州大学伯克利分校分子神经生物学、数学和蓄意机科学三个学位,在 SeaMicro 隆重散布式系统软件。

已荣誉退休的前 CTO Gary Lauterbach 领有 50 多项专利,曾是 Sun Microsystems 的隆起工程师,主导了 UltraSPARC III 和 UltraSPARC IV 微处理器的架构联想。

Cerebras 的贸易模式以销售完满的 CS-3 系统为主,CS-3 是围绕 WSE-3 芯片联想的整机系统,不错部署在数据中心的次第机架上。客户主要来自科研机构和企业,包括阿联酋的东谈主工智能公司 G42 和穆罕默德·本·扎耶德东谈主工智能大学。凭证上市袒露文献,2025 年 Cerebras 营收 5.1 亿好意思元,其中 G42 孝顺了 24%,MBZUAI 孝顺了 62%。公司全年净利润 2.38 亿好意思元,比较前一年的耗损 4.82 亿好意思元终明晰扭亏为盈。

Cerebras 曾在 2024 年尝试上市,其时营收高度依赖单一客户 G42,后者孝顺了 87% 的收入。由于波及阿联酋配景的交游需要经过好意思海异邦投资委员会的审查,天然最终获取批准,Cerebras 照旧裁撤了上市请求。此次再行上市,客户聚合度还是有所改善,最大客户 MBZUAI 占比降到 62%,不外前两大客户所有仍然孝顺了 86% 的收入,聚合风险依然存在。

Cerebras 的时候门路在 AI 芯片界限独树一帜。其他挑战者大多在架构上效法 GPU,罗致精深小中枢调和 HBM 内存,Cerebras 聘用了用一派庞大的晶圆来处分问题。这种决策在零散蓄意和大模子推理上有明显上风,不外制变成本和良率也濒临挑战。

整片晶圆上只消有一个致命劣势就可能影响整颗芯片,Cerebras 通过在联想中加入冗余链路和自动纠错机制来处分这个问题。晶圆级芯片的功耗和散热亦然工程艰巨,CS-3 系统为此联想了专诚的液冷决策。

跟着 OpenAI、Anthropic、SpaceX 等 AI 公司行将连接上市,AI 芯片赛谈正在成为成本阛阓的焦点。Cerebras 行动第一家登陆纳斯达克的纯 AI 芯片新股,首日大涨 89% 给了后续企业一个积极的信号。

不外 AI 芯片阛阓的竞争也在加重,除了英伟达,AMD、英特尔以及多家创业公司齐在推出新产物。Cerebras 的晶圆级决策能否在主流 AI 教师阛阓站稳脚跟,还需要更多客户和更永劫候来检会。

参考贵寓:

https://www.nytimes.com/2026/05/14/technology/cerebras-ipo-ai.html

https://www.linkedin.com/in/sean-lie-4a80097/

开云体育官方网站 - KAIYUN

https://www.cerebras.ai/company/news

https://www.cerebras.ai/

排版:胡巍巍

相关标签: