韩国人工智能芯片初创公司 Rebellions 宣布完成 4 亿美元融资,计划向全球市场扩张。该公司计划推出全新的机架式计算平台,旨在解决企业部署 AI 基础设施的难题。这一举动发生在公司计划于明年或今年进行 IPO 之前。此举被视为对 Nvidia 和 AMD 市场主导地位的挑战。
该公司在 2020 年底成立,目前已在韩国国内电信和服务领域建立了稳固地位。首席商务官 Marshall Choy 表示,公司希望将经验复制到国际市场。这种模式并非从零开始,而是基于现有技术的重复验证。Choy 强调这不是全新的起点。
公司最初聚焦于韩国国内的电信运营商、服务提供商及企业终端用户。他们构建了涵盖呼叫中心、客户服务及国家公路系统监控摄像头等多种用例。如今,Rebellions 已将注意力转向日本、沙特、台湾和美国等海外市场。新办公室的设立表明其全球化决心。
硬件架构与散热方案
Rebel100 加速器采用芯片组架构,由三星制造和封装四个计算芯片,这有助于提高良率。处理器支持每秒 1 拍字节的双精度浮点运算,内存带宽达到每秒 4.8 TB。相比竞争对手,该芯片不需要液冷即可部署在现有数据中心。这种架构减少了制造复杂性。
RebelRack 系统将四个节点整合在一起,每个节点包含八张 PCIe 卡。单个机柜总计提供 32 个加速器,FP8 算力达到 64 拍字节每秒。这种设计允许企业利用现有的空气冷却系统,无需大规模改造基础设施。HBM3e 容量达到 4.6 TB,聚合内存带宽为 153.6 TB/s。
内存供应是行业瓶颈,Rebellions 利用与韩国财团的关系确保 HBM3e 供应。SK 海力士和三星是全球最大的 HBM 供应商,这为公司提供了供应链优势。单个计算节点可容纳八张 PCIe 卡,总热功耗设计为 600 瓦。这避免了与台积电争夺有限的封装产能。
软件生态与战略融资
软件栈基于开源框架,包括 PyTorch 和 vLLM,降低了开发者的使用门槛。公司强调从编译器到操作系统层面均采用开放标准。Rebellions 是 PyTorch 基金会成员,这增强了其生态兼容性。
"我们正在学习过去的经验,并将这些能力带到其他地区。"Marshall Choy 告诉 The Register。
网络架构方面,RebelRack 通过四路 400 Gbps 网络连接节点,而 RebelPod 支持 800 Gbps 以太网。Choy 指出网络 fabric 将是未来重点关注的领域,以支持更大规模部署。目前大多数 GPU 系统每卡至少配备一个 800 Gbps 网卡。这可能导致集群扩展时的网络瓶颈。
本轮融资由 Mirae Asset Financial Group 和韩国国家增长基金领投。资金将用于支持向西扩张及开发更高效的加速器。报告称公司可能今年或明年提交上市申请。
随着 Nvidia 和 AMD 主导市场,Rebellions 试图通过无需液冷的方案寻找差异化机会。其成功与否取决于能否在现有基础设施中证明性能优势。未来需关注其软件栈的实际部署表现。挑战在于能否提供足够的性能以说服企业迁移。