首发丨曦望完成近30亿元)战略融资,All-in推理GPU,曦望文化传播股份有限公司

  更新时间:2026-01-22 16:53   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

同时也昆仑芯核心架构师显著降低单位Token推理成本

<p id="48S8V3QO">AI推理算力赛]道再迎重磅资(本注入。</p> <p id="48S8V3QP">1月22日,专注于极致推理GPU芯片的科技公司曦望(Sunrise)宣布一年内完成近30亿元战略融资,投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,以及IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构,同时也获得诚通混改基金等国资背景资本加持。本轮资金将主要用于下一代推理GPU研发、规模化量产及生态共建。</p> <p id="48S8V3QQ">作为国内“首家All-in推理的GPU芯片公司”,曦望连续获得多家机构投资,折射出AI产业从“训练红利”向“推理红利”切换的核心趋势。当模型训练进入深水区,推理环节的效率、成本与稳定性,已成为决定AI商业化能否落地的关键因素。</p> <p class="f_center"><br></p> <p id="48S8V3QS"><strong>从商汤基因到独立突围,构建推理算力“真护城河”</strong></p> <p id="48S8V3QT">曦望成立于2020年,前身为商汤科技大芯片部门。在长期服务于实际AI业务的过程中,团队积累了对模型演进、算子优化及客户需求形成深刻理解,这让其从诞生之初就贴上了“更懂AI的GPU芯片公司”标签。</p> <p id="48S8V3QU">团队层面,曦望的核心团队在芯片工程与产品化、商业化能力之间形成互补。联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,并于2020年加入商汤,成功主导了曦望两代芯片的研发和量产;另一位联席CEO王湛则为百度创始团队成员、原集团副总裁,曾带领8000人团队负责百度搜索业务,并于2025年初加入曦望再创业,负责公司产品化和商业化。</p> <p id="48S8V3QV">目前,曦望团队规模约300人,成员主要来自NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验。多位投资人表示,这种同时具备芯片工程能力与大规模业务经验的团队结构,在当前推理GPU这一强调“稳定交付与成本控制”的赛道中十分稀缺。</p> <p id="48S8V3R0"><strong>三代芯片落地,剑指“百万Token一分钱”</strong></p> <p id="48S8V3R1">与多数国产芯片厂商仍试图在通用GPU参数上追赶主流产品不同,曦望选择了差异化的路径——围绕推理场景的成本与效率,对芯片架构进行“重写”。曦望并未沿用传统训推一体GPU为训练优化的设计思路,其在调度、缓存、片上SRAM、互联及编译器路径上进行推理场景原生优化,并结合LPDDR内存技术,显著降低单位Token推理成本。同时,曦望采取全栈自研方式,覆盖指令集、GPGPU IP及编译工具链等关键环节。公司已累计并持有200余项核心专利,并在此前的产品中实现“一次流片成功”。</p> <p id="48S8V3R2">公开信息显示,曦望在过去数年研发投入累计20亿元,已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求。其中,2020年量产的S1芯片,作为国内首款视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户;2024年量产的S2芯片,对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型;2026年即将推出的S3芯片定位为“推理性价比之王”,在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准。</p> <p id="48S8V3R3"><strong>不拼参数拼成本,做AI产业的“损益表优化师”</strong></p> <p id="48S8V3R4">“如果能让推理成本下降90%,并提供更稳定的服务,我们的竞争就不是‘又一个芯片’,而是‘重写中国AI产业的损益表’。”曦望联席CEO王湛的观点精准概括了公司的差异化定位。</p> <p id="48S8V3R5">在曦望看来,对算力厂商、AI原生应用开发者而言,推理能效、SLA稳定性与Token成本,才是决定业务毛利率与用户体验的核心指标。因此,曦望选择不与训推一体GPU拼参数,而是聚焦真实场景的单位经济性,成为现有算力系统的“推理分流与成本优化层”——与本土芯片厂商合作为客户构建推理加速专区,形成独特的竞争生态。</p> <p id="48S8V3R6">“我们的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力。”王湛表示。</p> <p id="48S8V3R7">随着AI推理红利的全面释放,曦望的崛起不仅是商汤系技术产业化的成功实践,更标志着国产AI芯片正从“跟跑”转向“差异化领跑”。当推理成为AI产业盈利的核心抓手,这家专注于“把推理成本打下来”的公司,或将重塑中国AI基础设施的产业格局。</p>

编辑:Jay Cavanaugh