首发丨曦望完成近30亿元)战略融资，All-in推理GPU,曦望文化传播股份有限公司

更新时间：2026-01-22 16:53 来源：牛马见闻

商务部回应加拿大油菜籽问题：将在规则框架内充分考虑加方合理诉求

斥资5.6亿，看完《惊蛰无声》预告片，我想说：张艺谋又赌赢了！,惊蛰mv

高晓松曾说：美国“donor器官捐献”是个很好的制度，特别想推荐给我们政府

达沃斯论坛：中国为世界提供“机遇清单”

外交部：亚洲是举世公认的全球发展繁荣高地

�同时也昆仑芯核心架构师�显著降低单位Token推理成本�

AI推理算力赛]道再迎重磅资(本注入。 1月22日，专注于极致推理GPU芯片的科技公司曦望（Sunrise）宣布一年内完成近30亿元战略融资，投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方，以及IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构，同时也获得诚通混改基金等国资背景资本加持。本轮资金将主要用于下一代推理GPU研发、规模化量产及生态共建。 作为国内“首家All-in推理的GPU芯片公司”，曦望连续获得多家机构投资，折射出AI产业从“训练红利”向“推理红利”切换的核心趋势。当模型训练进入深水区，推理环节的效率、成本与稳定性，已成为决定AI商业化能否落地的关键因素。 从商汤基因到独立突围，构建推理算力“真护城河” 曦望成立于2020年，前身为商汤科技大芯片部门。在长期服务于实际AI业务的过程中，团队积累了对模型演进、算子优化及客户需求形成深刻理解，这让其从诞生之初就贴上了“更懂AI的GPU芯片公司”标签。 团队层面，曦望的核心团队在芯片工程与产品化、商业化能力之间形成互补。联席CEO王勇为前AMD、昆仑芯核心架构师，拥有20年芯片研发经验，并于2020年加入商汤，成功主导了曦望两代芯片的研发和量产；另一位联席CEO王湛则为百度创始团队成员、原集团副总裁，曾带领8000人团队负责百度搜索业务，并于2025年初加入曦望再创业，负责公司产品化和商业化。 目前，曦望团队规模约300人，成员主要来自NVIDIA、AMD、昆仑芯、商汤等企业，核心技术骨干平均拥有15年行业经验。多位投资人表示，这种同时具备芯片工程能力与大规模业务经验的团队结构，在当前推理GPU这一强调“稳定交付与成本控制”的赛道中十分稀缺。 三代芯片落地，剑指“百万Token一分钱” 与多数国产芯片厂商仍试图在通用GPU参数上追赶主流产品不同，曦望选择了差异化的路径——围绕推理场景的成本与效率，对芯片架构进行“重写”。曦望并未沿用传统训推一体GPU为训练优化的设计思路，其在调度、缓存、片上SRAM、互联及编译器路径上进行推理场景原生优化，并结合LPDDR内存技术，显著降低单位Token推理成本。同时，曦望采取全栈自研方式，覆盖指令集、GPGPU IP及编译工具链等关键环节。公司已累计并持有200余项核心专利，并在此前的产品中实现“一次流片成功”。 公开信息显示，曦望在过去数年研发投入累计20亿元，已形成三代芯片产品矩阵，覆盖从视觉推理到大模型全场景推理的需求。其中，2020年量产的S1芯片，作为国内首款视觉推理芯片，适配千余种CV模型，已实现IP授权索尼、小米等头部客户；2024年量产的S2芯片，对标主流A/H系列GPU，兼容CUDA生态，已成功适配DeepSeek、Qwen等主流模型；2026年即将推出的S3芯片定位为“推理性价比之王”，在单位Token成本、能耗上实现数量级降低，原生支持FP8/FP4低精度推理，目标直指“百万Token一分钱”的行业新基准。 不拼参数拼成本，做AI产业的“损益表优化师” “如果能让推理成本下降90%，并提供更稳定的服务，我们的竞争就不是‘又一个芯片’，而是‘重写中国AI产业的损益表’。”曦望联席CEO王湛的观点精准概括了公司的差异化定位。 在曦望看来，对算力厂商、AI原生应用开发者而言，推理能效、SLA稳定性与Token成本，才是决定业务毛利率与用户体验的核心指标。因此，曦望选择不与训推一体GPU拼参数，而是聚焦真实场景的单位经济性，成为现有算力系统的“推理分流与成本优化层”——与本土芯片厂商合作为客户构建推理加速专区，形成独特的竞争生态。 “我们的目标是极致降低大模型推理成本与门槛，让算力变得普惠且可广泛获取，从而释放AGI的全部潜力。”王湛表示。 随着AI推理红利的全面释放，曦望的崛起不仅是商汤系技术产业化的成功实践，更标志着国产AI芯片正从“跟跑”转向“差异化领跑”。当推理成为AI产业盈利的核心抓手，这家专注于“把推理成本打下来”的公司，或将重塑中国AI基础设施的产业格局。

编辑：Jay Cavanaugh