曦望发布新一代推理GPU芯片S3
技术资讯
AI资讯解读
先看这条资讯为什么重要,再判断它会影响哪条主线和哪些公司。
这类资讯通常先看什么:这类资讯市场通常先看技术突破是否真实落地,以及谁先受益。
这条资讯到底为什么重要
关键数据 • 融资规模: 近30亿元 ↑ • 推理成本:百万Token一分钱(行业领先水平) • 支持参数:千亿至万亿级MoE模型 利好还是利空: 中长期偏利好 主要风险 • 技术风险:推理性能与国际巨头仍存差距,高端市场突破难度大 • 竞争风险:推理芯片赛道拥挤,英伟达、AMD等持续降价挤压空间 • 商业化风险:大模型推理需求释放节奏不确定,影响芯片出货量 一句话总结: 国产推理芯片加速迭代,成本优势推动AI算力产业链向推理侧延伸。
先看核心要点
国产推理芯片迭代加速 曦望发布新一代启望S3推理GPU及寰望SC3-256超节点方案,可支持千亿至万亿级参数多模态MoE推理场景
该产品定位大模型推理市场,与商汤、第四范式等发起 百万Token一分钱 推理成本计划,较当前主流方案成本大幅下降
技术驱动与成本优化双轮驱动 产业资本加速布局 曦望前身为商汤大芯片部门,一年内完成 近30亿元 战略融资,并与浙江大学成立智能计算联合研发中心
半导体为什么值得看
短期看: 推理芯片新品密集发布刺激产业链备货需求,利好上游 先进封装、HBM存储、CoWoS产能 等环节,推动AI芯片产业链从训练侧向推理侧延伸布局
中长期看: 推理成本快速下降加速大模型商业化进程,国产推理芯片凭借性价比优势有望在中低端市场实现 国产替代突破 ↑,重塑AI算力市场格局,拉动国内半导体设计、制造、封测全链条需求增长
📄
资讯原文
《科创板日报》27日讯,曦望今日发布新一代推理GPU芯片启望S3,并同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可适配千亿、万亿级参数的多模态 MoE 推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万Token 一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近30亿元战略融资。(记者 黄心怡)