
本文开首:时期周报 作家:高浩翔开云(中国)Kaiyun·官方网站 - 登录入口

云天励飞(688343.SH)又拿下4.2亿元大单。
3月12日,凭证公开招标信息,云天励飞中标湛江市AI渗入⽀撑新质⽣产⼒基础步履成立项⽬(以下简称“湛江风光”),中标⾦额4.2亿元。风光将基于云天励飞自研的国产AI推理加快卡,成立国产AI推理千卡集群。集群策划搭载DeepSeek等国产大模子,为政务、产业及关系应用场景提供愈加通俗、低本钱的AI才略。
云天励飞2025年度功绩快报涌现,当年一年,云天励飞竣事营收13.08亿元,较上年同期增多42.57%;归母净损失4.02亿元,较上年同期收窄30.50%。在此节点揽下4.2亿元算力基建风光,不仅是对其自研芯片交易化才略的有劲背书,更将径直变嫌为公司改日功绩捏续增长的动能。
但关于云天励飞来说,比财务孝顺,湛江风光的标杆意旨更阻止淡薄。当东谈主工智能从实验室走向产业的深水区,算力的价值就不再是刷榜的观念,而是赋能千行百业的普惠坐褥力。从这个角度看,湛江风光不仅是短期营收的助推器,更是云天励飞讲解自研实力、霸占产业高地的关键一役。
四肢首个寰球产化AI推理千卡集群,湛江风光不仅是云天励飞推理算力限制化商用落地的标杆风光,还为“国模国芯”的深度交融提供了最好的试验场,助其不休向万卡集群的地点鼓吹
当产业焦点从教师峰值转向推理本钱,谁能以更低本钱提供贯通的大限制推理才略,谁就能不才一轮AI竞赛中占据先机。云天励飞在湛江布下的这枚棋子,恰是其面向推理时期的一次关键卡位。
AI算力需求⾛向“推理优先”
不同于当年国内智算中心宽阔实施的“训推一体”成立模式,云天励飞这次在湛江落地的风光,聘任了一条更为聚焦的本事旅途——专注推理任务的AI推理集群,主要⾯向各类⾏业应⽤场景,为传统产业的AI化提供径直⽀撑。
这一行向背后,其实是AI产业逻辑的深远变革。
AI算力体系⼤体不错分为教师算⼒与推理算⼒。其中,教师算力决定模子若何完成从0到1的才略构建,更为可贵皆备的筹画才略;而推理算力主若是讹诈教师好的神经收集模子进行推理预测,更强调实用,对算力的条款相对低一些,更热心低延时、低功耗。
当年几年,行业的兴盛点更多皆集在参数限制的武备竞赛上,百亿、千亿致使万亿参数的大模子轨范登场,各家大厂都在争相褫夺模子才略的高点。可是,跟着模子才略的锻练,产业界运行时常追问一个更施行的问题:模子这样强,到底能在哪些场景里着实创造价值?
推理算力因此受到更多的酷好。⽆论是春节时分⼤热的SeeDance,近期⼴泛琢磨的“小龙虾”,照旧各⾏业不休上线的AI Agent应⽤,背后都离不开推理算力的撑捏。据市集分析机构Gartner预测,2026年,约55%的AI专用云基础步履支拨将用于推理使命负载。
这正好是云天励飞的上风。这家国产芯片厂商还是专注在推理芯片范围多年,其始创的“算力积木”架构,还是在国产先进工艺下竣事算力的天真拓展,并面向边端、具身智能、云霄等范围,推出“深界”“深擎”“深穹”系列芯片。
也恰是获利于此,云天励飞才调更好地悠闲湛江风光的需求,
大模子推理当用需要同期悠闲高并发、高迷糊与低蔓延的需求。同期,跟着大模子险阻文长度不休增多,大批中间情状需要以KV Cache(键值缓存)的体式存储。因此,业内宽阔以为,改日推理系统的性能瓶颈将越来越多来自数据访谒效果,而不单是是筹画才略。
在这一布景下,算力、存储与收集之间的协同设想,正逐步成为AI基础步履的迫切竞争力。
本次在湛江落地的千卡推理集群,恰是围绕这一想路进行构建。该集群继承云天励飞自主研发的AI推理芯片,并在系统架构上成立了“优先优化Prefill、兼顾Decode”的本事道路。通过在芯片设想中对筹画资源与存储带宽进行针对性竖立,使系统在长险阻文推理场景下依然大概保捏较高的迷糊效果。
在收集互联方面,云天励飞继承长入高速互联架构,通过400G光收集构建集群物理层收集,竣事节点之间的高带宽、低蔓延通讯;在部署才略上,该架构既不错支捏单节点数十卡限制膨胀,也大概平滑膨胀至千卡级集群限制,从而适配不同限制的AI应用需求。
通过芯片架构、收集互联以及系统转换等多层优化,这一推理集群在全体效果与本钱末端方面酿成了彰着上风,为AI限制化应用提供了愈加经济的算力决策。
要把百亿Token的本钱压至一分钱
关于云天励飞来说,湛江风光的落地还只是一个运行。
跟着⼤模子逐步进⼊应⽤阶段,产业热心点正从“算⼒峰值”转向“单元本钱效果”。换句话说,改日AI产业竞争的迫切维度,不仅在于模子能⼒本⾝,还在于谁大概以更低本钱提供贯通的⼤限制推理能⼒。
四肢推理芯片先驱的云天励飞对此有着明确的感知。本年2月,云天励飞以鼓吹百万Token推理本钱每年两位数的裁减为地点,厚爱发布了改日三年的大算力芯片狡计。
其中,第一代超节点P芯片将于本年推出,其将面向百万长险阻文的场景进行极致的Prefill推理优化,在算力上紧跟H100;随后,2027年,云天励飞将研发第一代超节点D芯片,以此在Decode推理方面竣事超低延时;终末,于2028年,云天励飞将研发第二代超节点D芯片,奋勉于通过系统级协同优化,竣事Prefill与Decode性能的全体缓助,向毫秒级推理时延地点迈进。
蓝图已然绘就,但再广阔的本事狡计,最终都需要落地场景来考据其交易价值。芯片设想是否着实契合产业需求?Prefill与Decode的资源竖立能否在本体负载中达到最优?KV Cache带来的数据访谒压力如安在千卡级限制下灵验疏解?这些问题无法在实验室里给出最终谜底,必须在着实的产业环境中经受试验。
因此,关于云天励飞来说,湛江风光不单是一次省略的风光委用,更是一场本当事人力的实战演练。
据悉,湛江风光将分三期成立,一起继承云天励飞自研的国产AI推理加快卡。一期风光将部署云天励飞X6000推理加快卡;二、三期成立将领先搭载公司最新一代芯片居品。其中,云天励飞首款Prefill芯片DeepVerse100瞻望将在年内完成流片,并策划在湛江集群中领先部署。
与此同期,湛江风光所构建的千卡级推理集群,还展现出极强的弹性部署才略。在典型架构下,一个千卡级集群平庸由多级膨胀结构构成:从单节点8卡、32卡,到64卡致使百卡级超节点,再到跨节点的大限制集群。通过这一限制系统的本体运行,不错充分考据卡间互联、节点通讯和负载平衡等关键本事,为云天励飞改日更大限制AI算力系统成立积存教养。
在更永久的狡计中,云天励飞提议“1001策划”,即以“百亿Token一分钱”为永久地点,通过芯片与系统协同优化捏续裁减大模子推理本钱。
如果这一地点大概成为施行开云(中国)Kaiyun·官方网站 - 登录入口,AI将会着实变得像水和电相似,变成流淌于百行千业的基础步履。而关于领先在推理赛谈上布局的云天励飞来说,也将迎来一个属于“卖水东谈主”的黄金时期。