当前位置:首页 / 智造 / 正文

华为云INSPIRE大会发布四大Agentic AI新品,Token工业化时代来临

来源:互联网

华为云INSPIRE大会发布四大Agentic AI新品,Token工业化时代来临 图1

2026年6月5日,华为云INSPIRE创想者大会在上海西岸国际会展中心举行。华为公司董事、华为云CEO周跃峰在大会上正式发布了面向Agentic AI时代的四大新品:AICS灵衢智算集群、AMS Agentic记忆存储解决方案、CCE VolcanoNext通智一体化调度引擎以及AgentSphere安全自治运行环境。周跃峰表示,Agentic AI时代正在引发计算范式的根本性跃迁,云计算已跨入Token工业化时代。

AICS灵衢智算集群:极致效率的Token工厂

作为本次发布的旗舰产品,AICS灵衢智算集群支持10万卡级规模、总算力达200 EFLOPS,基于超大带宽灵衢网络构建。其核心指标包括:Token生成时延降低至10毫秒以内,千卡每秒吞吐量达500万Tokens,在线服务可用性高达99.95%。周跃峰将其定位为极致效率的Token工厂,这一定位直接回应了当前AI推理场景对基础设施的根本需求——在Agentic AI的工作流中,每次推理都是一次Token生成,集群效率直接决定服务成本与用户体验。

AMS Agentic记忆存储:打破智能体的健忘症

智能体的记忆瓶颈是Agentic AI落地的核心障碍之一。AMS通过NPU直通CMS(上下文记忆存储)的硬件实现,打造了PB级超大记忆空间,支持KV Cache分层池化。这一设计既能显著降低推理成本,又能支撑天级长程任务的连续执行,让智能体真正具备持续学习而非每次从零开始的能力。在金融、医疗、法律等需要长期上下文记忆的垂直场景中,AMS的实用价值尤为突出。

VolcanoNext与AgentSphere:调度与安全的双支柱

CCE VolcanoNext通智一体化调度引擎采用训推共池加碎片整合核心技术,将资源利用率提升30%以上,解决了AI训练与推理负载在共享集群中相互抢资源的痛点。AgentSphere则以100毫秒级极速启动、每分钟十万级批量创建的能力,为智能体提供安全自治的运行底座。其内置的羽量级沙箱技术和意图主动防护机制,确保智能体在规模化上云过程中不被恶意利用或产生非预期行为。

软硬芯协同做厚硅基黑土地

周跃峰在演讲中反复强调软硬芯协同系统创新的战略主张。在他看来,后训练正从静态调参走向Agentic RL(强化学习)自主进化,底层基础设施正在加速实现通智一体化——即通用计算与智能计算在同一套架构上高效协同。唯有将Token成本、一体化调度、RL效率与安全自治做到极致,才能主导Agentic AI时代基础设施发展的主动权。从AICS到AgentSphere,华为云正在用软硬芯协同的系统工程思维,构建一条从底层算力到上层Agent运行环境的完整Agentic Infra栈。

声明:

1、凡本网注明“来源:XXX(非科极网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。

2、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。