华为云INSPIRE大会发布四大Agentic AI新品,Token工业化时代来临
来源:互联网
2026年6月5日,华为云INSPIRE创想者大会在上海西岸国际会展中心举行。华为公司董事、华为云CEO周跃峰在大会上正式发布了面向Agentic AI时代的四大新品:AICS灵衢智算集群、AMS Agentic记忆存储解决方案、CCE VolcanoNext通智一体化调度引擎以及AgentSphere安全自治运行环境。周跃峰表示,Agentic AI时代正在引发计算范式的根本性跃迁,云计算已跨入Token工业化时代。
AICS灵衢智算集群:极致效率的Token工厂
作为本次发布的旗舰产品,AICS灵衢智算集群支持10万卡级规模、总算力达200 EFLOPS,基于超大带宽灵衢网络构建。其核心指标包括:Token生成时延降低至10毫秒以内,千卡每秒吞吐量达500万Tokens,在线服务可用性高达99.95%。周跃峰将其定位为极致效率的Token工厂,这一定位直接回应了当前AI推理场景对基础设施的根本需求——在Agentic AI的工作流中,每次推理都是一次Token生成,集群效率直接决定服务成本与用户体验。
AMS Agentic记忆存储:打破智能体的健忘症
智能体的记忆瓶颈是Agentic AI落地的核心障碍之一。AMS通过NPU直通CMS(上下文记忆存储)的硬件实现,打造了PB级超大记忆空间,支持KV Cache分层池化。这一设计既能显著降低推理成本,又能支撑天级长程任务的连续执行,让智能体真正具备持续学习而非每次从零开始的能力。在金融、医疗、法律等需要长期上下文记忆的垂直场景中,AMS的实用价值尤为突出。
VolcanoNext与AgentSphere:调度与安全的双支柱
CCE VolcanoNext通智一体化调度引擎采用训推共池加碎片整合核心技术,将资源利用率提升30%以上,解决了AI训练与推理负载在共享集群中相互抢资源的痛点。AgentSphere则以100毫秒级极速启动、每分钟十万级批量创建的能力,为智能体提供安全自治的运行底座。其内置的羽量级沙箱技术和意图主动防护机制,确保智能体在规模化上云过程中不被恶意利用或产生非预期行为。
软硬芯协同做厚硅基黑土地
周跃峰在演讲中反复强调软硬芯协同系统创新的战略主张。在他看来,后训练正从静态调参走向Agentic RL(强化学习)自主进化,底层基础设施正在加速实现通智一体化——即通用计算与智能计算在同一套架构上高效协同。唯有将Token成本、一体化调度、RL效率与安全自治做到极致,才能主导Agentic AI时代基础设施发展的主动权。从AICS到AgentSphere,华为云正在用软硬芯协同的系统工程思维,构建一条从底层算力到上层Agent运行环境的完整Agentic Infra栈。