华为携新一代算力加速卡重磅登场!昇腾 950PR 加持,性能近 3 倍 H20 还支持 FP4

在刚刚落幕的华为中国合作伙伴大会2026上,华为带着全新的技术成果惊艳登场,一款名为Atlas 350的AI训练推理加速卡成为全场焦点,这款加速卡搭载了华为自主研发的全新昇腾950PR(Ascend 950PR)处理器,其卓越性能引发了行业的广泛关注。
昇腾950PR:性能大幅跃升
昇腾950PR较之前一代昇腾芯片实现了多方面的显著提升,在低精度数据格式、向量算力、互联带宽以及自研HBM等关键领域,都取得了重大突破,这意味着它在处理复杂计算任务时,能够展现出更强大的能力和更高的效率。
以英伟达H20作为参照,华为昇腾计算业务总裁张迪煊透露,Atlas 350的单卡算力达到了英伟达H20的2.87倍,这一数据足以证明其在算力方面的领先地位,Atlas 350还是目前国内唯一支持FP4低精度的推理产品,这一特性使其在计算领域具有独特的优势。
卓越的硬件指标
Atlas 350在硬件指标上同样表现出色,其HBM(高带宽内存)容量达到了112GB,是H20的1.16倍,更大的内存容量为数据处理提供了更广阔的空间,使得多模态生成速度能够提升60%,内存访问颗粒度从512字节减少到128字节,这一优化使得小算子访存效率提升了4倍,大大提高了数据处理的速度和效率。
在大会展厅的Atlas 350展台,华为公布了详细的参数,Atlas 350的FP4精度算力为1.56P,带宽达到了1.4TB/s,而功耗为600W,是H20的1.5倍,虽然功耗有所增加,但考虑到其强大的性能提升,这无疑是一次非常值得的升级。
支持多种精度,提升计算效率
Atlas 350除了支持常见的FP16、FP8精度外,还支持更低精度的FP4,这种多精度支持的特性,使得集成Atlas 350板块的服务器能够支持更大的模型,并且在推理过程中实现更低的时延,精度的降低不仅带来了更快的计算速度,还提高了寄存器的使用效率,让服务器在处理复杂任务时更加得心应手。
打造核心算力场景,助力行业智能化
华为昇腾计算业务总裁张迪煊表示,基于Atlas 350等产品,结合AI发展趋势与客户需求,昇腾将打造大、中、小三大核心算力场景,这三大场景能够助力合作伙伴满足不同的差异化场景需求,共同推动行业的智能化发展,无论是大型企业的复杂计算任务,还是中小企业的日常数据处理,昇腾的解决方案都能够提供有力的支持。
更多一手游戏信息请关注慈云游戏网。