黄仁勋诚不欺我!大摩最新报告:英伟达最新AI GPU贵两倍但长远回报更高

艾奇百科 百科资讯 1

5月18日消息,投资银行摩根士丹利在最新报告中指出,超大规模数据中心运营商使用英伟达当前的Blackwell AI GPU构建一座1吉瓦规模的数据中心,其建造成本将是使用谷歌TPU或亚马逊Trainium芯片构建同等规模数据中心的两倍。

尽管英伟达Blackwell芯片的数据中心建造成本翻倍,但摩根士丹利认为其计算效率远超定制芯片。

摩根士丹利在报告中将英伟达多款GPU与亚马逊及谷歌的定制ASIC芯片进行了每瓦TFLOPS性能对比。测算结果显示,英伟达芯片的每瓦性能比这些定制ASIC芯片高出2到8倍。

此前,英伟达CEO黄仁勋曾多次公开表示,英伟达芯片虽然价格高昂,但长期来看能为客户带来更高的回报。

在具体每瓦浮点运算性能得分中,英伟达计划推出的下一代Vera Rubin(FP4)架构芯片得分高达19.5,位居榜单第一。英伟达其他芯片Vera Rubin(FP8)得分为6.8,GB300(FP8)得分为6.0,H100(FP8)得分为3.1。

作为对比,谷歌的TPUv7(FP8)得分仅为4.3,亚马逊的Trn3(FP8)得分仅为2.5,两者的定制芯片性能基本介于英伟达Blackwell与上一代Hopper之间,部分指标甚至低于Hopper。

不过评估AI芯片还有其他维度。人工智能基础设施提供商Nebius分析指出,另一大关键标准是每百万Token的生成成本与GPU每小时运行成本的比值。

根据Nebius测算,Groq AI芯片每生成百万Token的成本为5到10美分(约合0.34至0.68元人民币),其生成速度达每秒800个Token。

英伟达Blackwell芯片每生成百万Token的成本则为25美分(约合1.70元人民币),生成速度约为每秒450个Token。