RTX5090震撼亮相、全球最小AI超算五月上市、“物理AI”大时代开启
北京时间1月7日,英伟达创始人兼CEO黄仁勋穿着6.5万的Tom Ford新夹克亮相拉斯维加斯CES展会,发表开幕主题演讲,并推出一系列新产品和技术。以下为发布会主要亮点:
推出新一代基于Blackwell架构的GPU RTX 5090,高端型号RTX 5090拥有920亿个晶体管,可提供3400 TOPS算力,具备4000 AI TOPS(每秒万亿次操作)的性能,售价1999美元。
RTX 5070、RTX 5070 Ti、RTX 5080和RTX 5090的售价分别为:549美元(约4023元)、749美元(约5489元)、999美元(约7321元)和1999美元(约14651元)。其中,RTX 5070性能和此前售价1599美元的RTX 4090相同的性能,相当于降价1/3。
推出Blackwell架构最新的关键互联技术NVLink72。晶体管数量达到130万亿,72个Blackwell GPU具备1.4 ExaFLOPS TE FP4计算能力,拥有2592个Grace CPU核心。“
Scaling law仍在继续”:第一个scaling law是预训练;第二个scaling law 是后训练;第三个scaling law是测试时计算。
展示具有“Teat-Time Scaling”功能的Agentic AI,支持计算器、网络搜索、语义搜索、SQL搜索等工具,甚至可以生成播客。
推出Nemotron模型,包括Llama Nemotron大型语言模型和Llama Nemotron大型语言模型,分为Nano、Super和Ultra三档。
AI智能体可能是下一个机器人产业,可能是价值数万亿美元机会。
推出物理AI世界基础模型Cosmos,开源可商用,该模型可以将图像和文本转换为机器人的可操作任务,无缝集成视觉和语言理解来执行复杂的动作。
宣布生成式 AI 模型和蓝图,将NVIDIA Omniverse集成进一步扩展到机器人、自动驾驶汽车和视觉 AI 等物理 AI应用中。
物理AI将彻底改变价值50万亿美元的制造业和物流行业,所有移动的东西——从汽车、卡车到工厂和仓库——都将由机器人和AI实现。
发布全球最小的个人AI超级计算机——Project Digits。该超算搭载全新Grace Blackwell超级芯片,支持个人直接运行2000亿参数的大模型,两台Project Digits可以跑通4050亿参数的大模型。
一切都始于1993年
英伟达在CES 2025主题演讲中回顾了公司的发展历史,从NV1和街机游戏机开始,逐渐发展成为一家人工智能(AI)巨头。其目标是将机器学习应用于所有可能的应用程序,所有这些都由英伟达GPU提供支持。
英伟达在CES 2025上最新发布了下一代GeForce硬件RTX 50系列GPU,由Blackwell架构提供支持。
其中,英伟达RTX 5070 GPU售价549美元,据介绍,它将以各种方式利用人工智能(AI),以三分之一的价格提供相当于RTX 4090的性能。它还将使笔记本电脑的性能更高,移动版RTX 5070的功耗仅为RTX 4090的一半。
英伟达RTX 5090售价高达1999美元(约合人民币1.46万元),具有3400 AI TOPS的性能;RTX 5080售价999美元(预计比拼即将发布的RTX 4080 Super),其AI性能略高于RTX 5090的一半,为1800 TOPS;接下来是RTX 5070 Ti,售价749美元,性能为1400 TOPS;最后是RTX 5070,性能为1000 TOPS,价格为549美元。
鉴于所述的AI TOPS性能,显而易见的第一件事是英伟达相对于Ada Lovelace 的AI计算操作增加一倍——至少对于INT8工作负载而言。Blackwell RTX 50 系列概述已经有一段时间传闻规格,并且基于 AI TOPS,我们已经继续更新数据,至少为我们提供时钟速度和核心配置的大致估计。
这些也不仅仅是随机猜测。即使确切的核心数量和时钟速度可能略有偏差,所述的计算水平也应该可以行得通。英伟达表示,RTX Blackwell通过着色器提供125 TFLOPS的FP32图形计算,比其Ada一代高出1.5倍,而AI性能将是其3倍。因此,相对于着色器性能的AI性能翻了一番。
Blackwell中使用了第五代张量核心,考虑到这些GPU的多用途用例——它们将用于游戏卡,但也会用于专业GPU和数据中心AI解决方案——预测张量核心的各个方面都得到了升级。
有趣的是,如果插入时钟速度和传闻的核心数量,我们可以更好地了解RTX 50系列最终规格。125 TFLOPS数字还伴随着最大4000 INT8 TOPS,而RTX 5090将其缩减为3400 TOPS。因此,125 TFLOPS数字预计代表了完全启用的Blackwell芯片,而RTX 5090将仅部分启用。
目前有传言称GB202最多有192个SM,而RTX 5090将只启用170个。计算一下,RTX 5090的着色器计算能力将达到约107 TFLOPS,而其着色器计算能力达到3400 TOPS。但1.8 TB/s的带宽数字与之前传闻在512位内存接口上运行的28 Gbps GDDR7内存完全匹配。
如果英伟达将其所有游戏GPU上的AI计算能力翻倍,可以做什么?当然,它计划推出新功能和软件解决方案来利用这些功能。RTX 5070提供1000 TOPS的计算能力,性能几乎与RTX 4090相同,但价格仅为其三分之一,这为计算要求更高的任务打开了大门。
最有可能的用例之一是基于AI的纹理压缩。该想法已经在上一代硬件上运行过,但不是在极端帧速率下。早在2023年5月,神经纹理压缩(NTC)的运行速度还不到标准BTC(块截断编码)压缩的一半。但18个月后,随着AI计算能力的增强和训练的增多,可以想象NTC的运行速度将与传统BTC相同。
考虑到对现代游戏中GPU耗尽VRAM的担忧,NTC成为Blackwell一代硬件的主要新功能之一也就不足为奇了。它以三分之一的内存使用率拥有更高的图像质量,如果加以利用,甚至可以使8GB显卡更加可行。只有一个小问题:许多游戏都是跨平台游戏,可在搭载AMD GPU的主机上运行。
如果英伟达的新纹理压缩技术只需要一张RTX显卡,那么有多少游戏会支持它?如果需要一张RTX 50系列显卡,这个数字就会小得多。但英伟达有足够的影响力来推动游戏市场的发展,而AMD和英特尔却做不到。
这会是传闻中的DLSS 4,或者是神经渲染图形吗?英伟达还没有透露,但可以肯定的是,NTC至少会在某个地方属于DLSS的范畴。
除了台式机GPU,英伟达还宣布了移动产品线的产品名称。2025年3月将有RTX 5090、5080、5070 Ti和5070笔记本电脑上市。虽然型号名称与台式机系列一致,但性能会明显降低,预计其他规格也会有类似的削减。
RTX 5090笔记本电脑GPU将提供1850 AI TOPS,起售价为2899美元。这意味着它基本上与台式机RTX 5080相同。移动版RTX 5080降至1350 AI TOPS,略低于台式机5070 Ti。移动版RTX 5070 Ti将具有与台式机RTX 5070相同的1000 TOPS,然后普通版RTX 5070笔记本电脑GPU将提供高达800 AI TOPS——这可能是即将推出的台式机RTX 5060 Ti的预告。
英伟达CES 2025主题演讲的其余部分花了很多时间谈论了AI在各种其他领域的应用——汽车、医疗、仓库、机器人等。
量子计算一夜跳水
而刚炒热的量子计算,被老黄浇了一盆冷水,多家“潜力股”一夜跳水。
英伟达首席执行官黄仁勋在公司分析师日的问答环节中直言,“非常有用”的量子计算机可能还需数十年才能到来。他表示:
“如果说十五年后会出现非常有用的量子计算机,那可能还为时过早。如果说三十年,或许又有些过于悲观;如果说二十年,我想我们很多人都会相信。”
黄仁勋的一番言论在资本市场引发了剧烈反应。与量子计算概念相关的公司股价在盘后交易中暴跌。周三,IonQ跌超47.7%后收跌39%,Quantum Computing跌超51.4%后收跌43.34%,D-Wave Quantum跌超51.3%收跌36.13%,Rigetti Computing重挫超50.8%后收跌45.51%。
近几个月来,这些公司的股票曾因市场对量子计算技术巨大潜力的期待而备受追捧,股价一路飙升。尤其在去年12月谷歌的母公司Alphabet在量子计算领域取得了突破性进展后,市场的兴奋情绪进一步得到提振,该公司的股价在当月一度创下了自2023年5月以来的最佳月度表现。
其他公司的股票也在一段时期内实现了大涨,截至周二美股收盘,Quantum Computing股价在过去12个月里累计涨幅超过1800%,报17.49美元/股;Rigetti的股价在同一时期内也大涨超过1500%至18.39美元;D-Wave和IonQ的股价分别实现了近1000%和超300%的涨幅,分别报9.55美元/股和49.59美元/股。