马斯克公布演示Grok3大模型,称已超越DeepSeek等对手

来源:观察者网

2025-02-18 15:37

北京时间2月18日,埃隆·马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。

在xAI当天的直播中,马斯克和三位工程师一起进行了各种现场演示。在演示的数学、科学和编程基准测试中,Grok 3击败了谷歌Gemini、DeepSeek的V3和R1模型、Anthropic的Claude和OpenAI的GPT-4o

据演示发布的数据,在Chatbot Arena这一用于众包人工智能基准测试的开放平台上,Grok 3也是第一个得分超过1400分的模型。

马斯克表示,Grok 3比Grok 2的能力提升了一个数量级,超越所有现有的人工智能模型。Grok 3在经过了合成数据的训练后,已经能够通过重新分析信息来反思自己的错误,从而获得更好的逻辑一致性。

马斯克又提到了开发Grok 3的巨额投入。据他介绍,Grok 3模型训练计算量(能力)比上一代高10倍,使用了20万张GPU卡集群,第一阶段的122天使用了10万个GPU全面训练同步,第二个阶段的92天则扩展到使用20万张GPU卡再次训练、推理。除此之外,为了训练Grok 3,xAI团队还将数据中心的容量翻了一倍。

有分析称,Grok 3算力消耗是Deepseek V3的263倍。

xAI团队还在直播中首次透露,目前已经启动了下一个阶段的AI集群构建。“比Grok 3更好的模型必须在深度学习科学和工程的各个方面都表现出色,因此这绝非易事,”团队在直播中称,“我们已经开始研究下一个AI集群,它将较目前的集群强大约5倍。”

直播结束后,OpenAI联合创始团队成员、AI研究学者安德烈·卡帕斯发文表示:Grok 3+Thinking大概和OpenAI 最强的模型o1-pro(目前需付费使用,月费 200 美元)相当,比DeepSeek-R1和Gemini 2.0 Flash Thinking略好一些。

“考虑到该团队大约1年前从零开始,这个达到最先进领域的时间表是前所未有的,这真是令人难以置信。”卡帕斯表示。

本文系观察者网独家稿件,未经授权,不得转载。

责任编辑:张译心
观察者APP,更好阅读体验

HDMI收税20年,移动“超高清时代”能否有中国标准?

美企急电:快取消越南、印尼订单,转回中国

“无论承认与否,硅谷精英变成‘中国必胜论’拥趸”

拿中国说事,美高官想拦下这笔交易

中哥走近,美国又跳出来