马斯克公布演示Grok3大模型,称已超越DeepSeek等对手
来源:观察者网
2025-02-18 15:37
北京时间2月18日,埃隆·马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。
在xAI当天的直播中,马斯克和三位工程师一起进行了各种现场演示。在演示的数学、科学和编程基准测试中,Grok 3击败了谷歌Gemini、DeepSeek的V3和R1模型、Anthropic的Claude和OpenAI的GPT-4o。
据演示发布的数据,在Chatbot Arena这一用于众包人工智能基准测试的开放平台上,Grok 3也是第一个得分超过1400分的模型。
马斯克表示,Grok 3比Grok 2的能力提升了一个数量级,超越所有现有的人工智能模型。Grok 3在经过了合成数据的训练后,已经能够通过重新分析信息来反思自己的错误,从而获得更好的逻辑一致性。
马斯克又提到了开发Grok 3的巨额投入。据他介绍,Grok 3模型训练计算量(能力)比上一代高10倍,使用了20万张GPU卡集群,第一阶段的122天使用了10万个GPU全面训练同步,第二个阶段的92天则扩展到使用20万张GPU卡再次训练、推理。除此之外,为了训练Grok 3,xAI团队还将数据中心的容量翻了一倍。
有分析称,Grok 3算力消耗是Deepseek V3的263倍。
xAI团队还在直播中首次透露,目前已经启动了下一个阶段的AI集群构建。“比Grok 3更好的模型必须在深度学习科学和工程的各个方面都表现出色,因此这绝非易事,”团队在直播中称,“我们已经开始研究下一个AI集群,它将较目前的集群强大约5倍。”
直播结束后,OpenAI联合创始团队成员、AI研究学者安德烈·卡帕斯发文表示:Grok 3+Thinking大概和OpenAI 最强的模型o1-pro(目前需付费使用,月费 200 美元)相当,比DeepSeek-R1和Gemini 2.0 Flash Thinking略好一些。
“考虑到该团队大约1年前从零开始,这个达到最先进领域的时间表是前所未有的,这真是令人难以置信。”卡帕斯表示。
本文系观察者网独家稿件,未经授权,不得转载。