马斯克公布更新版Grok3，宣称已超越DeepSeek等-观察者网

北京时间2月18日，埃隆·马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型，马斯克称之为“地球上最聪明的人工智能”。

在xAI当天的直播中，马斯克和三位工程师一起进行了各种现场演示。在演示的数学、科学和编程基准测试中，Grok 3击败了谷歌Gemini、DeepSeek的V3和R1模型、Anthropic的Claude和OpenAI的GPT-4o。

据演示发布的数据，在Chatbot Arena这一用于众包人工智能基准测试的开放平台上，Grok 3也是第一个得分超过1400分的模型。

马斯克表示，Grok 3比Grok 2的能力提升了一个数量级，超越所有现有的人工智能模型。Grok 3在经过了合成数据的训练后，已经能够通过重新分析信息来反思自己的错误，从而获得更好的逻辑一致性。

马斯克又提到了开发Grok 3的巨额投入。据他介绍，Grok 3模型训练计算量（能力）比上一代高10倍，使用了20万张GPU卡集群，第一阶段的122天使用了10万个GPU全面训练同步，第二个阶段的92天则扩展到使用20万张GPU卡再次训练、推理。除此之外，为了训练Grok 3，xAI团队还将数据中心的容量翻了一倍。

有分析称，Grok 3算力消耗是Deepseek V3的263倍。

xAI团队还在直播中首次透露，目前已经启动了下一个阶段的AI集群构建。“比Grok 3更好的模型必须在深度学习科学和工程的各个方面都表现出色，因此这绝非易事，”团队在直播中称，“我们已经开始研究下一个AI集群，它将较目前的集群强大约5倍。”

直播结束后，OpenAI联合创始团队成员、AI研究学者安德烈·卡帕斯发文表示：Grok 3+Thinking大概和OpenAI 最强的模型o1-pro（目前需付费使用，月费 200 美元）相当，比DeepSeek-R1和Gemini 2.0 Flash Thinking略好一些。

“考虑到该团队大约1年前从零开始，这个达到最先进领域的时间表是前所未有的，这真是令人难以置信。”卡帕斯表示。

本文系观察者网独家稿件，未经授权，不得转载。