2月18日,埃隆·马斯克再次上演标志性迟到。在延迟20分钟后,他揭开了xAI万众期待的旗舰AI模型:Grok-3。这场直播以”我们的使命是理解整个宇宙”为主题。马斯克宣称Grok-3是”地球上最聪明的人工智能”,并透露其性能比前代Grok-2提升10倍。
Grok-3的突破性优势
Grok-3在孟菲斯巨型超算中心完成训练,动用20万块GPU仅耗时122天建成。工程团队还透露Grok-3属于模型家族,包含轻量版Grok-3 Mini,该版本以牺牲部分精度换取速度提升。

在多项测试中,Grok-3以惊人表现刷新纪录:
- 数学(AIME ’24):96分碾压DeepSeek-R1(87分)和GPT-4
- 科学(GPQA):研究生级知识问答领先群雄
- 编程(LCB):复杂代码生成速度超越Claude 3.5和Gemini 2.0268
- 以1402分登顶Chatbot Arena排行榜,成为首个突破1400分大关的模型,击败OpenAI、Google和Anthropic

AI领域的里程碑突破
在AIME 2025测试中,Grok-3 Reasoning Beta和Grok-3 Mini Reasoning均突破90分,在推理挑战中击败其他竞争者。
Grok-3展示了生成《俄罗斯方块×宝石迷阵》完整游戏代码(含3D效果)的多面手能力,更挑战了著名未解之谜黎曼猜想,展现出处理复杂思维链条的实力。

“深度搜索”模式登场
Grok-3配备DeepSearch模式,将文献研究、头脑风暴、代码调试整合为一体化解决方案。创新性”思维链”机制支持Test-Time Compute,开启Big Brain模式后问题解决深度提升263%。
如何获取Grok-3
不过,这个地球最强AI并非人人可用。
X Premium 用户可立即解锁Grok-3完整权限,SuperGrok订阅用户享受无限图像生成和深度搜索额度,订阅费为每月30美元。

马斯克承诺,一旦Grok-3趋于稳定,Grok-2模型就会开源。他还表示:”xAI的创新速度将彻底改写AI竞争格局!”