2月18日,埃隆·马斯克再次上演标志性的迟到戏码。在推迟20分钟后,他正式发布了xAI的旗舰AI模型——Grok-3。这场以”我们的使命是理解整个宇宙”为主题的直播中,马斯克宣称Grok-3是”地球最聪明AI”,并透露其性能较前代Grok-2提升了10倍。
Grok-3的突破性进展
这个在孟菲斯超级数据中心训练完成的模型,仅用122天就完成了20万块GPU的集群搭建。工程团队透露,Grok-3属于模型家族,其轻量级版本Grok-3 Mini通过适当降低精度来提升速度。

多项测试中,Grok-3刷新纪录的表现令人瞩目:
- 数学能力(AIME ’24):96分的成绩碾压DeepSeek-R1(87分)和GPT-4
- 科学素养(GPQA):在研究生水平知识问答中领先
- 编程实力(LCB):复杂代码生成速度超越Claude 3.5和Gemini 2.0268
- 在Chatbot Arena排行榜以1402分登顶,成为首个突破1400分的模型,将OpenAI、Google、Anthropic等竞争对手甩在身后

AI能力的里程碑突破
在AIME 2025测试中,Grok-3 Reasoning Beta和Grok-3 Mini Reasoning均突破90分大关,在推理挑战中击败其他竞争对手。
Grok-3更展示了跨领域创造力:不仅生成了完整版《俄罗斯方块×宝石迷阵》的3D特效游戏代码,还尝试攻克数学界著名未解之谜黎曼猜想,展现了处理复杂思维链条的能力。

“深度搜索”模式登场
Grok-3独创的DeepSearch模式,将文献研究、头脑风暴、代码调试三大功能融为一体。其”思维链”机制支持Test-Time Compute,开启Big Brain模式后,AI思考深度提升263%。
如何体验Grok-3
不过,这个”地球最聪明AI”并非人人可用。
X Premium 会员可立即解锁Grok-3完整版,SuperGrok订阅用户还能享受无限图像生成和深度搜索配额,订阅费为每月30美元。

马斯克承诺,待Grok-3运行稳定后,将开源Grok-2模型。他更豪言:”xAI的创新速度将彻底改写AI竞争格局!”