2月18日、イーロン・マスクはいつものように遅れて登場した。20分の遅れの後、xAIが開発した待望のフラッグシップAIモデル「Grok-3」が公開された。ライブストリームのテーマは「我々の使命は宇宙全体を理解すること」。マスクはGrok-3を「地球上で最も賢いAI」と断言し、前世代のGrok-2と比較して性能が10倍向上したと述べた。
Grok-3の革新性
Grok-3はメンフィスにある巨大スーパーデータセンターでトレーニングされた。20万個のGPUを使用し、わずか122日間で構築完了。開発チームはGrok-3がモデルファミリーの一部であることを明らかにし、軽量版「Grok-3 Mini」では精度を若干犠牲にしつつ処理速度を向上させている。

各種ベンチマークテストでGrok-3は驚異的なパフォーマンスを発揮:
- 数学(AIME ’24): 96ポイントを獲得、DeepSeek-R1(87点)やGPT-4を上回る
- 科学(GPQA): 大学院レベルの知識問題で最高成績
- プログラミング(LCB): Claude 3.5やGemini 2.0268を凌ぐ複雑なコード生成速度
- Chatbot Arenaリーダーボードで1402ポイントを記録。1400ポイント超えを達成した初のモデルとしてOpenAI、Google、Anthropicを抑え首位に

AI分野における前例のない成果
AIME 2025テストではGrok-3 Reasoning BetaとMini版が90点超を達成、推論課題で他社を圧倒。
Grok-3は3D効果を備えた「テトリス×ビジュエルド」の完全なゲームコード生成を実現。未解決問題のリーマン予想への取り組みを通じ、複雑な思考プロセス処理能力を披露した。

「ディープサーチ」モードの導入
Grok-3の新機能「ディープサーチ」は研究・ブレインストーミング・コードデバッグを統合。独自の「思考チェーン」メカニズムとTest-Time Compute機能により、問題解決の深さを263%向上させる「ビッグブレインモード」を実現。
Grok-3の利用方法
ただし、この最先端AIは誰でも利用可能ではない。
X Premium ユーザーは即時フルアクセス可能。SuperGrok契約者(月額30ドル)は無制限の画像生成とディープサーチクォータを利用できる。

マスクは「Grok-3が安定次第Grok-2をオープ