2월 18일, 엘론 머스크는 평소처럼 늦은 등장을 했다. 20분 지연 후 그는 xAI의 기대주 플래그십 AI 모델 ‘그록-3(Grok-3)’을 공개했다. 생방송 주제는 ‘우리의 미션은 우주 전체를 이해하는 것’이었다. 머스크는 그록-3을 “지구상 가장 똑똑한 AI”라고 주장했다. 전작 그록-2 대비 성능이 10배 향상됐다고 덧붙였다.
그록-3의 차별점은?
그록-3은 멤피스에 위치한 초대형 데이터센터에서 훈련됐다. GPU 20만 개를 동원해 단 122일 만에 구축했다. 엔지니어링 팀은 그록-3이 모델 패밀리의 일부라고 밝혔다. 경량화 버전인 ‘그록-3 미니’도 포함됐다. 미니는 정확도를 일부 희생하는 대신 속도를 개선했다.

다양한 테스트에서 그록-3은 기록을 갈아치우며 압도적 성능을 보였다:
- 수학(AIME ’24): 96점으로 딥시크-R1(87점)과 GPT-4 제쳤다
- 과학(GPQA): 대학원 수준 지식 질문에서 선두
- 프로그래밍(LCB): 클로드 3.5·제미니 2.0268보다 복잡한 코드 신속 생성
- 챗봇 아레나 순위표에서도 1402점으로 정상 등극. 1400점 돌파 최초 모델이 됐으며 오픈AI·구글·안트로픽 제쳤다

AI 업계 초유의 성과
AIME 2025 테스트에선 그록-3 추론 베타와 미니 추론 버전이 90점 이상을 기록했다. 추론 과제에서 타 경쟁사를 압도했다.
그록-3은 3D 효과를 구현한 테트리스×비쥬얼드 게임 코드 전체를 생성하며 다재다능함을 입증했다. 미해결 난제인 리만 가설에도 도전했다. 복잡한 사고 단계를 처리하는 능력을 보여줬다.

‘딥서치’ 모드 공개
그록-3은 딥서치 모드를 탑재했다. 연구·브레인스토밍·코드 디버깅을 하나의 솔루션으로 통합했다. 또 ‘생각 사슬’ 메커니즘을 도입했다. 문제 해결 깊이를 높이는 테스트 타임 컴퓨팅을 지원한다. 빅 브레인 모드에선 AI 문제 해결 깊이가 263% 증가했다.
그록-3 이용 방법
하지만 지구 최고 AI를 누구나 쓸 수 있는 건 아니다.
X 프리미엄 회원은 즉시 그록-3 전체 기능을 사용할 수 있다. 슈퍼그록 구독자에겐 무제한 이미지 생성과 딥서치 할당량이 제공된다. 구독료는 월 30달러다.

머스크는 “그록-3이 안정화되면 그록-2 모델을 오픈소스화할 것”이라 약속했다. 그는 “xAI의 혁신 속도가 AI 경쟁 구도를 완전히 바꿔놓을 것”이라고 말했다.
업계 반응
이미 업계 반응이 뜨겁다. 딥시크는 오픈소스화했고 챗GPT는 신규 영토 진출 중이다. 그록-3이 대박을 터뜨릴까? 시간만이 알 것이다.