société xIA officiellement introduit Grok 3, affirmant que c'était « L'IA la plus intelligente du monde ». La présentation a été réalisée personnellement Masque d'Ilon, soulignant que le nouveau modèle surpasse ses concurrents dans les tests mathématiques et scientifiques, ainsi qu'en programmation. Cependant, certains Les experts remettent déjà en question les grandes affirmations de xAI.
Grok 3 établit un record lors du test en arèneen tapant 1 402 points. Les développeurs affirment également que leur modèle contourne GPT-4o et DeepSeek-V3. Cependant, la société n'a pas publié Résultats des tests FrontierMath, Arc-AGI et HLE, qui sont des mesures importantes pour évaluer le niveau d’intelligence de l’IA.
Les critiques soulignent également Grok 3 bugs dans la physique de base. Par exemple, Zhihan Wang, un ancien employé de DeepSeek, a montré à l'IA une image de deux boules de métal de tailles différentes tombant de hauteurs différentes. On s'attendait à ce que le modèle réponde que la première balle tomberait plus vite car elle était plus proche du sol et plus lourde, mais Grok 3 a déclaré à tort qu'elles atterriraient en même temps.
En attendant xAI en pourparlers pour lever 10 milliards de dollars, ce qui pourrait augmenter la valorisation de l'entreprise à 75 milliards de dollars. Musk a également confirmé que Grok 2 sera open-source dans les prochains mois, ce qui pourrait accroître la concurrence avec les modèles Méta et Mistral.
La question reste ouverte : Grok 3 est-il vraiment une révolution ou son succès n’est-il qu’un stratagème marketing ? Dans les mois à venir, les tests et les retours des utilisateurs apporteront la réponse finale.