Dans un marché très fourni, xAI a présenté la première mouture de son modèle Grok Code Fast pour le développement d’applications. Il y a deux semaines, la société a discrètement publié grok-code-fast-1 sous le nom de code sonic. Durant cette phase, l'équipe de recherche a surveillé les canaux communautaires et ajusté le modèle en fonction des retours. Pour son lancement, il est disponible gratuitement pendant une durée limitée sur les plateformes de codage IA les plus populaires à savoir GitHub Copilot, Cursor, Cline, Roo Code, Kilo Cline, Opencode et Windsurf.

« Tout au long du processus d’entraînement, nous avons collaboré étroitement avec nos partenaires de lancement afin d'affiner et d’optimiser le comportement du modèle au sein de leurs plateformes agentiques », a déclaré l'entreprise dans un communiqué. « Grok-code-fast-1 maîtrise l'utilisation d'outils courants tels que grep, le terminal et l'édition de fichiers, et devrait donc s'intégrer parfaitement à votre IDE préféré », ajoute-t-elle. En dehors de la période de gratuité, le modèle est disponible via les API pour les développeurs au prix de 20 cents par million de tokens d’entrée, 1,5 $ par millions de tokens de sortie et 2 cents par millions de tokens d’entrée mis en cache.

Des tests de performances prometteurs

Grok Code Fast prend en charge les appels de fonctions, les sorties structurées et le raisonnement avec une fenêtre contextuelle de 256 000 tokens. Cette taille de fenêtre donne au modèle la capacité de rappeler simultanément l'équivalent de centaines de pages de texte ou de code, lui permettant ainsi d'examiner efficacement de larges portions de bases de code tout en travaillant.

En termes de vitesse, selon les benchmarks de xAI, le dernier modèle peut s'exécuter à environ 160 jetons par seconde. Comparé à d'autres modèles populaires du marché sur les mêmes benchmarks publiés par xAI, GPT-5 d'OpenAI atteint en moyenne environ 50,1 jetons par seconde, Gemini 2.5 Pro environ 92,4 et Claude 4 Sonnet 78,7. « Lors des premiers tests, Grok Code Fast a démontré sa rapidité et sa qualité dans les tâches de codage agentique », a déclaré Mario Rodriguez, directeur produit de GitHub. Le modèle a été conçu pour être flexible avec différents langages de programmation, avec une bonne maîtrise de TypeScript, Python, Java, Rust, C++ et Go. xAI a déjà prévu de supporter les entrées multimodales, les appels d’outils parallèles et le contexte étendu dans la prochaine version.