On connaissant le Yin et le Yang, il faudra maintenant compter sur Gemini et Gemma. Quelques jours après avoir dévoilé Gemini 1.5, son prochain modèle d'intelligence artificielle générative, Google vient d'annoncer l'arrivée d'une « nouvelle génération » de modèles ouverts pour « assister les chercheurs dans la construction d'une IA responsable ». Entendre par là des modèles plus verticaux et légers, consommant donc moins de ressources. Pour mettre au point Gemma (disponible en 2B et 7B), la firme de Mountain View s'est appuyée sur l'équipe de Deepmind, dirigée par Tris Warkentin, rachetée en 2014

Les deux modèles proposés sont disponibles avec des variantes pré-entraînées et adaptées aux instructions pouvant s'exécuter sur un simple PC aussi bien que sur Google Cloud avec un déploiement facile sur Vertex AI et Google Kubernetes Engine promet l'éditeur. Une boîte à outils pour créer des applications d'IA est aussi proposée. « Nous fournissons des chaînes d'outils pour l'inférence et le réglage fin supervisé (SFT) dans tous les principaux cadres : JAX, PyTorch, et TensorFlow à travers Keras 3.0 », indique également Google. Des carnets Colab et Kaggle prêts à l'emploi sont aussi de la partie ainsi que l'intégration avec Hugging Face, MaxText, Nvidia NeMo et TensorRT-LLM.

Réglages fins et apprentissage par renforcement au menu

Les modèles Gemma partagent des composants techniques et d'infrastructure avec Gemini, le modèle d'IA le plus grand et le plus performant que propose Google. « Pour que les modèles pré-entraînés de Gemma soient sûrs et fiables, nous avons utilisé des techniques automatisées pour filtrer certaines informations personnelles et autres données sensibles des ensembles d'entraînement. En outre, nous avons eu recours à des réglages fins et à l'apprentissage par renforcement (une forme de ML) à partir du retour d'information humain (RLHF) pour aligner nos modèles d'instruction sur des comportements responsables », précise le fournisseur.

Gemma est conçu pour la communauté ouverte de développeurs et de chercheurs en IA. « Vous pouvez commencer à travailler avec Gemma dès aujourd'hui en bénéficiant d'un accès gratuit à Kaggle et pour les carnets Colab et de 300 dollars de crédits pour les nouveaux utilisateurs de Google Cloud », indique l'éditeur.