Vive la diversité des langues. Tel pourrait être le slogan de la start-up Regions.ai, spécialisée dans les LLM (grands modèles de langage) régionaux. « L’IA générative se focalise trop sur les langues vernaculaires et il est important que cette technologie mette en avant la richesse des parlers régionaux », précise Erwan Pisani-Wurtz, fondateur de la jeune pousse. Avec plusieurs développeurs issus des quatre coins de l’Hexagone, elle a réussi à élaborer des agents conversationnels locaux.

Le catalogue de la société a débuté par ChtiGPT, avec un modèle d’entraînement basé sur les framework open source Chnord et PicardIT. « Le plus difficile était de réconcilier certains particularismes locaux comme en Thiérache et le patois Dunkerquois », observe le dirigeant. Le breton avec BreizhGPT n’a, semble-t-il, pas posé de problème d’entraînement avec le puissant moteur DiwanAI. Le plus difficile a été la conception de BasqueGPT, avec des problèmes d’interopérabilité en certaines versions. Idem pour CorseGPT où certaines requêtes provoquaient littéralement une explosion du transformeur.

Un catalogue qui s’étoffe

Devant le succès de l’initiative, Regions.ai compte bien accélérer le développement d’autres GPT locaux. « Nous sommes en train de finaliser ProvenceGPT, mais l’entraînement se fait lentement. Nos équipes regardent pour migrer de l’architecture Pastaga vers celle plus véloce d’Aioli », évoque Erwan Pisani-Wurtz. Elle mettra dans les prochains mois cap à l’Est pour lancer AlsaceGPT avec une innovation autour du langage de programmation Kouglof. Fin 2023, l’Auvergne sera à l’honneur avec BougnatGPT puis le Sud-Ouest avec OccGPT.

La jeune pousse imagine déjà des requêtes croisées entre ses différents GPT pour créer par exemple des recettes de cuisines pour le moins innovantes. Jugez plutôt :  le Welsh au pastis, la truffade au maroilles, le cassoulet au beurre salé, la bouillabaisse à la gentiane ou encore l’axoa à la bière. « Sky is no limit », rappelle Erwan Pisani-Wurtz, qui indique par ailleurs que sa société a été fondée le…. 1er avril.