La SNCF a communiqué récemment sur l'accélération de sa démarche Open Data. C'est son directeur de la communication, Patrick Ropert, qui s'est chargé de l'exercice. L'objectif est clairement d'accroître l'utilisation des données ouvertes pour multiplier les services innovants créés par des tiers.

Pour l'instant, le site Data.sncf.com s'ouvre surtout sur des pages d'un sous-domaine test. Mais les jeux de données proposés sont déjà assez nombreux. Ils concernent autant le réseau de proximité Transilien/TER que les grandes lignes ou les gares. Les données comprennent par exemple des horaires ou des statistiques de régularité. On peut aussi télécharger le fichier complet des gares avec leurs adresses. Chaque jeu de données est associé à une date déterminant la fraicheur des informations et une fréquence normale de rafraichissement.

L'utilisation des données est soumises par la SNCF à une licence adaptée de la licence ODbL (Open Database Licence). Cette licence est contaminante : les bases dérivées doivent être soumises à une licence identique, aucun contenu incompatible ne pouvant être ajouté (sauf pour un usage strictement interne à une entreprise, usage privé qui reste possible), et les sous-licences sont interdites. L'utilisateur ne doit pas modifier la base de façon à en dénaturer le contenu (par exemple en changeant les horaires de train) mais doit indiquer la fraicheur de la donnée. Aucune limitation n'est prescrite sur la manière d'exploiter les informations et il est donc possible de créer des applications commerciales.