Analyse de l’impact des annonces sonores pour une compagnie ferroviaire publique européenne

Analyse de l’impact des annonces sonores pour une compagnie ferroviaire publique européenne

Notre client est une filiale d’une société publique ferroviaire européenne chargée de la gestion des gares voyageurs du réseau ferré national d’un pays européen. Elle permet d’assurer les services essentiels aux 10 millions de voyageurs et de visiteurs qui fréquentent chaque jour les gare de ce pays (sécurité, information, accessibilité, propreté et confort).
Dans ces gares, les voyageurs reçoivent beaucoup d’informations, notamment les annonces sonores, qui doivent être les plus claires possible.

L’équipe Data & Customer Platform de Gares & Connexions développe un outil innovant d’analyse de l’information voyageur, grâce à du Speech-To-Text (reconnaissance vocale) et des réseaux de neurones afin de s’assurer que les annonces sonores diffusées en gare sont compréhensibles et contiennent bien toutes les informations. Les chefs de gares responsables de ces annonces peuvent utiliser cet outil pour visualiser la qualité de ces annonces, et améliorer certains points.

Ce projet, c’est Echo : Ecoute à CHaud Opérationnelle

C’est dans cette optique que nous avons été sollicités afin de construire une solution complète, qui reçoit les annonces sonores diffusées en gare, les analyse, et exporte de données pour être visualisées dans un tableau de bord.

Challenges

Technologies

Les annonces sonores et leurs métadonnées sont reçues dans des espaces de stockage (Data Lake) hébergés par Azure.

Du code Python est lancé toutes les heures par Azure Data Factory pour traiter les annonces au fur et à mesure de leur arrivée, ce code est exécuté sur des clusters Databricks, et bénéficie de la technologie Spark pour paralléliser les opérations.

La reconnaissance vocale est effectuée par le service Custom Speech d’Azure, qui nous permet d’avoir un modèle entraîné spécifiquement sur les données SNCF, ce modèle est ainsi plus performant qu’un modèle standard.

Nous utilisons ensuite une dizaine de modèles de Machine Learning, allant d’arbres de décisions à des réseaux de neurones profonds (Deep Learning) tels BERT, un réseau de neurones basé sur une architecture développée par Google en fin 2019. Ces modèles permettent de déduire beaucoup d’informations à partir du texte de l’annonce sonore. Ainsi à partir du texte de l’annonce on peut déduire si cette annonce concerne une situation normale, ou bien une situation perturbée, et le cas échéant, si cette annonce indique bien la cause du problème et une solution de contournement, ainsi qu’une heure de retour à la normale.

Les données produites sont ensuite exportées vers une base de données Azure, pour être visualisées dans un tableau de bord fait avec Power BI.

Bénéfices

Tout ce travail nous a ainsi permis d’analyser la qualité et le contenu des annonces sonores prononcées en gares. Il en a résulté des avantages déterminants pour notre client :

Témoignage

« ECHO est un outil attractif, efficace, rapide et facile. »

 Il va nous permettre d’être beaucoup plus réactifs dans l’analyse de la performance

D’un seul coup d’œil, là où avant il fallait écouter les annonces individuellement, là, on a directement l’information

C’est un réel gain de temps.”