Mise en valeur des données d’inspection des infrastructures de Transports Québec

Une vague de données ouverte

Infrastructures routières

Infrastructures routières

Une vague d’intérêt pour la démocratisation des données publiques s’abat sur le Québec (Montreal Open Data Hackathon, Capitale Ouverte) pour ne pas dire sur le monde (Open Data Day).  C’est d’ailleurs le principal objectif du mouvement « Open data » qui propose de  nouvelles applications ou utilisations des données publiques.

Dans les faits, l’information disponible dans les organisations publiques peut être très riche, mais elle n’est pas toujours valorisée au maximum. Par exemple, le site Ponts et Routes- Information aux citoyens mis en ligne par Transports Québec permet de connaître l’état des infrastructures routières de la province (ex. pont, mur, ponceau, tunnel). Ce site permet d’obtenir le pedigree de chaque structure individuellement et de consulter le dénombrement de structures par région, par indice d’accessibilité et par indice de condition générale. Quelques jours après la mise en ligne de ce site, une application Google a été développée (The Gazette) afin de présenter les points des 5228 structures ainsi qu’une fiche descriptive sur chacune des structures. Toutefois, ces données offrent un potentiel d’analyse beaucoup plus élevé que ce qui a été démontré jusqu’ici.

Pour vous en faire la démonstration, nous avons récupéré la balle au bond (et les données sur ce site). À partir de ces données opérationnelles, nous apporterons un volet plus stratégique et analytique en produisant différents regroupements afin de comparer les structures dans le temps et dans l’espace. Sur la base des données que nous avions à notre disposition, il est important de mentionner que le processus décrit plus bas n’a requis que quelques heures pour la structuration des données et nous a permis d’ajouter de la nouvelle information aux données initiales du Ministère. Tout en assurant des résultats rapides, nous pouvons facilement imaginer les différentes analyses et croisements qui pourraient être réalisés avec un accès aux données complètes et la collaboration des experts du Ministère.

Présentation de l’application géodécisionnelle

L’objectif de notre structuration de données est de produire une information de synthèse à partir de l’information détaillée. Nous avons regroupé les informations ci-dessous à des niveaux de synthèse et calculé la sommation des structures selon ces niveaux. Les niveaux d’analyse indiqués en couleur sont ceux qui apportent une plus-value aux axes d’analyse suivants:

  • Axe cartographique permettant de localiser les structures individuellement, mais aussi par municipalité,  MRC, région administrative et province
  • Axes temporels permettant de regrouper les dates de dernière inspection et de prochaine inspection par année et pour l’ensemble des années.
  • Axes thématiques permettant de regrouper les structures par:
    • Type de structure (ex. pont suspendu), groupe (ex. pont), tous les types
    • Indice d’accessibilité (ex. aucune restriction), tous les indices IA
    • Indice de condition générale (ex. nécessitant des travaux majeurs), tous les indices ICG
Les résultats nous permettent de consulter les informations de manière géographique via une carte du dénombrement des structures par région (à gauche) jusqu’au détail spécifique d’une structure au niveau le plus détaillé (à droite).
La carte du dénombrement et détail spécifique d’une structure

x

Ce qui devient intéressant, c’est l’ensemble des nouvelles représentations que nous proposons comme la carte de l’indice de condition générale par municipalité régionale de comté MRC (à gauche) ainsi que la carte de l’indice de condition générale par structure (à droite).
Indice de condition générale par region

x

L’analyse de l’axe temporel permet de présenter l’évolution temporelle du dénombrement des inspections de structures par année.
La carte de l’évolution temporelle des dates de dernières inspections par région

x

Visualisez la démonstration vidéo de l’application: Démonstration- Inspection des infrastructures du MTQ.

Il serait possible avec ces données d’illustrer cartographiquement l’assignation des structures au réseau routier et ainsi permettre de visualiser les structures par grands axes routiers jusqu’aux plus petits segments de route. Une analyse plus poussée des données quantitatives permettrait de produire différentes  mesures dérivées comme, le délai entre la  dernière inspection et le mois en cours. On pourrait certainement dériver un indice de sollicitation de la structure à partir des caractéristiques de la route impliquée comme le pourcentage de camion qui y circule, le débit journalier moyen annuel et la classe de route.

En fait la mise en valeur des données organisationnelles passe avant tout par l’analyse de la nature  des données disponibles et d’une connaissance approfondie des différentes possibilités qu’offre le domaine d’affaires auquel on s’adresse. Ensuite, avec un peu d’expérience en structuration de données et un bon outil de visualisation géodécisionnel, il est possible de faire parler les données comme jamais vous ne l’aurez fait!

Description du processus de structuration des données

N’ayant pas exactement les découpages géographiques officiels utilisés par le ministère, nous n’avions pas d’équivalence nominale pour l’ensemble des données. Par conséquence, le fichier KMZ de la localisation ponctuelle des structures a été joint spatialement aux fichiers géographiques des municipalités, MRC, régions administratives disponibles à Ressources naturelles Québec afin d’identifier les géométries d’appartenance des structures. Ce processus, nous a permis de déterminer, par exemple, dans quels polygones de municipalité, de MRC et de régions administratives appartient chaque structure.

Ensuite, les données en format CSV ont été importées dans une base de données et structurées sous la forme d’un modèle en étoile contenant les faits et les axes d’analyse. Les faits sont les informations détaillées de chaque structure (les identifiants et les codes qui réfèrent aux attributs de chaque axes). Nous y avons ajouté la sommation du nombre de structures, à partir d’un calcul croisant les données pour toutes les combinaisons possibles des niveaux d’analyse énumérés précédemment.

Un programme d’agrégation maison nous a permis de produire les 360 requêtes SQL requises pour calculer les statistiques sur le croisement des 6 axes d’analyse. Ceci nous a permis de produire 873 765 combinaisons statistiques sur ce jeu de données. Le processus de calcul s’est exécuté en 39 secondes.

Ce résultat statistique en main ajouté aux niveaux cartographiques construits précédemment, nous avons passé à l’étape de configuration de la solution géodécisionnelle afin d’ajouter une capacité de représentation plus conviviale et sous différentes formes : carte, diagramme et tableau.
Écrit par
 
MJProulx

INTELLI3
3700 Blv Wilfrid-Hamel, suite 80