5 constats pour faire le saut en géospatial décisionnel

Ce billet résume quelques défis liés à la visualisation des données géospatiales et à l’intégration de celles-ci. Il s’agit aussi d’un résumé de ma présentation au Salon de la Business Intelligence en novembre 2011.

5 constats peuvent être discutés quand vient le temps de manipuler les données géospatiales:

1- le géospatial est partout!
2- le géospatial ressemble aux données descriptives, mais il est fondamentalement différent
3- le géospatial requiert une intégration informatique particulière
4- le géospatial offre plus que simplement colorer des points sur une carte
5- le géospatial est présent dans plusieurs offres logicielles d’intelligence d’affaires

Il existe des défis liés à l’intégration et à la visualisation des données géospatiales, mais la simple conscience de celles-ci est suffisante pour mettre en œuvre un projet et en bénéficier.

1- le géospatial est partout!

La composante géospatiale est partout. Dans une adresse, un nom de lieu, un numéro de téléphone, un code postal, un nom de circonscription électorale, etc. Vous avez déjà dans vos systèmes organisationnels la capacité de représenter vos données cartographiquement. Toutefois, afin de conserver la référence spatiale de manière homogène et plus stable, pensez à utiliser les coordonnées géographiques (ex. longitude, latitude) qui peuvent ensuite servir à la cartographie.

2-  le géospatial ressemble aux données descriptives, mais il est fondamentalement différent

La nature des données géospatiales est riche. La position obtenue par les coordonnées géographiques permet de mettre en relation sur le territoire les données et de découvrir des informations qui ne sont pas explicites par leur dimension descriptive. Les caractéristiques spatiales des données permettent d’abord d’apprécier la position d’un phénomène, sa forme, son orientation et sa taille. Par la suite, des relations spatiales entre plusieurs phénomènes peuvent être déduites, comme la distribution (ex. centralisée, groupée, aléatoire), l’adjacence, l’inclusion, l’intersection.

Exemples de caractéristiques et de relations spatiales entre les phénomènes

On peut obtenir ces données par des levés sur le terrain (ex.  capteurs GPS), des images satellites ou aéroportées, des services cartographiques web (ex. G.O.LOC), des fichiers intégrés (ex. site GeoGratis), etc. La diversité des sources rend leur intégration complexe puisqu’il faut tenir compte de différents paramètres propres aux données géospatiales et à la façon dont elles ont été captées et transformées avant d’être livrées.

3-  le géospatial requiert une intégration informatique particulière

En plus des défis sémantiques, descriptifs et temporels propres à l’intégration de données de différentes sources (ex. différentes définitions sémantiques, différents types d’attribut, différents domaines de valeurs, différents unités de mesure, différentes dates de mise-à-jour), la nature des données géospatiales introduit des défis liés à la référence spatiale et à la représentation cartographique des données cf. Figure -Défis liés à l’intégration des données géospatiales.

Défis intégration des données géospatiales, source: Notes de cours Dr Yvan Bédard, Université Laval

La référence spatiale réfère, entre autres, au système de coordonnées et à la projection cartographique utilisés. Ces modèles mathématiques permettent de mettre en relation les objets les uns par rapport aux autres en les mettant en valeur selon leur position sur la terre et en conservant des caractéristiques importantes (ex. distance, angle, superficie).

Un mauvais référencement spatial peut engendrer :
  • Le positionnement des objets au mauvais endroit (cf. Figure Problèmes de systèmes de coordonnées)
  • Le chevauchement incongru d’objets (ex. route dans un cours d’eau, routes qui intersectent un bâtiment)
  • De mauvais résultats de calcul de distance et de superficie

Problèmes de systèmes de coordonnées (1)

L’intégration de différentes sources de données géographiques ne possédant pas les mêmes projections ou systèmes de coordonnées nécessite le recours à des outils de transformation spécialisés tels que FME et Spatial Data Integrator Talendque nous utilisons afin de transformer les données selon les mêmes références ou au moins de les afficher selon une référence spatiale commune. De plus, il est nécessaire de posséder une bonne connaissance des méthodes et technologies utilisées pour relever les phénomènes mesurés et traiter cartographiquement les données, car bien d’autres causes, non énumérées ici, peuvent être à la source des différences de coordonnées.

Le billet « Comment choisir les meilleures données géospatiales? Y parvenir en 5 étapes» présente une méthodologie efficace pour y arriver. Les défis liés à la représentation spatiale des données sont discutés au point suivant.

4-  le géospatial offre beaucoup plus que le simple positionnement et coloriage de points sur une carte

Les défis liés à la représentation spatiale des données incluent l’intégration des structures de données cartographiques. Ces défis incluent aussi l’usage des bonnes pratiques en visualisation cartographique afin de ne pas fausser l’information véhiculée par une carte. Ainsi, l’utilisation appropriée des variables visuelles telles que la taille, la forme, la couleur, la teinte et la trame permettront de bien faire ressortir les tendances alors qu’une utilisation inappropriée de ces variables visuelles camouflera toute tendance dans un fouilli graphique, voire laissera entrevoir des tendances fausses. La maîtrise des bonnes variables visuelles est en soi une expertise nécessaire pour faire des cartes efficaces. Pour en savoir plus, n’hésitez pas à consulter le livre The Visual Display of Quantitative Information de Tufte (2) qui est, selon moi, une bible en géovisualisation.

Comme en visualisation conventionnelle, l’usage d’un indicateur adéquat est indispensable. Une mesure ratio (ex. densité au km carré) offrira une meilleure représentation du résultat qu’une mesure absolue (ex. population). Sur une carte, cette mauvaise pratique sera percutante comme l’illustre la figure suivante.

Nombre absolu (gauche) et densité au km carré (à droite)

Le choix du spectre de couleurs (ex. qualitatif, quantitatif ou divergent) est aussi important afin de bien mettre en évidence l’indicateur. Pour y parvenir, le recours à un outil comme celui de ColorBrewer est suggéré. Cet applicatif suggère des spectres de couleur selon le nombre de classes et la nature des données.

Finalement, les défis liés à l’abondance de données ou à la surabondance d’information de contexte (cf. GéoBillet : Le Data-Ink ratio appliqué à la cartographie) requièrent de présenter à l’utilisateur des cartes lisibles impliquant dans plusieurs cas de faire un certain choix sur la façon de représenter les données en les regroupant ou en les agrégeant afin d’éliminer la surcharge d’information.

5-   le géospatial est présent dans plusieurs offres logicielles d’intelligence d’affaires

Ma collègue Sonia a présenté dans son billet « Le marché des logiciels géodécisionnels (version intégrale)» l’offre logicielle basée sur le Magic Quadrant for BI platforms de Gartner 2011. En 2007, lors de notre première veille technologique sur ce type d’approche, peu de solutions offraient cette capacité. Aujourd’hui, vous y verrez que ces solutions offrent des capacités cartographiques très simples pour certaines à plus évoluées pour d’autres. L’offre logicielle se complète et s’étoffe. La mise en place de capacités cartographiques à vos solutions en sera grandement facilitée.

En conclusion, ce billet souhaitait présenter certains éléments de la nature spécifique de l’information géographique et vous donner différentes pistes de compréhension pour approfondir votre réflexion sur la mise en place d’applications géodécisionnelles dans votre organisation. D’après l’intérêt qu’a suscité cette présentation au Salon du BI, l’avenir nous confirmera s’il s’agit d’une simple tendance ou d’un besoin réel dans votre organisation.

À vous de juger…

(1) Source http://www.colorado.edu/geography/gcraft/notes/coordsys/coordsys_f.html

(2) The Visual Display of Quantitative Information, Second Edition, Edward Tufte, 2001

En terminant, voici le document de présentation de ma conférence au Salon de la Business Intelligence 2011.
La vidéo de la démonstration est disponible ici: http://www.intelli3.com/Map4forWeb/Map4forWeb.html
Écrit par
 
MJProulx

INTELLI3
3700 Blv Wilfrid-Hamel, suite 80