Comment choisir les meilleures données géospatiales? Étape 3

Sources de données géospatiales

Sources de données géospatiales

Étape 3 – Évaluation du contenu des jeux de données retenus

Pour connaître l’étape 2, voir le second GéoBillet de cette série: La recherche des données géospatiales

Une fois que l’on a retenu quelques jeux de données pouvant satisfaire nos besoins, on doit maintenant les évaluer afin de déterminer lequel ou lesquels répondent le mieux aux besoins. Cette étape est cruciale car même si cette évaluation conduit à utiliser les données que l’on soupçonnait initialement être les meilleures pour nos besoins, les lacunes à corriger ainsi que les transformations nécessaires pourront être identifiées dès le départ plutôt qu’en cours de projet. Ceci permet de mieux planifier les budgets et les échéanciers, de mieux gérer les risques d’usages inappropriés des données, voire de sauver des coûts importants. Il ne faut jamais prendre pour acquis que les données disponibles vont rencontrer de facto les besoins car les résultats peuvent parfois surprendre!

La première étape de cette évaluation est de vérifier si le contenu convient à nos besoins. Nous évaluerons dans ce billet, si le Quoi, représenté par la sémantique des objets, la forme de la géométrie (point, ligne, polygone, multipoint, etc.) ainsi que sa définition géométrique (spécifications de numérisation) satisfont bien les besoins.

Pour bien connaître le Quoi, rien de mieux qu’un inventaire des données existantes. La première étape de cet inventaire sera d’en définir la portée à partir des résultats de l’analyse des besoins, traitée dans le GéoBillet Étape 1 : L’analyse des besoins. Le niveau de détail de l’inventaire variera d’une classe d’objets à une autre en fonction de sa pertinence à combler les besoins. Il n’est pas toujours facile d’évaluer cette pertinence principalement dans le cas où les besoins sont plus ou moins bien définis. Il pourra être nécessaire, dans certain cas, de préciser les besoins ou de valider la pertinence de certaines classes d’objets avec le client. L’inventaire consistera donc à examiner chaque classe d’objets (cartographiée ou non), chaque attribut et chaque valeur des domaines de valeurs dans le but d’en évaluer sa pertinence selon le niveau de détail requis pour combler les besoins. Par exemple, si nous voulons seulement afficher les routes, sans faire d’analyse spatiale avec celles-ci, il ne sera pas nécessaire d’avoir la leur définition géométrique pour considérer cette classe d’objets comme pertinente. Par contre, si nous voulons faire de l’analyse réseau, nous devrons connaître tous les éléments qui servent à segmenter la route (ex. intersection, changement de municipalité, changement de nom, changement de largeur). S’il n’existe pas de spécification précise et que les routes sont segmentées de façon incohérente (ex. suite à une numérisation non-contrôlée), cette classe d’objets pourra être considérée comme étant non pertinente ou bien pertinente mais nécessitant un bon travail de nettoyage et resegmentation.

La plus grande difficulté de cette étape sera de trouver l’information. Ce manque d’information peut entraîner des mauvaises décisions de la part des utilisateurs qui se sont mépris sur ce que représentent les données. La documentation fournie avec les jeux de données ne permet pas, souvent, de bien définir le Quoi. Les définitions sémantiques sont trop génériques, la forme géométrique pas clairement définie, la définition géométrique est souvent absente ainsi que les règles de passage d’une géométrie à une autre dans le cas d’une classe d’objets à géométrie alternative (ex : un bâtiment dont la superficie de la surface au sol est > 500 m² est représenté par un polygone, sinon par un point). Bien connaître les données en fonction des besoins nécessitera donc de communiquer avec le producteurs, vu la déficience de la documentation, pour avoir de plus amples informations et de consulter les données afin d’en déduire certaines informations telles que les contraintes d’intégrité spatiales entre classes d’objets (ex. : route segmentée aux passages à niveau, aux limites municipales et selon certaines valeurs d’attribut : pavage, limite de vitesse, nombre de voies, etc.). Bien connaître la matière première qui sera utilisée dans un nouveau système est primordial.

Afin de compléter cet inventaire,  des informations supplémentaires définissant le Comment et le Pourquoi pourront être ajoutées pour les classes d’objets retenues.

La description de cette étape sera traitée dans le GéoBillet : Étape 4: Sélection des données géospatiales en 5 étapes Évaluation de la qualité.

Écrit par
 
SLarrivee

INTELLI3
3700 Blv Wilfrid-Hamel, suite 80