Comment choisir les meilleures données géospatiales? Étape 4

Qualité des données géospatiales

Qualité des données géospatiales

Étape 4: Évaluation de la qualité

Pour connaître l’étape 3, voir le troisième GéoBillet de cette série: Évaluation du contenu des jeux de données retenus
Avant de débuter l’évaluation détaillée de la qualité des jeux de données, il est important de vérifier, dans les licences d’utilisation, si les droits permis sont suffisants pour les usages que l’on veut en faire. Ces droits peuvent être : de pouvoir modifier les données, de les améliorer, de les distribuer ainsi que de fabriquer et de distribuer des produits dérivés.
La première étape consiste à traduire les besoins du client (le Pourquoi) en critère de qualité interne. Chaque classe d’objets du modèle conceptuel de données illustrant les besoins du client (réalisé à l’étape 1) peut être évaluée en fonction des critères de qualité décrit dans la norme ISO-19113 et présentés dans le tableau suivant.

Élément de qualité

Sous-élément

Exhaustivité (Completeness): présence et absence des objets cartographiques, de leurs attributs, leurs domaines de valeurs et leurs relations par rapport au terrain nominal;
Ex. : vérifier qu’au moins 90% des bâtiments sont présents, que tous les numéros des routes numérotées sont présents.
commission : données en trop dans le jeu de données.
omission: données absentes du jeu de données.
Cohérence logique (Logical Consistency): « Degré de cohérence interne des données selon des règles de modélisation et les règles inhérentes à la spécification de produit du jeu de données; » [DRAST, 2006]
Ex. : Les bâtiments dont la superficie est plus grande que 100 m² doivent être représentés par une surface plutôt qu’un point.
cohérence conceptuelle: adhérence aux règles du schéma conceptuel, aux contraintes d’intégrité
cohérence de domaine: cohérence des valeurs aux domaines de valeurs
cohérence de format: degré selon lequel les données sont stockées en concordance avec la structure physique du jeu de données.
cohérence topologique:
Précision géométrique (Positional accuracy):«Estimation de la fluctuation des écarts entre les positions (sur le terrain) nominales et les positions contenues dans le jeu de données.» [DRAST, 2006]
Ex: Les bornes fontaines doivent être positionnées à ± 1m
précision de position: « L’objet est plus ou moins bien positionné sur la carte » [DRAST, 2006]
précision de forme: « la géométrie de l’objet (sa forme) est plus ou moins juste sur la carte » [DRAST, 2006]
L’actualité (Temporal accuracy): «Décalage entre un jeu de données et le terrain nominal à une date T.» [DRAST, 2006]
Ex: Les routes doivent être à jour.
précision de la mesure du temps
cohérence temporelle:cohérence des événements et séquences;
validité temporelle:Date de validité et de préemption.
Précision sémantique (Thematic accuracy): «conformité des valeurs des éléments du jeu de données avec les valeurs de leurs homologues dans le terrain nominal. » [DRAST, 2006]
Ex: Vérifier que toutes les routes sont classifiées correctement.
conformité de la classification des objets
conformité de la codification des attributs,
conformité des valeurs d’attributs quantitatives
Une fois que l’on connait la qualité attendue, l’on doit choisir la méthode d’évaluation du jeu de données en fonction du temps mis à notre disposition et du budget alloué au projet. La norme ISO-19114 propose trois grandes méthodes d’évaluation, soit :
  1. la méthode d’évaluation indirecte
  2. la méthode d’évaluation directe interne
  3. la méthode d’évaluation directe externe
Les méthodes directes peuvent être réalisées de manière complète, i.e. en utilisant l’ensemble des données ou bien par échantillonnage. Elles peuvent également être réalisées de manière automatique, semi-automatique ou manuelle.
La méthode d’évaluation indirecte consiste a évalué le jeu de données en utilisant la documentation du jeu de données telle que les métadonnées, le catalogue ou dictionnaire et les spécifications. Cette méthode est utile pour évaluer le contenu du jeu de données si le dictionnaire de données est suffisamment détaillé. Si les métadonnées sont complètes et détaillées, certains éléments de qualité peuvent également être évalués. Malheureusement, comme mentionné dans mon précédent billet, les métadonnées et spécifications ne sont pas toujours présentes et complètes. La plupart des fournisseurs se contentent de fournir les 32 métadonnées du CORE de la norme ISO-19115, beaucoup trop générique pour permettre de bien évaluer les données. De plus, les métadonnées décrivent uniquement une classe d’objets. Il n’existe pas présentement dans la norme ISO-19115, des métadonnées décrivant les relations entre les classes d’objets i.e. décrivant les contraintes d’intégrité spatiale permises entre les classes d’objets géographiques.
Si l’évaluation ne peut pas être réalisée au complet de manière indirecte, on doit alors consulter les données pour en évaluer la qualité et idéalement comparer ces données avec une autre source de données comme une ortho-photo par exemple. Puisque plusieurs éléments de qualité tels que la précision temporelle et la précision spatiale des données sont variables selon l’endroit, la classe d’objets et la technique d’acquisition utilisée, il est souvent inévitable de devoir évaluer les données de manière directe. Une fois l’analyse terminée, il reste à faire le choix de la meilleure source qui sera le sujet de mon prochain et dernier géobillet de cette série, soit : Étape 5 – Choix des sources de données.

Référence

Direction de la Recherche et des Affaires Scientifiques et Techniques (DRAST), De Goesbriand, S., Blanc-Bernard G., Troispoux G. 2006. La qualité des données géographiques. CERTU, France. http://www.certu-catalogue.fr/qualite-des-donnees-geographiques-la.html
ISO-TC/211, 2002. Geographic Information – Quality principles 19113. http://www.iso.org/iso/catalogue_detail.htm?csnumber=26018
ISO-TC/211, 2003. Geographic Information – Quality evaluation procedures 19114. http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26019
Écrit par
 
SLarrivee

INTELLI3
3700 Blv Wilfrid-Hamel, suite 80