Comment choisir les meilleures données géospatiales? Étape 1

Sources de données géospatiales

Étape 1: L’analyse des besoins

Ce billet est le premier de la série Comment choisir les meilleures données géospatiales? Y parvenir en 5 étapes

Avant de pouvoir débuter la recherche des jeux de données, il faut bien définir ses besoins ou ceux du client. Les exemples présentés sont dans le domaine des transports.

Quelles sont les entités géographiques nécessaires à l’application?

  • Routes, ports, gares, infrastructures, marchandises, etc.

Quelles sont les caractéristiques ou attributs de ces entités dont j’ai besoin ?

  • Vitesse, pavage, hauteur de dégagement, masse de la marchandise, type de marchandise, etc.

Quels usages et quelles analyses j’aimerais faire avec mes données. La réponse à cette question aidera grandement à identifier le contenu, le niveau de qualité requis et le type d’outils d’analyse: SIG, CAD, SOLAP.

  • Calcul du chemin optimal, géocodage à partir d’adresses, tonnage expédié par année, par région, etc.

Quelle précision géométrique me satisfait ?

  • Précision de la localisation (centre de la route est précis au 0,5 m , 1 m, 5 m, …) et précision de la forme (bâtiment représenté par un point, un rectangle, la forme détaillée de ses fondations,…).

Quel taux de complétude satisfait mes besoins ?

  • Je dois avoir absolument tous les ports et toutes les gares; j’ai besoin uniquement des routes principales et supérieures; les cours d’eau sont présentés uniquement comme couche de contexte dans mon application, j’ai donc uniquement besoin des principaux cours d’eau.

Quelle est la précision sémantique dont j’ai besoin? Est-ce que les valeurs des attributs doivent être 100% conformes à la réalité?

  • Est-ce que la classification des routes (autoroute, route primaire, route secondaire, ..) doit être exacte ? Puis-je accepter quelques incohérences dans les données comme le fait qu’une route locale soit classée comme route primaire ?

Quelle est la précision des mesures stockées en attributs ? La précision de ces mesures est très importante dans les bases de données multidimensionnelles puisque ces valeurs sont agrégées selon plusieurs niveaux d’agrégation. Si elles sont fausses au départ, tout le système sera faux.

  • Quelle précision est souhaitable pour les mesures de tonnage des marchandises, des taux de recul, des prix, des superficie en m², des longueurs en m, etc.

Est-ce que les données doivent être à jour (actualité des données ou précision temporelle)?

  • Pour certaines entités dont l’évolution est lente comme les cours d’eau, des données datant de 2000 par exemple pourront très bien faire l’affaire. Pour d’autres entités, la précision temporelle pourrait être variable en fonction de l’endroit. Par exemple, pour une municipalité ayant toute sa surface occupée, il y aura peu de changement au niveau du réseau routier. Par contre, pour un nouveau secteur en plein développement, l’ajout de nouvelles rues est très fréquent.

Dans quel format j’aimerais que les données soit livrées ?

  • Shapefile, Mid/Mif, BD Oracle, KLM, GML? Il est possible que cette question ne soit pas pertinente si je dispose d’un outil ETL pour changer le format de mes données facilement.

De quel budget dispose-t-on pour l’achat et le traitement des données?

Ceci n’est qu’un aperçu des questions que l’on doit se poser afin de bien définir les besoins en termes de données géospatiales. Faire un modèle conceptuel de ces besoins, comme un diagramme de classes UML, facilitera grandement la communication avec le client. Une fois qu’on a une bonne idée de ce que l’on cherche, on peut passer à l’étape suivante. La compréhension des besoins se précisera tout au long du processus et il est possible que de nouveaux besoins surviennent.

À suivre dans mon prochain billet, l’étape 2: La recherche de données géospatiales

Écrit par
 
SLarrivee

INTELLI3
3700 Blv Wilfrid-Hamel, suite 80