1.4 Contribution de la thèse : Définition d'un ... - TEL (thèses-en-ligne)

figure 99 : Exemple de discontinuité du réseau GEOROUTE entraînant un ......
Pour les représentations réparties sur un réseau, un langage multi-bases qui
prend en ...... H. Alt et Gadau (1995) Measuring the resemblance of polygonal
curves. ...... [3] Ensemble des actions de mesures, d'examens, d'essais, de
calibrage ...

Part of the document


Université de Versailles - Thèse de Doctorat de Méthodes Informatiques soutenue le 12 décembre 1997 - Institut Géographique National (IGN) Laboratoire COGIT Processus d'intégration et d'appariement
de Bases de Données Géographiques Application à une base de données
routières multi-échelles Thomas Devogele Jury : André Frank : Rapporteur Geneviève Jomier : Rapporteur Eric Simon : Directeur de thèse Mokrane Bouzeghoub : Président Robert Laurini : Examinateur Laurent Raynal : Examinateur François Salgé : Examinateur Stefano Spaccapietra : Examinateur invité
A GIS brings information together, it unifies and integrates
that information. It makes available information to which no
one had access before, and places old information in a new
context. It often brings together information which either
was not or could not be brought together previously.
J. Dangermond 1989 (ESRI) The organizational impact of GIS technology ARC News Summer : 25-6 Remerciements Une thèse n'est jamais un travail individuel, elle s'inscrit dans une
démarche globale de recherche qui bénéficie des travaux déjà réalisés, est
en relation avec les travaux en cours et sera reprise par la suite. Cette thèse doit donc énormément à Laurent Raynal qui est l'initiateur des
travaux en multi-représentations au COGIT. Je le remercie amicalement pour
son encadrement constant tout en douceur et ses nombreux conseils (y
compris pendant ses nouvelles fonctions). Ma gratitude va aussi à la hiérarchie de l'IGN (Jacques Poulain, Hervé Le
Men, Serge Motet, Sylvie Lamy et François Chirié) pour avoir permis cette
thèse et lui avoir donné les moyens de se développer dans des conditions
favorables. Je tiens à remercier particulièrement Jean Philippe Lagrange pour m'avoir
fait partager ses connaissances encyclopédiques aussi bien en
généralisation qu'en BDG, pour sa part active au début de la thèse et sa
relecture qui a permis de compléter et d'affiner cette thèse. Je dois énormément à Stefano Spaccapietra et Christine Parent qui m'ont
partagé leurs connaissances en intégration des BD. Ils ont largement
contribués à la qualité scientifique de cette thèse par leur visite et leur
collaboration à ses recherches. Je désire leur exprimer toute ma
reconnaissance. Je remercie également Sabine Timpf pour sa visite et notre travail en
commun sur les applications multi-représentations qui m'a fourni une vision
complémentaire de ce problème. Je remercie mon directeur de thèse Eric Simon qui a su diriger mes
recherches en insistant sur les grandes lignes de cette thèse et en évitant
les dispersions. Je tiens à remercier tous les membres de mon jury qui se sont intéressés à
ce travail. Plus particulièrement, je tiens à exprimer ma grande
reconnaissance aux rapporteurs ; à Geneviève Jomier, qui s'est toujours
préoccupée de mes recherches et m'a souvent encouragé, et à André Frank
dont les recherches en multi-représentations ont été un support pour mes
travaux et qui malgré la distance Paris - Vienne a accepté la tâche de
rapporteur. Je remercie aussi, Georges Gardarin ainsi que Mokrane
Bouzeghoub qui m'ont accueilli au sein du laboratoire PRISM de l'université
de Versailles, Robert Laurini dont les travaux en interopérabilité ont été
une des sources principales de ma taxonomie des conflits, et enfin,
François Salgé qui est un des pères de l'intégration de BDG entre les
différents instituts cartographiques Européens. Cette thèse s'est déroulée au laboratoire COGIT de l'IGN je tiens donc à
remercier tous les membres du COGIT et du secrétariat de la DT pour leur
compétence, l'ambiance de travail dans la joie et l'entraide qu'ils savent
si bien entretenir. Un grand merci à Cécile Lemarié, Thierry Badard et
François Vauglin pour leurs critiques constructives, leur relecture et leur
collaboration active à ce travail. Je remercie aussi les stagiaires qui se
sont succédés (Jenny Trevisan, Roger Areia, Paolo Fereira, Patrick Branly
et Odile Ousset) qui m'ont assisté pour développer le prototype. Merci
encore à Pascale Monier et Jean-François Hangouët pour leurs relectures. Je tiens aussi à encourager Matthieu Castagnet et Thierry Badard qui
reprendront ces travaux dans le cadre de leur thèse pour les amener vers
d'autres horizons. Je désire terminer, en remerciant ma femme et mes deux filles ; ces trois
sources de joie indispensable à l'équilibre de ce travail de thèse.
Résumé Les phénomènes du monde réel sont actuellement représentés dans les Bases
de Données Géographiques (BDG) sous différentes formes (suivant les modèles
géographiques, suivant les points de vue utilisateur et/ou suivant les
systèmes). La réutilisation de telles BDG nécessite dès lors un processus
d'intégration pour éliminer les parties redondantes et regrouper les
parties complémentaires. Ce processus d'intégration est nécessaire étant
donné le coût d'acquisition des données géographiques (de cette manière des
saisies d'information sont évitées) et permet de fédérer l'information
provenant de différentes sources. L'intégration est donc au c?ur du
problème d'interopérabilité entre BDG. A l'issue de celle-ci, plusieurs représentations de phénomènes du monde
réel sont disponibles selon des points de vue différents et des échelles
distinctes. Ces représentations multiples sont nécessaires pour des
applications très diverses : cartographie électronique multi-échelle,
propagation des mises à jour, aide à la navigation. L'objectif de cette thèse consiste donc à définir un processus
d'intégration de BDG sur un seul site, le processus étant limité aux
données en mode vecteur à deux dimensions. Il propose l'extension d'un
processus d'intégration classique à trois phases [Spaccapietra et al. 92]
(pré-intégration, déclaration des correspondances, intégration).
L'extension est fondée sur une taxonomie des conflits d'intégration entre
BDG et sur l'ajout d'un processus d'appariement géométrique et topologique.
Ce processus a été mis en ?uvre sur les trois principales bases de données
de l'IGN (BD TOPO®, BD CARTO® et GEOROUTE®) pour le thème routier dans la
région de Lagny (environ 900 km de tronçons routiers). Etant donnée la complexité des phénomènes géographiques, plusieurs
interprétations et donc plusieurs modélisations des phénomènes peuvent être
définies. La taxonomie des conflits d'intégration de BDG effectue une
structuration de ces différences : conflits de définition de classe
(conflits de classification, conflits de fragmentation, conflits de
spécification), conflits d'hétérogénéité, conflit de description,...Six
catégories de conflits ont été traitées dans le processus d'intégration. Certains conflits sont pris en compte dans la phase de pré-intégration.
D'autres font l'objet d'un traitement spécifique : extension du langage de
déclaration des correspondances, ajout d'opérations de résolution de ce
conflit. De plus, la phase d'intégration doit suivre une stratégie. Cette
stratégie détermine le choix des opérations et fixe l'objectif de
l'intégration. Au vu de nos bases d'expérimentations, deux stratégies
d'intégration (et leurs opérations d'intégration associées) sont
présentées. Le processus d'appariement consiste à identifier les données représentant
le même phénomène du monde réel et permet le regroupement d'informations.
Cette étape est précieuse car elle enrichit les BDG d'opérations inter-
représentations, opérations nécessaires aux applications multi-
représentations. Un processus d'appariement a été développé pour les données de types
routières à différentes échelles. Les résultats obtenus font apparaître un
taux de correspondance de l'ordre de 90 %. Un processus générique en a été
déduit afin de guider la conception des processus d'appariement concernant
d'autres types de données. Cette thèse apporte donc un cadre général et détaillé pour les intégrations
de BDG et contribue ainsi à l'essor d'applications multi-représentations et
de l'interopérabilité entre les BDG en adaptant ces processus à des BDG
réparties sur un réseau. Mots clés : base de données géographiques, système d'information
géographique, intégration, appariement, multi-représentations, multi-
échelles, conflit d'intégration, interopérabilité, réutilisation.
Abstract Phenomena of the real world are described in a variety of forms in current
geographic data bases (GDBs) : geographic data models, users' points of
view, systems are different. Concurrently re-using GDBs thus requires an
integration process both to eliminate duplicates and to regroup
complements. Integration makes it possible to federate data from different
sources while cutting down acquisition costs (new data captures are
avoided) ; it is a crucial issue for interoperability between GDBs. After integration, several representations of real world phenomena are
available, with distinct points of view and at different scales. T