Informations relatives à OGM³ - Service d'ontologie géospatiale multiusage, multinorme et multilingue



Contexte du projet
Objectifs
Collaboration
Avantages techniques
Avantages commerciaux pour les collaborateurs
Avantages pour le grand public canadien
Produits et résultats en direct



Contexte du projet

Un des problèmes importants auquel on a à faire face lors de l'accès à une infrastructure, à un service ou à une banque de données, est de formuler des requêtes en tenant compte des concepts, du vocabulaire et de la langue utilisés par les fournisseurs de cette infrastructure, ces services ou ces banques données. Certains outils tiennent compte des synonymes mais pas des quasi-synonymes, alias, polysémies et des termes englobants ou englobés, ce qui donne de mauvais résultats. Bref, les ontologies, ou le vocabulaire, des utilisateurs et des fournisseurs sont différents.

Le problème est de taille et n'est pas propre à l'information géospatiale. On n'a qu'à penser aux moteurs de recherche sur le Web qui ont investi, et continuent d'investir, des sommes importantes en recherche dans ce domaine ou même au concept du « Semantic Web » qui fait l'objet de plusieurs articles.

Prenons, à titre d'exemple, le portail de découverte de GéoConnexions. L'utilisateur qui recherche des données sur le cadastre ne se voit pas offrir ce sujet dans la liste de sujets pré-établis. Il doit donc entrer « cadastre » comme mot-clé, mais cette recherche ne retourne aucun jeu de données. Il existe pourtant plus d'une trentaine de jeux de données portant sur ce sujet, mais elles sont documentées en anglais ou utilisent une ontologie différente. Une recherche similaire sur les pêches au Canada ne retournera des jeux de données que si le sujet est entré au pluriel.

Un utilisateur pourrait également vouloir obtenir de l'information sur l'épaisseur de la couche d'ozone sur Montréal. Le serveur d'Environnement Canada possède des données atmosphériques sur le Canada, celui de la ville de Montréal des données sur la pollution et celui du Québec des données environnementales. Tous pourraient fournir l'information désirée si les concepts ozone, atmosphère et pollution et les toponymes Canada, Québec et Montréal étaient associés correctement.

Cette problématique est encore plus importante lorsque les données sont dans plusieurs langues et qu'une traduction d'une langue à l'autre n'est pas directe, un terme dans une langue pouvant avoir plusieurs significations dans une autre. Il faut alors identifier le langage à utiliser à la fois pour la question et la réponse.

C'est pour cette raison qu'un outil d'ontologie géospatiale devient essentiel (une ontologie est considérée comme une collection de descriptions explicites, complètes et consensuelles de l'ensemble des concepts d'un domaine dans le contexte le plus large où ces concepts ont un sens précis, et sans aucune restriction ou règle correspondant à une utilisation particulière). Afin d'être applicable dans plusieurs usages, cet outil doit être disponible comme un service Web accessible en tout temps, via une interface normalisée, par d'autres services, des applications ou des outils. Ce service doit aussi se conformer à plusieurs normes et être enregistré en bonne et due forme.

Le service d'ontologie géospatiale multiusage, multinorme et multilingue OGM³:

  • permet d'élaborer les réseaux sémantiques relatifs aux principales ontologies, ou domaines d'application, et de gérer les relations entre certains thésaurus déterminés (GCMD, IHO S57, ISO B6, données cadre, taxonomies, etc.) en plusieurs langues;
  • offre une interface normalisée aux autres services et outils d'infrastructures géospatiales, notamment la découverte, le catalogage et l'intégration de jeux de données, en leur offrant les ontologies, leurs définitions, des traductions, les synonymes, termes similaires, etc.

Le service OGM³, décrit à la figure suivante, est constitué de trois acteurs et d'un objet. L'utilisateur accède à l'ontologie via un service ou outil de portail, de catalogue ou de gestion de données.





Le premier acteur est le gestionnaire d'ontologies, il reçoit des ontologies existantes ou en constitue de nouvelles et doit les stocker et les documenter dans le serveur OGM³ afin de les rendre disponibles. Il doit également maintenir ces ontologies, en offrir des traductions dans différentes langues, y compris les adaptations linguistiques propres à chaque langue et, dans certains cas, fournir les relations sémantiques avec des ontologies de domaines différents.

Le second acteur est le gestionnaire du serveur OGM³. Il contrôle les accès au serveur par les gestionnaires d'ontologies et les services et outils d'infrastructure, maintient les paramètres de pilotage, valide les cohérences inter-ontologies et assure la sécurité des données. Il pilote également l'efficacité du service afin qu'il réponde aux besoins et évolue dans le temps.

Le troisième acteur est l'utilisateur des services ou des outils de portail, catalogage, d'intégration, de partage ou de représentation de données, etc. Ces services sont en fait des acteurs qui accèdent au service OGM³ afin d'améliorer leurs résultats ou leurs efficacités.

L'objet est la banque de connaissance sur les ontologies géospatiales. Elle maintient la connaissance par ontologie et par langue ainsi que les relations sémantiques inter-ontologies.


Objectifs

L'objectif du projet était de mettre au point un service d'ontologie géospatiale utilisable à différentes fins (portail, catalogage, intégration, partage de données), dans plusieurs langues et appliquant les normes essentielles à l'interopérabilité. Le projet a permis de :
  • revoir les principaux besoins reliés aux ontologies géospatiales et identifier les fonctions d'un serveur et les opérations d'un service pour répondre à ces besoins;
  • définir et développer un protocole Web pour l'accès au service en utilisant les normes d'interopérabilité applicables;
  • intégrer le service OGM³ à l'outil de catalogage M³Cat et aux services de recherche de différents portails;
  • expérimenter les résultats avec des utilisateurs potentiels et des ontologies définies dans au moins deux (2) langues.

Collaboration

OGM³ a été testé avec Environnement Canada, Pêches et Océans Canada, Ressources naturelles Canada, la Défense nationale et le ministère des Ressources naturelles, de la Faune et des Parcs du Québec. Le programme GéoConnexions a contribué financièrement au projet par l'entremise du programme GéoInnovations.

Avantages techniques

Dans le cadre de l'implantation d'infrastructures ou de bases de données géospatiales, grâce au service OGM³ :
  • les développeurs de portails ou d'outils de recherche pourront améliorer les réponses aux recherches faites dans plusieurs langues;
  • les fournisseurs de données qui documentent leurs jeux de données pourront mieux décrire leurs contenus;
  • les fournisseurs de données pourront mieux établir la correspondance entre les données de sources multiples (autres ministères, provinces, municipalités).

Avantages commerciaux pour les collaborateurs

Le projet comporte plusieurs avantages pour l'équipe :
  • pour Intélec Géomatique, il permettra de développer de nouveaux produits et services qui augmenteront ses marchés de 1.14 M sur trois (3) ans. Le projet a permis de maintenir ou de créer cinq (5) emplois pendant sa durée et en créera neuf (9) par la suite;
  • pour le Centre de recherche en géomatique de l'Université Laval, elle a permis d'avancer ses travaux de recherche dans un domaine où il est considéré comme un chef de file;
  • pour les fournisseurs le projet facilitera la diffusion de données et leur permettra de se concentrer sur la qualité de ces données;
  • pour les utilisateurs de ces données, le projet les rendra plus accessibles, ce qui aura des impacts dans leurs domaines spécifiques (environnement, transports, infrastructures, foresterie, mines, etc.).

Avantages pour le grand public canadien

L'utilisation du service améliorera l'utilisation de l'information géospatiale qui est la clé dans plusieurs secteurs de l'économie.

Il contribuera aussi à placer le Canada en avant plan en géomatique, et de façon plus spécifique, en matière d'infrastructures de données géospatiales. Ce domaine est essentiel pour le développement économique des années 2000 et la création d'emplois dans les industries du savoir.


Produits et résultats en direct

Le principal résultat du projet est le serveur OGM³, qui permet:
  • de constituer des ontologies, y compris l'importation de thésaurus existants et les traitements pour l'établissement de liens sémantiques entre concepts dans différentes langues de manières manuelle et automatique (à l'aide de schémas, proximité géosémantique ou autres);
  • de gérer le service OGM³ en proposant les types de noms ou concepts les plus appropriés selon le lien sémantique invoqué et en pondérant ce lien selon son applicabilité;

Le service OGM³ est accessible via un protocole Web normalisé basé sur XML et décrit en utilisant la norme WSDL. Celle-ci permet de définir le type de service, les messages de transmission, les opérations, les types de ports, la liaison, etc.

La figure suivante décrit les technologies du serveur OGM³.





Les données sont stockées dans des fichiers ou un système de gestion de base de données (SGBD) afin de permettre d'indexer les concepts et de faciliter leur gestion. L'accès aux données se fait par l'intermédiaire de JDBC et les essais ont été réalisés avec les SGBD Access, MySQL et Oracle.

La constitution des ontologies est faite par l'intermédiaire de Protégé-2000, adapté pour le rendre conforme au modèle des données et aux concepts et orientations proposées.

Le serveur utilise plusieurs normes, notamment :

  • les normes W3C; WSDL, SOAP et UDDI;
  • les normes Web sémantique RDF et OWL;
  • les normes ISO/TC211:
    • 19109 - règles de définition de schémas d'applications;
    • 19110 - catalogues d'objets géographiques (thésaurus);
    • 19112 - référence par identificateur (toponymes).
  • l'OGC Reference Model for Open Distributed Processing (RM-ODP);
  • ISO 639 pour la définition des langages;
  • les normes pour les thesaurus ISO 2788 et ISO 5964.

Consultez la version démonstration du service et les exemples de constitution d'ontologies et d'opérations du service OGM³, ou demandez d'avantages d'informations sur ce service.