![]() Informations relatives à OGM³ - Service d'ontologie géospatiale multiusage, multinorme et multilingue Contexte du projet Objectifs Collaboration Avantages techniques Avantages commerciaux pour les collaborateurs Avantages pour le grand public canadien Produits et résultats en direct |
||
|
Contexte du projet Un des problèmes importants auquel on a à faire face lors de l'accès à une infrastructure, à un service ou à une banque de données, est de formuler des requêtes en tenant compte des concepts, du vocabulaire et de la langue utilisés par les fournisseurs de cette infrastructure, ces services ou ces banques données. Certains outils tiennent compte des synonymes mais pas des quasi-synonymes, alias, polysémies et des termes englobants ou englobés, ce qui donne de mauvais résultats. Bref, les ontologies, ou le vocabulaire, des utilisateurs et des fournisseurs sont différents. Le problème est de taille et n'est pas propre à l'information géospatiale. On n'a qu'à penser aux moteurs de recherche sur le Web qui ont investi, et continuent d'investir, des sommes importantes en recherche dans ce domaine ou même au concept du « Semantic Web » qui fait l'objet de plusieurs articles. Prenons, à titre d'exemple, le portail de découverte de GéoConnexions. L'utilisateur qui recherche des données sur le cadastre ne se voit pas offrir ce sujet dans la liste de sujets pré-établis. Il doit donc entrer « cadastre » comme mot-clé, mais cette recherche ne retourne aucun jeu de données. Il existe pourtant plus d'une trentaine de jeux de données portant sur ce sujet, mais elles sont documentées en anglais ou utilisent une ontologie différente. Une recherche similaire sur les pêches au Canada ne retournera des jeux de données que si le sujet est entré au pluriel. Un utilisateur pourrait également vouloir obtenir de l'information sur l'épaisseur de la couche d'ozone sur Montréal. Le serveur d'Environnement Canada possède des données atmosphériques sur le Canada, celui de la ville de Montréal des données sur la pollution et celui du Québec des données environnementales. Tous pourraient fournir l'information désirée si les concepts ozone, atmosphère et pollution et les toponymes Canada, Québec et Montréal étaient associés correctement. Cette problématique est encore plus importante lorsque les données sont dans plusieurs langues et qu'une traduction d'une langue à l'autre n'est pas directe, un terme dans une langue pouvant avoir plusieurs significations dans une autre. Il faut alors identifier le langage à utiliser à la fois pour la question et la réponse. C'est pour cette raison qu'un outil d'ontologie géospatiale devient essentiel (une ontologie est considérée comme une collection de descriptions explicites, complètes et consensuelles de l'ensemble des concepts d'un domaine dans le contexte le plus large où ces concepts ont un sens précis, et sans aucune restriction ou règle correspondant à une utilisation particulière). Afin d'être applicable dans plusieurs usages, cet outil doit être disponible comme un service Web accessible en tout temps, via une interface normalisée, par d'autres services, des applications ou des outils. Ce service doit aussi se conformer à plusieurs normes et être enregistré en bonne et due forme. Le service d'ontologie géospatiale multiusage, multinorme et multilingue OGM³:
Le service OGM³, décrit à la figure suivante, est constitué de trois acteurs et d'un objet. L'utilisateur accède à l'ontologie via un service ou outil de portail, de catalogue ou de gestion de données.
Le premier acteur est le gestionnaire d'ontologies, il reçoit des ontologies existantes ou en constitue de nouvelles et doit les stocker et les documenter dans le serveur OGM³ afin de les rendre disponibles. Il doit également maintenir ces ontologies, en offrir des traductions dans différentes langues, y compris les adaptations linguistiques propres à chaque langue et, dans certains cas, fournir les relations sémantiques avec des ontologies de domaines différents.
Le second acteur est le gestionnaire du serveur OGM³. Il contrôle les accès au serveur par les gestionnaires d'ontologies et les services et outils d'infrastructure, maintient les paramètres de pilotage, valide les cohérences inter-ontologies et assure la sécurité des données. Il pilote également l'efficacité du service afin qu'il réponde aux besoins et évolue dans le temps.
Le troisième acteur est l'utilisateur des services ou des outils de portail, catalogage, d'intégration, de partage ou de représentation de données, etc. Ces services sont en fait des acteurs qui accèdent au service OGM³ afin d'améliorer leurs résultats ou leurs efficacités.
L'objet est la banque de connaissance sur les ontologies géospatiales. Elle maintient la connaissance par ontologie et par langue ainsi que les relations sémantiques inter-ontologies.
Il contribuera aussi à placer le Canada en avant plan en géomatique, et de façon plus spécifique, en matière d'infrastructures de données géospatiales. Ce domaine est essentiel pour le développement économique des années 2000 et la création d'emplois dans les industries du savoir.
Le service OGM³ est accessible via un protocole Web normalisé basé sur
La figure suivante décrit les technologies du serveur OGM³. ![]() Les données sont stockées dans des fichiers ou un système de gestion de base de données (SGBD) afin de permettre d'indexer les concepts et de faciliter leur gestion. L'accès aux données se fait par l'intermédiaire de JDBC et les essais ont été réalisés avec les SGBD Access, MySQL et Oracle. La constitution des ontologies est faite par l'intermédiaire de Protégé-2000, adapté pour le rendre conforme au modèle des données et aux concepts et orientations proposées. Le serveur utilise plusieurs normes, notamment :
Consultez la version démonstration du service et les exemples de constitution d'ontologies et d'opérations du service OGM³, ou demandez d'avantages d'informations sur ce service. |