Pourquoi utiliser des ontologies pour interpréter les images de télédétection ?



Arvor_GISandRS-2019.jpg

ARTICLE DANS GISCIENCE & REMOTE SENSING

Le lancement de nouveaux capteurs et un accès facilité aux données satellitaires transforment considérablement la théorie et la pratique de la télédétection. Le développement exponentiel des corpus de données d'observation de la Terre requiert la mise au point d’algorithmes innovants et performants. A ce titre, les approches privilégiées aujourd’hui sont surtout inductives, basées sur de l’apprentissage à partir d’échantillons d’entraînement. De la sorte, la communauté de la télédétection tend à développer des approches « boîtes noires » qui ne permettent pas d’appréhender toute la complexité du processus d’interprétation d’images.

Pourtant, l’interprétation des images satellitaires est bien une tâche complexe qui dépend fortement des caractéristiques de l’image (résolutions spectrales, radiométriques, spatiales et temporelles), des compétences de l’opérateur et surtout de ses intentions. Par exemple, un écologue peut considérer une haie comme un habitat pour certaines espèces animales tandis qu’un agronome peut appréhender cette même haie comme une barrière limitant la dispersion de maladies entre deux parcelles cultivées. Par ailleurs, même si les intentions sont claires, les experts mobilisent constamment des concepts vagues (il existe par exemple plus de 800 définitions du concept de forêt basées sur différents critères de superficie ou densité et de hauteur d’arbres) et ambigus (une plantation d’arbres doit-elle être considérée comme une forêt ?) qui rendent difficiles les échanges entre télédétecteurs et les utilisateurs finaux. Ainsi, les approches inductives axées sur la donnée et mettant de côté l’expertise thématique (en écologie, agronomie, géographie, etc) tendent à creuser le fossé avec les utilisateurs des images satellitaires, lesquels sont en effet plus habitués à mobiliser des approches déductives, basées sur de l’inférence logique (par exemple, une haie - est composée - d’arbres – et – a –une fonction).

La communauté scientifique de la télédétection se doit donc aujourd’hui de développer des méthodes hybrides alliant les approches inductives et déductives. Dans cette optique, des techniques de représentation des connaissances telles que les ontologies sont appelées à jouer un rôle primordial. Malheureusement, force est de constater que les applications de télédétection basées sur les ontologies ont encore du mal à capter l'attention des experts en télédétection. L’article publié en mars 2019 par Damien Arvor (LETG-Rennes) et ses collègues dans la revue GIScience & Remote Sensing a pour objectif d’expliquer de manière simple ce que les ontologies peuvent (ou pas) apporter à la télédétection.


Les ontologies : définition et utilisation en télédétection

Dans un contexte scientifique de traitement informatique des données de masse (« big data »), on s’intéresse ici davantage à la définition du terme ontologie à l’aune de l'intelligence artificielle. Une ontologie est une technique de représentation des connaissances généralement définie comme "une spécification formelle et explicite d'une conceptualisation partagée" (Gruber 1995) fournissant une représentation non ambiguë et formelle d'un domaine. Une conceptualisation est une vision abstraite et simplifiée du monde dans un but précis. Plus concrètement, les ontologies sont des manières formelles de spécifier explicitement la connaissance du domaine, en définissant les propriétés des concepts étudiés et les relations qui les maintiennent ensemble. Par exemple, "un arbre - est une sorte de - végétation", "une feuille - fait partie d'un - arbre", "la plage - est adjacente à - la mer", etc.

La définition des ontologies repose donc sur deux piliers : (1) "explicite" signifie que tous les concepts et leurs relations sont explicitement formalisés et (2) "partagé" signifie que l'ontologie représente une connaissance consensuelle dans un domaine spécifique, c'est-à-dire qu'elle a été approuvée par une communauté scientifique. Les ontologies formelles sont censées fournir un vocabulaire et un sens communs pour permettre aux applications informatiques de communiquer entre elles et aussi de communiquer avec les utilisateurs. Enfin, les ontologies formelles sont basées sur des logiques de description (DL) qui permettent de raisonner afin d'inférer de nouvelles connaissances.

Les ontologies sont utilisées avec succès depuis longtemps dans divers domaines scientifiques tels que la génétique, la biologie, l’écologie, ou encore l’économie. Toutefois, leur utilisation en géographie reste principalement limitée aux applications dans les systèmes d'information géographique (SIG). Cependant, les ontologies ont également été utilisées avec succès en télédétection, notamment par Damien Arvor dès 2013. Bien que leurs applications soient diverses (annotation sémantique d'images satellitaires, analyse de chaînes de traitement en télédétection, etc), l’application majeure consiste à utiliser les ontologies pour interpréter les images satellitaires en intégrant de la connaissance experte dans le processus de classification d’image. Des ontologies ont ainsi été utilisées pour la reconnaissance automatique des caractéristiques urbaines (réalisées par ailleurs à partir de données LiDAR), pour l'identification de constructions individuelles à partir des images TerraSAR-X, pour l'analyse des images SAR à très haute résolution, pour la cartographie des zones côtières à partir d'images multispectrales, pour la classification basée sur les pixels à partir de règles spectrales, etc.

Cependant, malgré l'intérêt croissant pour les ontologies en télédétection, leurs concepteurs et utilisateurs ont encore la plus grande difficulté à susciter l'attention et l’adhésion des experts en télédétection. Cette difficulté peut être due à l'écart existant d’une part entre les attentes des experts en télédétection concernant les ontologies formelles, et d’autre part, leur contribution réelle à la télédétection. En effet, les télédétecteurs attendent surtout des améliorations significatives et quantifiées des cartes produites tandis que les ontologies apportent surtout plus de transparence et d’échange dans la construction des chaînes de traitement. Les principaux avantages offerts par les  ontologies pour les applications de télédétection basées sur des logiques de description sont les suivants :

  1. Une représentationsymboliquedes éléments observés dans les images, associant les concepts de haut niveau (ex. forêt) avec des concepts plus bas-niveau issus de l’image (ex. indice de végétation ou indice de texture).
  2. Un partage des connaissances facilité par l'utilisation d'une conceptualisation commune (vocabulaire et sémantique) et l'adoption d'un langage ontologique standard.
  3. Un raisonnement logique assuré par les logiques de description, celles-ci permettant d'utiliser d’algorithmes de raisonnement pour inférer de nouvelles connaissances à partir de descriptions explicites.

 

 

Référence

Damien Arvor, Mariana Belgiu, Zoe Falomir, Isabelle Mougenot & Laurent Durieux (2019): Ontologies to interpret remote sensing images: why do we need them?, GIScience & Remote Sensing

 

 

Contact OSUR

Damien Arvor (LETG-Rennes) / @
Alain-Hervé Le Gall (multiCOM OSUR) / @