- Site officiel

DES PROJETS NATIONAUX

L'UMR Tetis conduit des projets de recherche nationaux en collaboration avec ses tutelles ainsi que des agences nationales et des instituts de recherche.
Les domaines de recherche de l'UMR sont multiples : le traitement de séries temporelles d'images satellites, la modélisation, la cartographie des milieux naturels, etc.
 
SONGES
Science des dONnées hétéroGènES.

 

Contexte et action menées

Les masses de données à notre disposition sont souvent de nature très hétérogène : enquêtes, atlas images et couches SIG, suivis de mesures sur des parcelles de cultures, publications scientifiques, littérature grise, etc.



La mise en correspondance de ces données est un problème éminemment difficile mais crucial.
Par exemple, une culture de riz décrite dans des articles de la littérature agronome est aussi caractérisée par des aspects économiques et sociétaux (pratiques agricoles, gestion des réseaux de fermes, exportation des cultures, etc.) développés dans des documents d'enquêtes terrains et via des indicateurs économiques et données exogènes (données météorologiques par exemple).


Description du projet

Les principales activités de recherche menées dans le cadre du projet SONGES portent sur l'étude des Système d'Information et la problématique du « Big Data », en s'intéressant principalement au traitement de l’hétérogénéité des données.
Outre la mise en relation de données textuelles, le travail mené a l’ambition de s’attaquer à la mise en relation de données de nature différente. Cette relation n’a été que très peu abordée, de manière générique, dans la littérature scientifique.
Dans ce contexte, différentes méthodologies sont explorées dans un cadre pluridisciplinaire de mise en relation selon trois axes :
          (1) mise en relation thématique, 
          (2) mise en relation spatiale, 
          (3) mise en relation temporelle.

L’identification de descripteurs pertinents propres à ces trois axes est proposée par des méthodes symboliques, statistiques et sémantiques et l’utilisation de méthodes de TALN (traitement automatique du langage naturel) pour explorer les données textuelles. Les travaux menés forment un cadre de référence commun.
Les méthodes proposées sont génériques et sont expérimentées sur des jeux de données réels, par exemple dans le cadre de projets autour de la veille automatique en épidémiologie animale.

Le projet SONGES (Science des dONnées hétéroGènES) s’intéresse à la mise en relation « sémantique » des données textuelles hétérogènes issues de bases de production diverses. Les liens ainsi mis en évidence constituent les prémisses d'un monde "linked data". Site Web
 
INFOS PROJET

Date de début de projet : 01/01/2016 
Date de fin de projet : 31/12/2019
Partenaires/organismes associés :  ASTRE, LIRMM, ERIC
Leader du projet : TETIS
Autres équipes impliquées :
Axe(s) de recherche TETIS : SISO 
Responsable projet TETIS : Roche Mathieu
Autres participants TETIS : Maguelonne Teisseire, Roberto Interdonato, Jacques Fize, Sarah
Valentin, Hugo Deléglise.
Organisme porteur au sein de TETIS : CIRAD
Pays, région d’étude : France
Commanditaire : Région Occitanie
Source de financement : Union Européenne