- Site officiel

Martin LENTSCHAT 

ARTEXT4LOD - EXTraction de relations n-ARy pour les données ouvertes liées.

Thésard: Martin LENTSCHAT  
Contact - Lieu d'accueil: Maison de la Télédétection - Bâtiment ADRET - bureau 222 - 500 rue Jean-François Breton, 34093 Montpellier Cedex 5, France
Tél.
Organisme d'accueil: Cirad
Directeur (trice) de thèse: Patrice BUCHE (directeur, UMR IATE, INRA Montpellier)
Encadrement à Tetis: Mathieu ROCHE (co-directeur)
Autre (s) encadrant (s):  Juliette DIBIE (co- directrice, Département MMIP, AgroParisTech)
Axe (s) Tetis concerné (s): SISO 
Début - Fin: 01/10/2018 - 31/09/2021

Contexte / Cadre du thésard :
This thèse en text-mining s'inscrit dans le cadre du projet MUSE TEXT4LOD. Elle fait suite à la thèse de Lilia BERRAHOU, achevée en septembre 2015, qui concernait la reconnaissance et l'extraction d'arguments de relations N-Aires dans les textes scientifiques, le processus étant guidé par une Ressource Termino-Ontologique.
Résumé :
Cette thèse s'attaque à la problématique de l'extraction des connaissances expérimentales et de leurs représentations. L'objectif est ici d'enrichir une base de connaissances utilisée dans les outils d'aides au prix de décisions extrayant des arguments de relations n-Aires dans des documents scientifiques textuels. Notre approche se basera sur les techniques précédemment établies; cad utilisant une Ressource Termino-Ontologique établie par des experts afin de guider le processus d'extraction et la recherche de motifs séquentiels fréquents, tout en offrant de nouveaux éléments qui ont permis d'enrichir le processus d'extraction. En effet en Regardant à la fois les métadonnées et les informations contextuelles il sera possible d'avoir de nouvelles dimensions au processus, que cela soit pour guider ou enrichir les relations N-Aires extraites et ce à toutes les étapes de l'extraction. Une prise en compte sémantique et syntaxique plus poussée sera également décrite. 

Mots-clés: fouille de texte, relations N-Aires, Ressource Termino-Ontologique, méta-données, informations contextuelles, fouille de données, analyse syntaxique.