Challenge Atelier TextMine 2024
TETIS remporte le second prix
Comme le précisent les organisateurs du Challenge Atelier TextMine de la conférence francophone sur l'Extraction et la Gestion des Connaissances (EGC) dans la présentation de leur évènement, « nous sommes entrés dans une ère ou la donnée textuelle sous toute ses formes submerge chacun de nous que ce soit dans son environnement personnel ou professionnel : l'augmentation croissante de documents nécessaires aux entreprises ou aux administrations, la profusion de données textuelles disponibles via Internet, le développement des données en libre accès (Open Data), les bibliothèques et archives en lignes, les media sociaux ne sont que quelques exemples illustrant l'évolution de la notion de texte, sa diversité et sa prolifération.
Face à cela les méthodes automatiques de fouille de données (data mining), et plus spécifiquement celles de fouille de textes (text mining) sont devenues incontournables. Récemment, les méthodes de deep learning ont créées de nouvelles possibilités de recherche pour traiter des données massives et de grandes dimensions. Cependant, de nombreuses questions restent en suspens, par exemple en ce qui concerne la gestion de gros corpus textuels multithématiques. Pouvoir disposer d’outils d’analyse textuelle efficaces, capables de s’adapter à de gros volumes de données, souvent de nature hétérogène, rarement structurés, dans des langues variées, des domaines très spécialisés ou au contraire de l'ordre du langage naturel reste un challenge. »
Le Challenge de cette année intitulé « Reconnaissance d'entités géographiques dans un corpus d'instructions nautiques », avait pour objectif la détection des mentions de lieux décrites dans les volumes de descriptions des littoraux constitués par l’Institut national de l'information géographique et forestière (IGN) et le Service hydrographique et océanographique de la Marine (Shom).
L’UMR TETIS, regroupant de nombreux chercheurs spécialisés dans le domaine de l'IA, a relevé le défi en réentraînant plusieurs modèles d'intelligence artificielle basés sur des réseaux de neurones avec des architectures appelées "transformers". Les travaux et résultats des chercheurs mobilisés ont été récompensés par la seconde place à l'EGC'24.
L'équipe de l’UMR TETIS était constituée de Rémy Decoupes, Roberto Interdonato, Rodrigue Kafando, Mahtab Syed Alam, Maguelonne Teisseire, Mathieu Roche et Sarah Valentin. Elle s'intéresse aux problématiques liées à l'extraction et à la représentation de l'information spatiale issue de textes. Le défi TextMine 2024, axé sur l'extraction des termes géographiques, offrait une belle opportunité pour tester les approches élaborées au sein de l'unité de recherche.
Dernières actualités
-
24 November 2024
Lauriers INRAE 2024
-
22 November 2024
Les défis de l’eau en Occitanie
-
22 November 2024
Le prix caché de la transition énergétique