Conférence EGC 2025
Extraction et Gestion des ConnaissancesLa conférence EGC 2025 s’est déroulée du 27 au 31 janvier 2025 à Strasbourg, rassemblant chercheurs et praticiens des sciences des données et des connaissances. Cet événement annuel a permis de présenter des avancées en apprentissage automatique, ingénierie et représentation des connaissances, fouille et analyse de données, bases de données et web sémantique. Il a favorisé les échanges entre académiques et industriels, mettant en lumière les synergies entre recherche fondamentale et applications concrètes.
Parmi les interventions, celle de Mathieu Roche, chercheur au CIRAD et membre de l’UMR TETIS, qui a présenté une conférence invitée intitulée « Enjeux et opportunités de la fouille de textes pour stimuler la recherche pluridisciplinaire ». Les travaux en sciences des données textuelles ont connu un essor remarquable, ouvrant de nombreuses perspectives depuis l’avènement des modèles de langue et des grands modèles de langue (LLM – Large Language Model). Dans ce contexte, les recherches pluridisciplinaires intégrant des ressources textuelles hétérogènes offrent de nouvelles opportunités. Mathieu Roche a dans un premier temps dressé un panorama des approches de fouille de textes intégrées dans différents projets appliqués à l’agriculture et à la santé, dans une perspective One Health (une seule santé) en soulignant que les recherches pluridisciplinaires peuvent se nourrir mutuellement et mener à la co-construction de démarches génériques. Dans un second temps, il a montré de quelle manière (i) les travaux disciplinaires peuvent alimenter les travaux pluridisciplinaires et (ii) comment les problématiques thématiques peuvent engendrer de nouveaux défis scientifiques pour la fouille de textes et la recherche académique. Enfin, sa présentation a abordé les nouvelles problématiques méthodologiques et disciplinaires liées aux LLM et à leur usage, en particulier dans les pays du Sud. Ces enjeux incluent les biais issus des modèles, le traitement des langues peu dotées, l’intégration de connaissances syntaxiques et sémantiques dans les modèles, ainsi que des questions liées à l’explicabilité et à la frugalité.
Cette édition de la conférence EGC a confirmé son rôle essentiel dans le partage des connaissances et l’évolution des pratiques en science des données, en ouvrant de nouvelles perspectives pour les collaborations futures.
Le séminaire s’est clôturé dans une ambiance conviviale avec un dîner sur place, offrant un moment privilégié pour renforcer les liens entre les membres de l’équipe et prolonger les échanges de manière informelle.
Outre l’exposé invité de Mathieu Roche, l’UMR TETIS était très bien représentée à travers les présentations de Rémy Decoupes (Ingénieur de recherche INRAE) et Sarah Valentin (Chercheuse CIRAD)) intitulées respectivement « Adaptations des modèles IA pour interroger en langage naturel la base de données LandMatrix » et « Extraction de connaissances à partir de données textuelles : application à la découverte de règles de changement d'usage des sols ». Ces travaux montrent également que les contributions méthodologiques proposées par TETIS peuvent être mises en oeuvre dans des travaux pluridisciplinaires en collaboration (HydroSciences - Montpellier, International Land Coalition - Rome).
Dernières actualités
-
4 mars 2025
Conférence EGC 2025
-
3 mars 2025
Séminaire de l’UMR TETIS
-
26 février 2025
CARI 2024 et DAAFRICA 2024, Béjaïa, Algérie