Conférence ISMIS 2022

Hugo Deléglise, et al.

Conférence ISMIS 2022

Hugo Deléglise (auteur), et al. Edité dans International Symposium on Methodologies for Intelligent Systems.
Résumé :

L’article "Mining news articles dealing with Food Security" (Hugo Deléglise, Agnès Bégué, Roberto Interdonato, Elodie Maître d’Hôtel, Mathieu Roche & Maguelonne Teisseire) a obtenu  le « Best Paper » à la conférence ISMIS 2022 (International Symposium on Methodologies for Intelligent Systems). L'article, issu d’une partie des travaux de la thèse d'Hugo Deléglise, porte sur l'utilisation de techniques de fouille de textes pour analyser des problématiques de sécurité alimentaire au Burkina Faso à partir de données textuelles. Dans ce cadre, un pipeline original a été proposé, mis en place et évalué. Celui-ci combine différentes approches d'analyse textuelles fondées sur les plongements de mots, d’analyse de sentiments, de nouvelles mesures de discriminance et la construction de lexiques dédiés. Ce processus permet d’obtenir un modèle explicatif qui a été évalué sur des données réelles en français (articles de presse du Burkina Faso). Les résultats des analyses montrent que notre méthode offre des informations qualitatives et explicatives distinctes et complémentaires sur le thème de la sécurité alimentaire selon des axes d’analyses spatial et temporel.

Contexte et enjeux :

La sécurité alimentaire est une préoccupation majeure en Afrique de l’Ouest et particulièrement au Burkina Faso qui est l’épicentre d’une crise humanitaire qui s’intensifie depuis le milieu des années 2010 pour atteindre un niveau très inquiétant depuis 2018. Les systèmes d’alerte précoce de l’insécurité alimentaire et des famines s’appuient exclusivement sur des données numériques pour appréhender la situation sanitaire et alimentaire (prix du marché, données climatiques, images satellitaires, etc.), alors que les données textuelles, plus complexes à traiter, sont en général peu exploitées mais peuvent avoir un fort potentiel explicatif pour conduire des analyses qualitatives de la sécurité alimentaire complémentaires aux informations quantitatives. Les données textuelles issues de sites d’actualité ou de réseaux sociaux sont susceptibles de fournir de telles informations souvent localisables dans le temps et dans l’espace. Dans cette étude [1], nous nous intéressons au cas du Burkina Faso et nous nous demandons dans quelle mesure il est possible d’extraire automatiquement des informations sur la situation alimentaire globale, régionale et sur son évolution dans le temps à partir de corpus de journaux en mobilisant des méthodes originales de fouille de texte.

Résultats :
Les analyses ont été réalisées à partir d’un corpus de journaux Burkinabés, à savoir Burkina24 et LeFaso qui sont des quotidiens d’informations générales (économie, société, politique, culture, etc.). Une analyse rétrospective (2009-2018) a mis en avant les préoccupations caractéristiques de chaque région. Par exemple, l’expression ”inondation” est la plus importante de la région Centre en proie à cette problématique tandis que l’expression ”foncier” est mise en avant dans la région Hauts-Bassins pour laquelle la gestion des terres est une problématique majeure. Nous observons également que les expressions neutres (”riz”, ”fruit”, ”viande”, ”céréale”), les plus caractéristiques des années 2009 et 2010 laissent petit à petit leur place à des expressions davantage négatives (e.g., crise alimentaire, malnutrition, hausse des prix). Et de manière plus ponctuelle temporellement, le terme ”inondation” possède une valeur de discriminance élevée en 2009 et 2010, années durant lesquelles il y a eu de violentes inondations dans le pays et les termes ”criquet” et ”pèlerin” sont caractéristiques de 2013, période où ce fléau est omniprésent.
Perspectives :
Les perspectives de ces travaux peuvent être diverses comme la mise en place d’outils d’analyse de l’intensité et des causes des crises alimentaire. Par ailleurs, les descripteurs textuels peuvent être intégrés dans des architectures fondées sur l’apprentissage automatique et profond qui inègrent des données hétérogènes (bases de données, données satélitaires, etc.) [2]. Ces architectures permettent de prédire des indices de consommation et de diversité alimentaire. Enfin, d’autres types de données peuvent être intégrées qui sont actuellement en cours d’étude comme les transcriptions issues de YouTube [3].
Valorisation :
Ces travaux financés par l’institut #DigitAg (https://www.hdigitag.fr/fr/) sont le fruit d’une collaboration pluridisciplinaire entre le CIRAD et INRAE. Ce travail implique des chercheurs en sciences des données, télédétection et économie basés dans 2 unités de recherche de Montpellier (UMR TETIS et UMR MOISA). Ils ont été présentés auprès de divers partenaires comme le PAM (Programme Alimentaire Mondial) au Burkina Faso.
Références
bibliographiques :

[1] Hugo Deléglise, Agnès Bégué, Roberto Interdonato, Elodie Maître d'Hôtel, Mathieu Roche, Maguelonne Teisseire: Mining News Articles Dealing with Food Security. ISMIS 2022: 63-73
[2] Hugo Deléglise, Roberto Interdonato, Agnès Bégué, Elodie Maître d'Hôtel, Maguelonne Teisseire, Mathieu Roche: Food security prediction from heterogeneous data combining machine and deep learning methods. Expert Syst. Appl. 190: 116189 (2022)
[3] Cheick Tidiane Ba, Chloé Choquet, Roberto Interdonato, Mathieu Roche: Explaining food security warning signals with YouTube transcriptions and local news articles. GoodIT 2022: 315-322