- Site officiel

HDR soutenues

L'habilitation à diriger des recherches (HDR), est un diplôme national de l'enseignement supérieur (créé en 1984) qu'il est possible d'obtenir après un doctorat. Ce diplôme permet d'être directeur de thèse, rapporteur sur une thèse et de postuler à un poste de professeur des universités, sous réserve de l'inscription sur la liste de qualification par le conseil national des université.

 

Maguelonne Teisseire
Maguelonne Teisseire

Habilitation à diriger des recherches spécialité Informatique, Université de Montpellier II, Mention Très Honorable, 5 Décembre 2007.

Titre : Autour et alentour des motifs séquentiels
Président : D. Laurent, Professeur à l'Université de Cergy Pontoise.
Rapporteurs : G. Gardarin, Professeur à l'Université de Versailles-St Quentin, M. Hacid, Professeur à l'Université de Lyon, E. Bertino, Professeur Purdue University, USA.  
Examinateurs : D. Hérin, Professeur à l'Université de Montpellier II, J. Nanard, Professeur à l’Université de Montpellier II. 
HDR soutenue : 2002 


Résumé :

Parmi les techniques utilisées en fouille de données, la recherche de motifs séquentiels permet d'extraire des connaissances sur le comportement des données.
Les principaux travaux de recherche autour des motifs s'intéressent à la définition d'algorithmes efficaces pour « passer à l'échelle » et manipuler un espace de recherche volumineux. Même si ces dernières années nous nous sommes également intéressés au facteur temps pour l'extraction de motifs, les travaux présentés dans ce mémoire se focalisent plus particulièrement sur de nouvelles extensions proposées aux motifs afin d'offrir des connaissances correspondant aux attentes du décideur.
Tout d'abord nous proposons une représentation des données « classiques » (i.e. booléennes) en développant les définitions de motifs séquentiels que nous avons choisis comme format de description des comportements extraits.
Nous répondons ensuite, au travers de l'approche ISE, à la question suivante : comment utiliser une connaissance extraite au préalable pour optimiser la phase d'extraction lorsque de nouvelles données arrivent ?
Nous proposons également une représentation moins stricte des comportements et définissons les méthodes d'extraction associées (approche approximative) : SpeedyFuzzy, MiniFuzzy et TotallyFuzzy.
Via une composante floue, nous montrons que de nouveaux motifs plus informatifs peuvent être extraits. Nous poursuivons l'utilisation de l'approche approximative pour prendre en compte des contraintes temporelles dans des motifs : GETC. Cette approche complète nos précédents travaux consistant à intégrer très tôt les contraintes dans le processus d'extraction et ainsi optimiser leur prise en compte : GTC. Lorsque les données manipulées deviennent plus complexes, nous montrons que les motifs s'avèrent être également une représentation adaptée.
Nous nous attachons à décrire certaines de nos propositions sur deux types de données complexes : 
              (1) pour les documents textuels, nous proposons une approche de classification supervisée SPAC et
              (2) pour les données multidimensionnelles, nous présentons deux nouvelles techniques permettant de prendre en compte différentes dimensions d'analyse, M2SP, et la hiérarchie disponible sur les dimensions : HYPE.

 

Mots-clés : Bases de données Extraction de connaissances Fouille de données Motifs séquentiels
Mathieu Roche
Mathieu Roche

Exploration et exploitation de données textuelles LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier

Titre : Fouille de Textes : de l'extraction des descripteurs linguistiques à leur induction  
Président du jury : Nathalie AUSSENAC-GILLES, Directrice de Recherche CNRS
HDR soutenue : 09/12/2011
Lien : https://tel.archives-ouvertes.fr/tel-00816263 


Résumé :

Les masses de données textuelles aujourd'hui disponibles engendrent un problème difficile lié à leur traitement automatique.
Dans ce cadre, des méthodes de Fouille de Textes (FT) et de Traitement Automatique du Langage (TAL) peuvent, en partie, répondre à une telle problématique.
Elles consistent à modéliser puis mettre en œuvre des méthodologies appliquées aux données textuelles afin d'en déterminer le sens et/ou découvrir des connaissances nouvelles. Dans ce processus, le descripteur linguistique constitue un élément pivot. Après une présentation des méthodes de traitement des descripteurs en eux-mêmes, ces derniers seront étudiés en contexte, c'est-à-dire en corpus.
L'identification des descripteurs est souvent difficile à partir de corpus bruités et à faible contenu textuel sur lesquels nous concentrons nos efforts (par exemple, corpus issus du Web 2.0 ou du traitement OCR). Outre les mots considérés comme des descripteurs linguistiques pertinents en FT, nous nous sommes également intéressés à l'étude des syntagmes complexes à partir de corpus classiques puis d'une terminologie classique à partir de corpus complexes (par exemple, données logs ou corpus en français médiéval).
Dans la suite, les syntagmes étudiés ne se situent plus à proprement parler dans les textes mais ils seront induits à partir des mots issus des corpus. Les méthodes proposées permettent de mettre en relief des syntagmes originaux tout à fait utiles pour l'identification d'Entités Nommées, le titrage automatique ou la construction de classes conceptuelles.
Contrairement au raisonnement déductif, le raisonnement inductif est dit hypothétique. Dans ce cadre, l'utilisation de méthodes de validation automatique des relations induites par le biais d'approches de Fouille du Web se révèle déterminant. Les perspectives à ce travail se concentreront sur l'extraction de nouveaux descripteurs.
Ces derniers seront associés à de nouvelles représentations sous forme d'entrepôts de données textuelles.
Enfin, les travaux que nous souhaitons développer se focaliseront sur l'analyse des textes dans un contexte plus vaste lié au multimédia que le paradigme du Web 2.0 a mis en exergue ces dernières années.

 

Mots-clés : Fouille de Textes, Traitement Automatique du Langage Naturel, Recherche d'Information
Jean-Philippe Tonneau
Jean-Philippe Tonneau

Habilitation à diriger des recherches spécialité Informatique, Université Paris 1 Pantheon-Sorbonne, 08 octobre 2003.

Titre : De la communauté au territoire. Un itinéraire de recherche pour le développement
Lieu : Université Paris 1 Pantheon-Sorbonne 
HDR soutenue : 08/10/2003 
Lien :
téléchargez le résumé pdf


Résumé :

L'auteur est chercheur au CIRAD, Centre de Recherche Agronomique pour le Développement en Coopération. Cet institut de recherche est un instrument de la politique française pour le Développement du monde rural des pays du sud. Il s'est d'abord consacré aux recherches pour le développement de la productivité des principales cultures tropicales. Les échecs de la "modernisation" des décennies 70 et 80 ont amené les équipes du CIRAD à travailler de plus en plus sur les conditions du sous-développement. Les travaux pluridisciplinaires du CIRAD sont finalisés et bénéficient de l'insertion d'agents dans les institutions des pays du sud (université, institut de recherche..).
La spécificité du CIRAD se retrouve dans le document présenté par M. Tonneau. Le thème traité est celui du rôle de la géographie dans les actions pour le développement économique et social. L'auteur défend l'intérêt d'une géographie de l'action, en appui à l'élaboration des projets de sociétés des populations rurales.
Le document est organisé en quatre parties.
La première, intitulée "Des terrains" relatent les expériences personnelles de l'auteur dans des opérations de développement en Afrique et au Brésil. Ces expériences sont diverses :éducation en Guinée Bissau ; gestion de terroirs au Burkina Faso ; développement local et appui à la décentralisation au Brésil. Elles sont datées et illustrent de manière concrète les évolutions de paradigmes qu'a connu le concept du développement depuis 1970 :
           ♦ Priorité initiale au transfert technique, à la formation et au crédit dans des projets gérés par des Etats puissants soutenus par les financements de la communauté internationale,
           ♦ Désengagement de l'Etat et recherche de l'autonomie par la promotion de l'initiative privée, la participation et le développement local,
           ♦ Décentralisation et institutions de régulation sociale dans le cadre des collectivités territoriales. 
Au-delà des différences de situations contrastées, l'analyse de ces expériences permet de tirer un cahier des charges des besoins et exigences des opérations de développement. Le développement est question d'articulation et d'équilibres entre échelles (du local à l'international),  entre acteurs (dans leur diversité), entre objectifs (production stricto sensu finalités sociales, exigences environnementales), entre pas de temps (court et long terme), entre production et reproduction.
L'auteur souligne la fragilité des projets de société, de vie… de populations rurales contraintes par des objectifs divers, parfois contradictoires et souvent imposés. La priorité reste l'élaboration de projets.
Pour cette élaboration, l'auteur propose une démarche systémique, constructiviste et éthique, favorisant des processus d'apprentissage collectif. L'information a un rôle essentiel dans ce processus. Elle est le support de la réflexion qui elle-même structure et organise l'information.
Ni les communautés traditionnelles (trop endogène et ne favorisant pas suffisamment l'initiative privée), ni les entreprises "modernes" (inspirées de modèles trop éloignés des réalités) ne semblent capables d'organiser les relations sociales nécessaires à des projets porteur de développement. Le territoire "régional", espace géographique construit, pour répondre à la fois aux aspirations des populations locales et aux exigences de la mondialisation) est le lieu des nouvelles expériences sociales et devient un nouveau type d'organisation sociale.
La référence au territoire justifie le "long compagnonnage avec la géographie", traité dans la seconde partie. Après avoir rapidement expliqué comment la géographie a été reconnue par l'institution CIRAD, l'auteur recense les outils méthodologiques, utilisés dans la démarche : outils de diagnostic (obtenir et donner du sens à l'information), outils de structuration de l'information (le modèle) et outils de dialogue. Les représentations cartographiques (zonages et représentations chorématiques) et les systèmes d'informations géographiques sont rapidement apparues comme les instruments privilégiés dans la gestion de l'information (produire, traiter pour donner du sens et être support de dialogue).
La troisième partie "Etudes de cas" montre comment ces outils ont été utilisés dans des opérations de développement local et régional au Sénégal (vallée du Fleuve) et au Nord Cameroun. A partir d'actions très localisées dans des villages (gestion de terroirs, plan d'occupation des sols…), ces projets se sont attachés à étendre les résultats à des provinces. L'auteur traite du changement d'échelles, tant dans ses aspects géographiques (comment les analyses de terroirs contribuent à la perception de dynamiques régionales ?) qu'institutionnels (comment initier des politiques publiques en valorisant des opérations de développement local ? ). L'auteur montre toutes les difficultés de la planification qui doit concilier liberté d'entreprendre et cadre de contraintes pour défendre l'intérêt général, par ailleurs bien difficile à définir.
La quatrième partie "Théories et méthodes" est plus prospective. Elle défend une conception de la recherche au service du projet social, toujours difficile à formaliser. La recherche ne doit pas que résoudre les difficultés rencontrées au quotidien en proposant des solutions techniques, sociales et institutionnelles pour que la société fonctionne mieux. Elle doit aussi (et d'abord ?) aider aux choix sociétaux. La recherche doit éclairer les choix des acteurs sociaux pour éviter les dérives des experts et des gourous.
C'est dans cette perspective que l'auteur trace les principales axes de recherche qu'il veut mener dans la continuité des travaux présentés. L'articulation "organisation sociale et territoire" sera la question centrale, travaillée à la lumière de la décentralisation et des pratiques de négociation entre acteurs privés et collectivités territoriales.
Trois thèmes seront développés :
           ♦ les systèmes d'informations.
           ♦ Les dispositifs institutionnels d'articulation entre Politiques publiques et acteurs privés.
           ♦ La mesure des impacts des opérations de développement sur les dynamiques sociales.  
Ces thèmes seront principalement traités grâce à des travaux de maîtrise, de DEA et de doctorat, insérés dans un réseau de projets et terrains au Brésil, au Sénégal, au Cameroun, en France (Réunion).
Des formations universitaires et professionnelles (atelier de recherche) permettront d'élaborer un corps de méthodes, confronté à la réflexion sur les théories du développement.

 

Mots-clés : Bases de données Extraction de connaissances Fouille de données Motifs séquentiels
Annelise Tran
Annelise Tran

Mémoire présenté pour l'obtention de l'Habilitation à Diriger des RecherchesSoutenance, le 27 septembre 2013, Université Montpellier.

Titre : Télédétection, analyse et modélisation spatiales appliquées à l'épidémiologie des maladies vectorielles
Lieu : Université Montpellier 
HDR soutenue : 27/09/2013 
Lien Agritrop :
téléchargez le mémoire 


Résumé :

Les maladies vectorielles ont un impact important sur la santé publique et vétérinaire et le nombre de leurs émergences ou ré-émergences au cours des dernières décennies a significativement augmenté. De ce fait, une meilleure connaissance de leurs mécanismes de transmission, de diffusion et d'émergence est requise pour la mise en place de méthodes de contrôle ou de surveillance adaptées.
En particulier, la compréhension de l'influence de l'environnement physique et humain sur le système hôte-vecteur-pathogène paraît essentielle dans un contexte de changements globaux. Les travaux présentés ici font la synthèse de onze années de recherche dans le domaine de la télédétection spatiale appliquée à l'épidémiologie de maladies vectorielles.
Cette thématique est abordée autour de trois questions de recherches principales concernant :

          i) la définition d'indicateurs environnementaux pertinents en épidémiologie à partir d'images d'Observation de La Terre ;
          ii) la description et la quantification des patrons de transmission d'un pathogène en fonction de caractéristiques environnementales, par une approche analytique ;
          iii) la prise en compte du paysage et de la dynamique des conditions environnementales dans la modélisation des processus de transmission.
Ces différents thèmes sont illustrés par des exemples d'étude de plusieurs maladies, en particulier la fièvre de la Vallée du Rift, la fièvre du Nil Occidental et la fièvre catarrhale ovine.

 

Mots-clés : Épidémiologie spatiale, modélisation, télédétection, Systèmes d'Information Géographique, maladie vectorielle, zoonose.
Flavie Cernesson
Flavie Cernesson

Habilitation à diriger des recherches -  AgroParisTech - Montpellier, le 08 janvier 2016.

Titre : Data et Moduli ! Données et Modèles hydrologiques pour une gestion territorialisée de l’eau
Jury : Chantal Gascuel-Odoux, Directrice de Recherche, INRA, Rennes - Denis Dartus, Professeur, IMFT, Toulouse - Hervé Piégay, Directeur de Recherche, CNRS, Lyon - Jean-Claude Deutsch, Chercheur Emérite, Ecole des Ponts- ParisTech, Marne la Vallée - Keith Beven, Professeur Emérite, Université de Lancaster, Lancaster, UK - Marie-George Tournoud, Professeure, Université de Montpellier, Montpellier.
Ecole doctorale : GAIA
HDR soutenue : 08/01/2016


Résumé :

Les aléas hydro-climatiques, la répartition inégale - voire la rareté - et la dégradation de la qualité de la ressource en eau influencent les activités humaines qui, elles-mêmes, impactent la ressource en eau et les hydrosystèmes. Initialement sectorielle, la politique de l’eau pour répondre aux enjeux d’une gestion durable de la ressource a été territorialisée.
Dans ce contexte, je développe ou j’adapte des modèles simulant des processus hydrologiques : pluie, pluie-débit, transfert de contaminants pour différents objectifs :
         ♦ la compréhension de ces processus, notamment sous l’influence de l’occupation des sols, tant pour en comprendre l’origine que l’impact sur les milieux récepteurs ;
         ♦ l’estimation de flux, de chroniques de débits ou d’événements de crues pour accompagner le changement de pratiques ou proposer des aménagements.

Mes terrains d’études sont des bassins versants peu instrumentés. Les données initiales sont issues des réseaux opérationnels dédiés au suivi du régime hydrologique ou de la qualité de l’eau.
J'utilise aussi les données géographiques extraites des bases de données nationales. Ces données sont complétées à partir de protocoles d'observations spécifiques établis en collaboration avec des équipes d'hydrologues et de cartographies d'occupation du sol dédiées à un usage hydrologique.
Je me fonde sur des approches conceptuelles ou statistiques en veillant à leur simplicité et leur robustesse. Qu’impliquent précisément cette simplicité et cette robustesse lors du développement de modèles destinés à être utilisés dans le cadre d’une gestion territorialisée de la ressource en eau ?
Je répondrai à cette question à partir de mes travaux de recherche et de mes encadrements d’étudiants et de doctorants.

 

Mots-clés : 
André Miralles
André Miralles

Habilitation à diriger des recherches, spécialité Informatique, Université de Montpellier, le 26 mai 2016.

Titre : Contribution à une conception rationnelle et malléable des systèmes d’information environnementaux
Jury : Jean-Paul Donnay - Professeur - Unité Géomatique - Université de Liège - Rapporteur
Amedeo Napoli - Directeur de recherche CNRS - LORIA Nancy - Rapporteur
Franck Ravat - Professeur - IRIT - Université Toulouse I Capitole - Rapporteur
Thérèse - Libourel Professeur émérite - Espace Dev - Université Montpellier - Examinatrice
Marianne Huchard - Professeur - LIRMM - Université Montpellier - Examinatrice
Christophe Claramunt - Professeur - Irenav - Université Bretagne Occidentale - Examinateur Laurent Deruelle - Docteur - Directeur scientifique - Berger Levrault - Examinateur
Jérôme Gensel - Professeur - LIG - Université Grenoble Alpes - Examinateur
Ecole doctorale : I2S - Université Montpellier
HDR soutenue : 26/05/2016


Résumé

Les systèmes d’information environnementaux englobent les systèmes d’information et d’aide à la décision pour l’environnement.
De ce fait, ils ont des spécificités dues notamment à la nature des informations traitées (spatio-temporelles) et au fait qu’ils mobilisent une grande diversité d’acteurs.
En conséquence, leur conception et leur implémentation constituent un vrai challenge. Une autre caractéristique propre à ces systèmes est qu’ils doivent évoluer dans le temps afin de tenir compte de l’évolution des concepts thématiques qui font parfois encore l’objet de recherches, de la réglementation qui devient souvent de plus en plus prégnante, etc.
Les recherches menées depuis une dizaine d’années m’ont permis de définir une méthodologie de conception itérative, individu centré, évolution centrée et capitalisation centrée qui rationalise la conception et la modélisation assurant ainsi une meilleure capitalisation des connaissances et des données.
Les deux idées majeures de cette méthodologie reposent tout d’abord sur la mise en œuvre d’un ensemble de transformations de modèles permettant l’automatisation de la chaîne de conception.
L’architecture informatique des systèmes ainsi conçus est plus malléable, le concepteur hésite donc moins à traiter leur évolution. L’autre volet consiste à intégrer les principes issus de l’analyse formelle de concepts.
La mise en œuvre de méthodes de factorisation de modèles a permis d’extraire le modèle (Greatest Common Model) qui regroupe en son sein tous les concepts communs.
Ces méthodes de factorisation constituent un moyen d’introduire de la rationalité dans les modèles et par voie de conséquence de capitaliser les connaissances.
Diverses perspectives sont envisagées dans cette même optique. Les travaux sur les transformations de modèles vont être élargis pour prendre en compte les données imparfaites qui peuvent jouer un rôle important dans les systèmes environnementaux.
Un autre élargissement concerne la mise en œuvre de base de données noSQL pour les entrepôts de données.
Les travaux en factorisation de modèles vont être poursuivis dans deux voies principalement : la maîtrise du nombre de nouveaux concepts créés et l’introduction du Traitement Automatique des Langues mais aussi le recours aux ontologies de domaine pour faciliter la factorisation ou le nommage des concepts métiers.

Mots-clés :