Vers l'identification de règles d'urbanisme

Projet ANR Hérelles

Projet ANR Hérelles

Vers une identification (semi-)automatique de règles d'urbanisme

Le projet ANR Hérelles consiste à définir de nouveaux mécanismes permettant de faciliter l'étiquetage (ou la sémantisation) de clusters à partir de séries temporelles d'images satellites. Pour y parvenir, une solution proposée est d'associer des éléments textuels d'intérêt aux données satellitaires.
La première étape consiste à extraire automatiquement des règles à partir de documents d'urbanisme en français. Pour cela, l’équipe du projet propose une méthode basée sur la classification de portions de texte (appelées segments) avec plusieurs étiquettes. A chaque segment est associé un titre et un sous-titre spécifique. Une technique d'apprentissage en étapes est mobilisée afin de gérer les différentes catégories d’étiquettes qui sont organisées de façon hiérarchique
Plusieurs techniques d'augmentation de texte sont utilisées pour les textes en français, ceci dans l’objectif d'améliorer les résultats de classification. Les premiers résultats expérimentaux de cette approche classent correctement les catégories de segment avec une précision supérieure à 90%. Un résultat très encourageant
Maksim Koptelov, Maguelonne Teisseire et Mathieu Roche, tous trois membres de l’UMR TETIS, sont associés à ces travaux de recherche, des travaux qui ont fait l’objet d’une publication à la 10ème International Conference on Data Science and Advanced Analytics (DSAA). La conférence DSAA est reconnue pour sa forte synergie interdisciplinaire entre les statistiques, l'informatique et les sciences de l'information et de l'intelligence, ainsi que par des interactions interdomaines entre le monde universitaire et le monde des affaires. Cette manifestation scientifique est reconnue comme une réunion annuelle phare dédiée aux sciences et à l’analyse des données, notamment par Google Metrics et par la China Computer Foundation.