LUPAN, le Premier Corpus Français pour la Gestion de l'Artificialisation des Sols
Dans un monde où l'artificialisation des sols menace l'équilibre écologique et la sécurité urbaine, notre projet, nommé Hérelles, émerge comme une solution innovante. Nous avons conçu un cadre novateur visant à améliorer la gestion de ce phénomène préoccupant. En combinant l'analyse de séries chronologiques d'images satellite et l'exploitation des documents d'urbanisme, nous avons créé un corpus unique baptisé LUPAN (« Local Urban Plans And Natural risks ») afin d’extraite de façon automatique les règles d’urbanisation sur une zone identifiée.
Pour cela, nous avons annoté manuellement un certain nombre de ces documents concernant la Métropole de Montpellier Méditerrannée (3M) en pleine évolution et exposée aux risques naturels. Nous avons défini un format pour les exemples étiquetés dans lequel chaque entrée comprend un titre et un sous-titre. De plus, nous avons proposé une représentation hiérarchique des étiquettes de classes pour généraliser l'utilisation de notre corpus.
Ce corpus, le premier du genre en langue française, comporte 1934 segments textuels annotés dans quatre catégories distinctes : « Vérifiable », « Non-vérifiable », « Informative » et « Non pertinent ». Grâce à LUPAN, nous ouvrons la voie à la création d'un modèle d'apprentissage automatique permettant de classifier les textes réglementaires et ainsi d'identifier les règles d'urbanisme.
Un tel modèle peut déterminer si le texte d'entrée contient une règle indiquant la possibilité d'une vérification avec des images satellite (classe « Vérifiable »), l'impossibilité d'une telle vérification (classe « Non-vérifiable »), des règles non strictes sous forme de recommandations (classe « Informative ») ou aucune de celles qui précèdent (classe « Non pertinent »). Cette avancée majeure offre la possibilité de mieux prévenir les risques naturels liés à l'urbanisation galopante, propulsant ainsi notre société vers une gestion plus intelligente et durable de son environnement urbain.