Transformer d'anciennes cartes en modèles numériques 3D de quartiers perdus
Andrew Corselli
Imaginez-vous enfiler un casque VR et vous promener dans le quartier disparu depuis longtemps dans lequel vous avez grandi. C'est désormais une possibilité très réelle, car les chercheurs ont développé une méthode permettant de créer des modèles numériques 3D de quartiers historiques à l'aide de l'apprentissage automatique et des cartes historiques de Sanborn Fire Insurance.
"L'histoire ici est que nous avons désormais la possibilité d'exploiter la richesse des données intégrées dans ces atlas des incendies de Sanborn qui ont été créés pour environ 12 000 villes et villages aux États-Unis", a déclaré Harvey Miller, co-auteur de l'étude et professeur de géographie. à l'Université d'État de l'Ohio. « Cela permet une toute nouvelle approche de la recherche historique urbaine que nous n’aurions jamais pu imaginer avant l’apprentissage automatique. Cela change la donne.
Le co-auteur de l'étude, Yue Lin, doctorant en géographie à l'OSU, a développé des outils d'apprentissage automatique capables d'extraire des détails sur des bâtiments individuels à partir des cartes, notamment leur emplacement et leur empreinte, le nombre d'étages, les matériaux de construction et leur utilisation principale.
Les chercheurs ont testé leur technique d'apprentissage automatique sur deux quartiers adjacents du côté est de Columbus, Ohio, qui ont été en grande partie détruits dans les années 1960 pour faire place à la construction de l'I-70. Les techniques d'apprentissage automatique ont permis d'extraire les données des cartes et de créer des modèles numériques.
La comparaison des données des cartes de Sanborn avec celles d'aujourd'hui a montré qu'un total de 380 bâtiments ont été démolis dans les deux quartiers pour l'autoroute, dont 286 maisons, 86 garages, cinq appartements et trois magasins. L'analyse des résultats a montré que le modèle d'apprentissage automatique était précis à environ 90 % pour recréer les informations contenues dans les cartes.
"Nous voulons arriver au point dans ce projet où nous pouvons donner aux gens des casques de réalité virtuelle et les laisser marcher dans la rue comme c'était le cas en 1960 ou 1940 ou peut-être même en 1881", a déclaré Miller.
Voici une interview exclusive de Tech Briefs – éditée pour plus de clarté et de longueur – avec Miller et Lin.
Fiches techniques: Pouvez-vous expliquer en termes simples comment fonctionne la technologie ?
Miller : Ce que nous faisons, c'est appliquer des algorithmes aux données. Dans ce cas, nous utilisons pour une partie ce qu'on appelle des machines à vecteurs de support ainsi que le masque R-CNN. La façon dont cela fonctionne généralement est que nous étiquetons manuellement les réponses correctes sur les cartes, puis les transmettons à l'algorithme d'apprentissage automatique pour qu'il apprenne par essais et erreurs, par retours positifs et négatifs. Lorsqu’il apprend finalement à détecter l’information, nous pouvons l’appliquer aux données, puis l’appliquer au reste des cartes.
Lin : Sur les exemples de cartes, nous avons plusieurs types d’informations. Le premier type d’informations est le plan du bâtiment. Si vous regardez les exemples de cartes, chaque bâtiment a ses propres contours et ses propres formes, et il a également ses propres couleurs. Les couleurs représentent les matériaux des bâtiments. Nous optimisons le modèle d'une machine à vecteurs de support pour classer chaque pixel en fonction des couleurs afin de pouvoir distinguer les arrière-plans et les bâtiments car ils ont des couleurs distinctes. C'est ainsi que nous détectons les contours et les formes du bâtiment pour créer une visualisation.
Il existe d'autres types d'informations, comme les utilisations du bâtiment ; par exemple, qu'il s'agisse d'un magasin ou d'un immeuble résidentiel. Et sur des exemples de cartes, nous pourrons également connaître les stockages de chaque bâtiment car ils sont tous étiquetés sur les bâtiments.
À cet égard, nous étudions un modèle de détection appelé Mask R-CNN. C'est en combinant ces différentes informations que nous créons la visualisation 3D, basée sur ces cartes historiques et en utilisant l'apprentissage automatique.
Fiches techniques: Quels ont été les plus grands défis techniques auxquels vous avez été confronté tout au long de votre travail ?
Lin : La partie géoréférencement. Nous avons collecté des exemples de cartes de la Bibliothèque du Congrès et, pour ces cartes, bien qu'elles soient numérisées, numérisées et colorisées, elles ne sont pas géoréférencées. Il nous a donc fallu un certain temps pour comprendre comment géoréférencer automatiquement ces cartes – c'était un très gros défi ; ce sont des cartes historiques, et souvent nous n'avons pas pu trouver beaucoup de points de contrôle pour faire le géoréférencement.