Comment nous citer :

LIVE & IRIMAS & THEIA | Data Terra. (2025): Artificial Intelligence benchmark datasets for Land Cover Classification from Satellite Imagery. EOST. (Collection)

doi:10.25577/563Q-QD29
RIS Citation BibTeX Citation Copier
La citation a été copiée dans le presse-papier

Description

La collection Artificial Intelligence datasets for Land Cover Classification from Satellite Imagery (AI4LCC) est une initiative du Pôle de données Surface Continentales (THEIA), de l'infrastructure de recherche Data Terra pour la distribution de jeux d'entrainement basés sur de l'intelligence artificielle pour la classification de l'occupation du sol à partir d'images satellite. Les jeux de données peuvent être utilisés pour entrainer un algorithme d'apprentissage machine classique ou un algorithme plus avancé d'apprentissage profond. La collection est actuellement composée des jeux de données suivants:

1) Collection MultiSenGE, multi-temporelle et multi-modale pour la classification de l'occupation du sol, avec 8157 patches multi-temporels d'images Sentinel-1 et Sentinel-2 (256x256) sur la région Grand-Est region (France). Une procedure standard est utilisée pour la description de la collection via un fichier de méta-données. Les produits sont disponibles via les liens suivants :
- Fichier de méta-données : AI4LCC-MultiSenGE.json
- Série de patches temporels Sentinel-1 (GRD) : Sentinel-1 patches
- Série de patches temporels Sentinel-2 (L2A) : Sentinel-2 patches
- Patches de référence : Ground reference patches
- Fichiers JSON pour chaque patch : label files

2) Collection MultiSenNA, multi-temporelle et multi-modale pour la classification de l'occupation du sol, avec 12258 patches multi-temporels d'images Sentinel-1 et Sentinel-2 (256x256) sur la région Nouvelle-Aquitaine region (France). Une procedure standard est utilisée pour la description de la collection via un fichier de méta-données. Les produits sont disponibles via les liens suivants :
- Fichier de méta-données : AI4LCC-MultiSenNA.json
- Série de patches temporels Sentinel-1 (GRD) : Sentinel-1 patches
- Série de patches temporels Sentinel-2 (L2A) : Sentinel-2 patches
- Patches de référence : Ground reference patches
- Fichiers JSON pour chaque patch : label files

Details de ces collections sont disponibles dans Wenger & al., 2022[1] et Wenger & al., 2022[2]
La thèse associée à ces travaux est disponible ici Wenger,2023[3]
En supplément, des outils python sont disponibles sur Gihub pour extraire des informations de ce dataset.

Licence

Les jeux de données AI4LCC sont sous licence open source Creative Commons License - Attribution Non Commercial 4.0 International (CC-BY-NC 4.0) Creative Commons License - Attribution Non Commercial 4.0 International .

Accès aux produits

La collection est diffusée, en utilisant des principes FAIR, par l'Infrastructure de Recherche Data Terra (Pôle de données et de services surfaces continentales – THEIA) via le service de diffusion EOST/A2S hébergé à l'Université de Strasbourg.

Pour aller plus loin

  1. Wenger, R., Puissant, A., Weber, J., Idoumghar, L., Forestier, G. (2022). Multimodal and Multitemporal Land Use/Land Cover Semantic Segmentation on Sentinel-1 and Sentinel-2 Imagery: An Application on a MultiSenGE Dataset ISPRS Ann. Photogramm. Remote Sens. Spatial Inf. Sci., V-3-2022, 635–640 , HTML
  2. Wenger, R., Puissant, A., Weber, J., Idoumghar, L., Forestier, G. (2022). Multimodal and multitemporal land use/land cover semantic segmentation on sentinel-1 and sentinel-2 imagery: An application on a MultiSenGE dataset. Remote Sensing, 15(1), 151. , HTML
  3. Wenger, R.(2023). Contribution of Sentinel-1&2 imagery and deep learning methods for land use land cover mapping and monitoring (Doctoral dissertation, Université de Strasbourg) , HTML