La collection Artificial Intelligence datasets for Land Cover Classification from Satellite Imagery (AI4LCC) est une initiative du Pôle de données Surface Continentales (
THEIA), de
l'infrastructure de recherche Data Terra pour la distribution de jeux d'entrainement basés sur de l'intelligence artificielle pour la classification de l'occupation du sol à partir d'images satellite. Les jeux de données peuvent être utilisés pour entrainer un algorithme d'apprentissage machine classique ou un algorithme plus avancé d'apprentissage profond. La collection est actuellement composée des jeux de données suivants:
1) Collection MultiSenGE, multi-temporelle et multi-modale pour la classification de l'occupation du sol, avec 8157 patches multi-temporels d'images Sentinel-1 et Sentinel-2 (256x256) sur la région Grand-Est region (France). Une procedure standard est utilisée pour la description de la collection via un fichier de méta-données. Les produits sont disponibles via les liens suivants :
- Fichier de méta-données :
AI4LCC-MultiSenGE.json
- Série de patches temporels Sentinel-1 (GRD) :
Sentinel-1 patches
- Série de patches temporels Sentinel-2 (L2A) :
Sentinel-2 patches
- Patches de référence :
Ground reference patches
- Fichiers JSON pour chaque patch :
label files
2) Collection MultiSenNA, multi-temporelle et multi-modale pour la classification de l'occupation du sol, avec 12258 patches multi-temporels d'images Sentinel-1 et Sentinel-2 (256x256) sur la région Nouvelle-Aquitaine region (France). Une procedure standard est utilisée pour la description de la collection via un fichier de méta-données. Les produits sont disponibles via les liens suivants :
- Fichier de méta-données :
AI4LCC-MultiSenNA.json
- Série de patches temporels Sentinel-1 (GRD) :
Sentinel-1 patches
- Série de patches temporels Sentinel-2 (L2A) :
Sentinel-2 patches
- Patches de référence :
Ground reference patches
- Fichiers JSON pour chaque patch :
label files
Details de ces collections sont disponibles dans
Wenger & al., 2022[1] et
Wenger & al., 2022[2]
La thèse associée à ces travaux est disponible ici
Wenger,2023[3]
En supplément, des outils python sont disponibles sur
Gihub pour extraire des informations de ce dataset.
La collection est diffusée, en utilisant des principes FAIR, par
l'Infrastructure de Recherche Data Terra (Pôle de données et de services surfaces continentales –
THEIA) via le service de diffusion EOST/A2S hébergé à l'Université de Strasbourg.