Composites sans nuages GeoMAD
Date de modification : novembre 2024

Aperçu du service
Aperçu
GeoMAD est le service de données géomédianes et d’écart absolu médian triple de Digital Earth Africa (DE Africa). Il s’agit d’un composite sans nuage de données satellite compilées sur des périodes de temps spécifiques. Ce service est idéal pour :
Analyse des séries chronologiques à plus long terme
Imagerie sans nuages
Précision statistique
GeoMAD comporte deux composants principaux :
Géomédian
Écarts absolus médians (MAD)
La composante géomédiane combine les mesures collectées sur la période spécifiée pour produire une mesure multispectrale représentative pour chaque unité de pixel du continent africain. Le résultat final est un ensemble de données complet qui peut être utilisé pour générer des images en vraies couleurs pour l’inspection visuelle de repères anthropiques ou naturels. L’ensemble complet de données spectrales peut être utilisé pour développer des algorithmes plus complexes.
Pour chaque pixel, les données non valides sont éliminées et les observations restantes sont résumées mathématiquement à l’aide de la statistique géomédiane. La couverture de survol fournie par la collecte de données sur une période donnée permet également de délimiter les zones nuageuses par intermittence.
Les variations entre la géomédiane et les mesures individuelles sont capturées par les trois couches d’écart absolu médian (MAD). Il s’agit de mesures statistiques d’ordre supérieur qui calculent la variation par rapport à la géomédiane. Les couches MAD peuvent être utilisées seules ou avec la géomédiane pour obtenir des informations sur la surface terrestre et comprendre les changements au fil du temps.
Le calcul de GeoMAD sur différentes périodes et avec différents capteurs fournit une gamme d’informations sur l’environnement. Une période annuelle permet une meilleure correction de la couverture nuageuse et réduit les artefacts pour la comparaison sur plusieurs années. Une période plus courte, par exemple des blocs de six ou trois mois, capture mieux les variations saisonnières au sein d’une année et peut être utilisée pour comparer des périodes équivalentes de différentes années. Les capteurs Landsat permettent d’exploiter pleinement les archives de réflectance de surface remontant à 1984, tandis que les données Sentinel-2 plus récentes fournissent des survols à plus haute fréquence et une meilleure résolution.
Le service GeoMAD de Digital Earth Africa fournit actuellement des ensembles de données annuels, semestriels de six mois et mensuels glissants (fenêtre mobile de 3 mois), avec des services distincts pour les capteurs Landsat et Sentinel-2.
Des notebooks Jupyter qui illustrent le chargement et l’utilisation des ensembles de données GeoMAD et Rolling GeoMAD dans le Sandbox sont également disponibles.
Spécifications
Le service GeoMAD couvre toute l’Afrique et est actuellement disponible dans trois périodes :
Annuel : les observations d’une année civile sont résumées en un seul ensemble de mesures
GeoMAD annuel Sentinel-2
GéoMAD annuel de Landsat 8
GéoMAD annuel de Landsat 5 et 7
GéoMAD annuel de Landsat 8 et 9
Semestriel : les observations sont résumées pour chaque moitié de l’année civile, donnant un ensemble de mesures pour janvier-juin et un pour juillet-décembre
GeoMAD semestriel Sentinel-2
Rolling GeoMAD : les observations sont résumées sur des périodes glissantes de trois mois commençant le premier jour de chaque mois calendaire, donnant un ensemble de nouvelles mesures chaque mois, par exemple janvier-mars, février-avril, mars-mai, etc.
GeoMAD mensuel glissant Sentinel-2
Les métadonnées GeoMAD peuvent également être consultées sur l’explorateur de métadonnées de Digital Earth Africa <https://explorer.digitalearth.africa/products/gm_s2_annual/extents>.
Tableau 1 : Spécifications du service Sentinel-2 GeoMAD
Spécification |
|||
|---|---|---|---|
Nom du service |
GeoMAD annuel Sentinel-2 |
GeoMAD semestriel Sentinel-2 |
GeoMAD mensuel glissant Sentinel-2 |
État du service |
Opérationnel |
Opérationnel |
Opérationnel |
Nombre de bandes |
14 |
14 |
14 |
Taille de la cellule - X (mètres) |
10 |
10 |
10 |
Taille de la cellule - Y (mètres) |
10 |
10 |
10 |
Système de coordonnées de référence (SCR) |
EPSG: 6933 |
EPSG: 6933 |
EPSG: 6933 |
Résolution temporelle |
Annuel |
Semestriel (janv-juin, juil-déc) |
Mensuel (fenêtre glissante de 3 mois) |
Plage temporelle |
2017 – en cours |
2017 – en cours |
2019 – en cours |
Ensemble de données parent |
Sentinelle-2 Niveau 2A |
Sentinelle-2 Niveau 2A |
Sentinelle-2 Niveau 2A |
Fréquence de mise à jour |
Annuel |
6 mois |
Mensuel |
Latence de mise à jour |
2 mois à compter de la fin de l’année précédente |
2 mois à compter de la fin du semestre précédent |
1 mois à compter de la fin de la période précédente |
Tableau 2 : Spécifications du service Landsat GeoMAD
Spécification |
|||
|---|---|---|---|
Nom du service |
GéoMAD annuel de Landsat 8 et 9 |
GéoMAD annuel de Landsat 8 |
GéoMAD annuel de Landsat 5 et 7 |
État du service |
Opérationnel |
Opérationnel |
Opérationnel |
Nombre de bandes |
10 |
10 |
10 |
Taille de la cellule - X (mètres) |
30 |
30 |
30 |
Taille de la cellule - Y (mètres) |
30 |
30 |
30 |
Système de coordonnées de référence (SCR) |
EPSG: 6933 |
EPSG: 6933 |
EPSG: 6933 |
Résolution temporelle |
Annuel |
Annuel |
Annuel |
Plage temporelle |
2021 – 2023 |
2013 – 2020 |
1984 – 2012 |
Ensemble de données parent |
Collection Landsat niveau 2 2 |
Collection Landsat niveau 2 2 |
Collection Landsat niveau 2 2 |
Fréquence de mise à jour |
Annuel |
Annuel |
N / A |
Latence de mise à jour |
2 mois à compter de la fin de l’année précédente |
2 mois à compter de la fin de l’année précédente |
N / A |
Le service annuel GeoMAD de Landsat 5 et 7 combine les données des capteurs Landsat 5 et Landsat 7. Il est produit uniquement pour les archives de 1984 à 2012. De même, le service annuel GeoMAD de Landsat 8 et 9 est entré en production après la mise à disposition des données de Landsat 9 fin 2021.
Figure 1 : Étendue géographique de GeoMAD
Les données GeoMAD de Digital Earth Africa sont disponibles pour les régions ombrées en bleu. Des étendues temporelles et géographiques spécifiques peuvent être explorées sous forme de carte interactive dans l’explorateur de métadonnées de Digital Earth Africa <https://explorer.digitalearth.africa/products/gm_s2_annual/extents>`__.
Les services GeoMAD Sentinel-2, Landsat 8 et Landsat 8 & 9 sont générés à partir d’ensembles de données parents avec des survols fréquents de satellites cohérents avec l’étendue géographique illustrée dans la figure 1. Bien que le GeoMAD annuel de Landsat 5 et Landsat 7 couvre également la même zone, il existe certaines limitations associées à la rareté des archives Landsat sur l’Afrique, en particulier avant le lancement de Landsat 7 en 1999.
Ceci est illustré visuellement dans l’imagerie « count » de la Figure 2. L’Afrique du Nord et l’Afrique australe ont la meilleure couverture sur la période d’archivage. L’Afrique centrale et l’Afrique de l’Ouest présentent des comptages de données plus faibles, et donc moins d’années où une géomédiane et des MAD ont été calculées. Il est recommandé de consulter l’explorateur de métadonnées Digital Earth Africa <https://explorer.digitalearth.africa/products/gm_ls5_ls7_annual/extents>`__ pour connaître la disponibilité précise des données du GeoMAD de Landsat 5 et 7.
Figure 2 : Étendue des données Landsat 5 et 7 GeoMAD
À gauche : Une animation montrant le nombre de données sur l’Afrique pour les années 1984 à 2012. Le bleu foncé indique les nombres les plus élevés, tandis que le bleu clair indique les nombres les plus faibles. Les zones avec des nombres très faibles ou nuls au cours d’une année ne disposent pas de suffisamment de données pour calculer une géomédiane ou des MAD pour cette année-là.
À droite : une image statique montrant le nombre d’années pour lesquelles une géomédiane a été calculée. Au cours des 29 années entre 1984 et 2012, l’Afrique du Nord et l’Afrique australe présentent une couverture géomédiane presque complète, tandis que l’Afrique centrale et l’Afrique de l’Ouest présentent un nombre de géomédianes plus faible associé à une acquisition de données moindre au cours de la période.

Tableau 3.1 : Mesures Sentinel-2 GeoMAD
ID de la bande |
Description |
Plage de valeurs |
Type de données |
Aucune valeur de données |
|---|---|---|---|---|
B02 |
Géomédian B02 (Bleu) |
« 1 - 10000 » |
|
|
B03 |
Géomédian B03 (Vert) |
« 1 - 10000 » |
|
|
B04 |
Géomédian B04 (Rouge) |
« 1 - 10000 » |
|
|
B05 |
Géomédian B05 (bordure rouge 1) |
« 1 - 10000 » |
|
|
B06 |
Géomédian B06 (bordure rouge 2) |
« 1 - 10000 » |
|
|
B07 |
Géomédian B07 (bordure rouge 3) |
« 1 - 10000 » |
|
|
B08 |
Géomédian B08 (Proche infrarouge (NIR) 1) |
« 1 - 10000 » |
|
|
B8A |
Géomédien B8A (NIR 2) |
« 1 - 10000 » |
|
|
B11 |
Géomédian B11 (Infrarouge à ondes courtes (SWIR) 1) |
« 1 - 10000 » |
|
|
B12 |
Géomédien B12 (SWIR 2) |
« 1 - 10000 » |
|
|
SMAD |
Écart absolu médian spectral |
« 0 - 1 » |
|
|
EMAD |
Déviation absolue de la médiane euclidienne |
|
|
|
BCMAD |
Écart absolu médian de Bray-Curtis |
« 0 - 1 » |
|
|
COMPTER |
Nombre d’observations claires |
« 1 - 65535 » |
|
|
Tableau 3.2 : Mesures Landsat 8 et Landsat 8 & 9 GeoMAD
ID de la bande |
Description |
Plage de valeurs |
Type de données |
Aucune valeur de données |
|---|---|---|---|---|
SR_B2 |
Géomédian SR_B2 (Bleu) |
« 1 - 10000 » |
|
|
SR_B3 |
Géomédian SR_B3 (Vert) |
« 1 - 10000 » |
|
|
SR_B4 |
Géomédian SR_B4 (Rouge) |
« 1 - 10000 » |
|
|
SR_B5 |
Géomédian SR_B5 (NIR) |
« 1 - 10000 » |
|
|
SR_B6 |
Géomédian SR_B6 (SWIR 1) |
« 1 - 10000 » |
|
|
SR_B7 |
Géomédian SR_B7 (SWIR 2) |
« 1 - 10000 » |
|
|
SMAD |
Écart absolu médian spectral |
« 0 - 1 » |
|
|
EMAD |
Déviation absolue de la médiane euclidienne |
|
|
|
BCMAD |
Écart absolu médian de Bray-Curtis |
« 0 - 1 » |
|
|
COMPTER |
Nombre d’observations claires |
« 1 - 65535 » |
|
|
Tableau 3.3 : Mesures GeoMAD de Landsat 5 et Landsat 7
ID de la bande |
Description |
Plage de valeurs |
Type de données |
Aucune valeur de données |
|---|---|---|---|---|
SR_B1 |
Géomédian SR_B1 (Bleu) |
« 1 - 10000 » |
|
|
SR_B2 |
Géomédian SR_B2 (Vert) |
« 1 - 10000 » |
|
|
SR_B3 |
Géomédian SR_B3 (Rouge) |
« 1 - 10000 » |
|
|
SR_B4 |
Géomédian SR_B4 (NIR) |
« 1 - 10000 » |
|
|
SR_B5 |
Géomédian SR_B5 (SWIR 1) |
« 1 - 10000 » |
|
|
SR_B7 |
Géomédian SR_B7 (SWIR 2) |
« 1 - 10000 » |
|
|
SMAD |
Écart absolu médian spectral |
« 0 - 1 » |
|
|
EMAD |
Déviation absolue de la médiane euclidienne |
|
|
|
BCMAD |
Écart absolu médian de Bray-Curtis |
« 0 - 1 » |
|
|
COMPTER |
Nombre d’observations claires |
« 1 - 65535 » |
|
|
Les bandes peuvent être subdivisées comme suit :
Géomédiane - 10 bandes (Sentinel-2), 6 bandes (Landsat 5/7/8/9) : La géomédiane est calculée à l’aide des bandes spectrales des données collectées pendant la période spécifiée. Les valeurs de réflectance de surface ont été mises à l’échelle entre « 1 » et « 10 000 » pour permettre un stockage plus efficace des données sous forme d’entiers 16 bits non signés (« uint16 »). Notez que les jeux de données parents contiennent souvent plus de bandes, dont certaines ne sont pas utilisées dans GeoMAD.
Les identifiants de bande géomédiane correspondent aux bandes des données parentes Sentinel-2 Level-2A. Par exemple, la bande annuelle GeoMAD « B02 » contient la géomédiane annuelle de la bande Sentinel-2 « B02 ».
Écarts absolus médians (MAD) - 3 bandes : Les écarts par rapport à la géomédiane sont quantifiés par des calculs d’écart absolu médian. Le service GeoMAD utilise trois MAD, chacun stocké dans une bande distincte : MAD euclidien (EMAD), MAD spectral (SMAD) et MAD Bray-Curtis (BCMAD). Chaque MAD est calculé en utilisant les mêmes dix bandes que dans la géomédiane. SMAD et BCMAD sont des ratios normalisés, ils sont donc sans unité et leurs valeurs se situent toujours entre « 0 » et « 1 ». EMAD est une fonction de la réflectance de surface mais n’est ni un ratio ni normalisé, par conséquent sa plage de valeurs valide dépend du nombre de bandes utilisées dans le calcul de la géomédiane - dix dans GeoMAD.
Nombre - 1 bande : Nombre de mesures satellite claires d’un pixel pour cette année civile. Ce chiffre est d’environ 60 pour Sentinel-2 et 20 pour Landsat 8 par an, mais il double dans les zones de chevauchement entre les scènes. Le « nombre » n’est pas intégré dans les calculs géomédians ou MAD. Il est destiné à l’analyse des métadonnées et à la validation des données.
Traitement
Toutes les observations claires pour la période donnée sont rassemblées à partir de l’ensemble de données parent. Les pixels nuageux sont identifiés et exclus. Les calculs géomédians et MAD sont ensuite effectués par le package hdstats.
Médias et exemples d’images
Image 1 : Animations sur l’Afrique du Nord. Géomédiane annuelle Landsat 5 et 7 de 1984 à 2012, couleurs vraies (RVB).
À gauche : Extension d’une zone agricole près de la ville de Sadat, en Égypte.
À droite : Urbanisation à Tanger, au Maroc.
Crédit : Contient le produit scientifique de réflectance de surface Landsat de niveau 2, gracieuseté de l’U.S. Geological Survey, traité par Digital Earth Africa.

Image 2 : Mangroves en Guinée-Bissau. Géomédiane annuelle Sentinel-2 2019, couleurs vraies (RVB).
Crédit : Contient des données Copernicus Sentinel modifiées 2019, traitées par Digital Earth Africa.
Image 3 : Terres cultivées en Afrique du Sud. MAD annuels Sentinel-2 2019, représentés en RVB.
Crédit : Contient des données Copernicus Sentinel modifiées 2019, traitées par Digital Earth Africa.

Image 4 : Champs irrigués en Égypte. Jan-Jun 2020 (à droite), Jul-Dec 2020 (à gauche). Géomédiane semestrielle Sentinel-2 2020, couleurs vraies (RVB).
Crédit : Contient des données Copernicus Sentinel modifiées 2020, traitées par Digital Earth Africa.
Image 5 : Le delta de l’Okavango, Botswana. MAD triples annuels Landsat 8 2020, tracés en RVB.
Crédit : Contient le produit scientifique de réflectance de surface Landsat de niveau 2, gracieuseté de l’U.S. Geological Survey, traité par Digital Earth Africa.
Image 6 : Animations 2020-2022 avec Sentinel-2 Rolling GeoMAD, couleurs réelles (RVB)
Les dates indiquées sont les points médians du Rolling GeoMAD.
Crédit : Contient des données Copernicus Sentinel modifiées 2022, traitées par Digital Earth Africa.
Terres agricoles dans le nord de l’Égypte

Zone humide en Guinée Bissua

Limitations connues
Le produit GeoMAD de Landsat 8 (et 9) présente un problème connu de qualité des données sur les régions marines. L’algorithme GeoMAD utilise les informations sur la qualité des pixels des données d’entrée pour identifier et masquer les pixels dont les observations sont de mauvaise qualité. Les images satellites prêtes à être analysées par Landsat 8 et 9 au-dessus de l’océan contiennent souvent des valeurs de réflectance de surface négatives, et les procédures de masquage de GeoMAD suppriment les pixels où des valeurs négatives se produisent. Ainsi, dans les régions où les pixels sont constamment négatifs tout au long de l’année, le produit GeoMAD contiendra une valeur sans données. Un exemple de cela peut être vu dans l”Image 7 ci-dessous où un système marin peu profond contient des valeurs sans données dans le GeoMAD car les valeurs de bande NIR dans les données d’entrée sont constamment négatives.
Image 7 : Système marin peu profond, île Maurice. GeoMAD annuel Landsat 8 2021 (à gauche), par rapport au GeoMAD Sentinel-2 (à droite), représenté en RVB.
Lien vers le portail cartographique

Services connexes
Références
Roberts, D., Mueller, N. et Mcintyre, A. (2017). Composites de pixels de grande dimension à partir de séries chronologiques d’observation de la Terre. IEEE Transactions on Geoscience and Remote Sensing, 55(11), 6254-6264. https://doi.org/10.1109/TGRS.2017.2723896
Roberts, D., Dunn, B., Mueller, N. (2018). Produits Open Data Cube utilisant des statistiques de séries chronologiques à haute dimension. 8647-8650. https://doi.org/10.1109/IGARSS.2018.8518312.
Licence
Licence internationale CC BY Attribution 4.0
Remerciements
Les algorithmes statistiques de haute dimension intégrés dans ce service sont l’œuvre du Dr Dale Roberts, de l’Université nationale australienne.
Accès aux données
Amazon Web Services S3
Les données GeoMAD sont accessibles à partir du bucket S3 associé.
Tableau 3 : Détails de l’accès aux données AWS
Détails AWS S3 |
|
|---|---|
ARN du compartiment |
|
Nom du produit |
|
Le bucket se trouve dans la région AWS « af-south-1 » (Le Cap). Des spécifications de région supplémentaires peuvent être appliquées comme suit :
aws s3 ls --region=af-sud-1 s3://deafrica-services/gm_s2_annual/
Les chemins d’accès aux fichiers suivent le format :
<nom du produit>/<version>/<x>/<y>/<période>/<x><y>_<période>_<bande>.<extension>
Tableau 4 : Convention de chemin d’accès au fichier AWS
Élément de chemin de fichier |
Description |
Exemple |
|---|---|---|
|
Nom du produit |
|
|
Version du produit |
« 1.0.0 » |
|
Numéro de tuile dans la direction « x ». |
|
|
Numéro de tuile dans la direction « y ». |
|
« période de temps » |
Année de collecte des données suivie de la période et de l’unité de temps au format « AAAA–P<période><unité> ». Les unités de temps sont désignées par des lettres majuscules, « Y » pour les années et « M » pour les mois. Les données annuelles sont « P1Y » tandis que les données semestrielles (comme les données semestrielles) sont « P6M ». |
« 2019–P1Y » |
|
Nom de fichier. Combine « x », « y », « timeperiod » avec « band », en utilisant les identifiants de bande et les extensions de fichier. Pour la plupart des tuiles, l’extension de fichier est « .tif ». |
La numérotation des tuiles utilise des carrés de grille de 96 km basés sur le CRS par défaut pour ce produit, « EPSG:6933 », avec l’origine définie dans le coin inférieur gauche de la région « EPSG:6933 » valide.
Services Web OGC (OWS)
Ce service est disponible via OWS de DE Africa.
Tableau 5 : Détails d’accès aux données OWS
Détails de l’OWS |
|
|---|---|
Nom |
« DE Africa Services » |
URL des services de cartographie Web (WMS) |
|
URL du service de couverture Web (WCS) |
|
Nom de la couche |
|
Les détails de Digital Earth Africa OWS peuvent être trouvés sur https://ows.digitalearth.africa/.
Pour obtenir des instructions sur la façon de se connecter à OWS, consultez « ce tutoriel <../web_services/index.ipynb> ».
Open Data Cube (ODC)
Les ensembles de données GeoMAD sont accessibles dans l’API ODC de Digital Earth Africa, qui est disponible via le « Digital Earth Africa Sandbox <https://sandbox.digitalearth.africa/hub/login> »__.
Des bandes de données spécifiques peuvent être appelées en utilisant soit les noms par défaut, soit l’un des noms alternatifs d’une bande, comme indiqué dans le tableau ci-dessous. Les commandes ODC datacube.Datacube.load sans bandes spécifiées chargeront toutes les bandes ; voir la documentation ODC.
Tableau 6.1 : Noms des produits et des bandes Sentinel-2 GeoMAD ODC
Nom du produit ODC : gm_s2_annual, gm_s2_semiannual, gm_s2_rolling
Nom du groupe |
Noms alternatifs |
|---|---|
B02 |
band_02, bleu |
B03 |
band_03, vert |
B04 |
band_04, rouge |
B05 |
bande_05, bord_rouge_1 |
B06 |
bande_06, bord_rouge_2 |
B07 |
bande_07, bord_rouge_3 |
B08 |
bande_08, nir, nir_1 |
B8A |
bande_8a, nir_étroit, nir_2 |
B11 |
bande_11, swir_1, swir_16 |
B12 |
bande_12, swir_2, swir_22 |
SMAD |
smad, sdev, SDEV |
EMAD |
emad, edev, EDEV |
BCMAD |
bcmad, bcdev, BCDEV |
COMPTER |
compter |
Tableau 6.2 : Noms des produits et des bandes ODC de Landsat 8 GeoMAD
Nom du produit ODC : « gm_ls8_annual »
Nom du groupe |
Noms alternatifs |
|---|---|
SR_B2 |
bande_2, bleu |
SR_B3 |
bande_3, vert |
SR_B4 |
bande_4, rouge |
SR_B5 |
bande_5, nir |
SR_B6 |
bande_6, tourbillon_1 |
SR_B7 |
bande_7, swir_2 |
SMAD |
smad, sdev, SDEV |
EMAD |
emad, edev, EDEV |
BCMAD |
bcmad, bcdev, BCDEV |
COMPTER |
compter |
Tableau 6.3 : Noms des produits et des bandes ODC Landsat 5 et 7 GeoMAD
Nom du produit ODC : « gm_ls5_ls7_annual »
Nom du groupe |
Noms alternatifs |
|---|---|
SR_B1 |
bande_1, bleu |
SR_B2 |
bande_2, vert |
SR_B3 |
bande_3, rouge |
SR_B4 |
bande_4, nir |
SR_B5 |
bande_5, tourbillon_1 |
SR_B7 |
bande_7, swir_2 |
SMAD |
smad, sdev, SDEV |
EMAD |
emad, edev, EDEV |
BCMAD |
bcmad, bcdev, BCDEV |
COMPTER |
compter |
Les noms de produits et de groupes sont sensibles à la casse.
Pour des exemples sur la façon d’utiliser l’API ODC, consultez le référentiel de blocs-notes d’exemples DE Africa <https://github.com/digitalearthafrica/deafrica-sandbox-notebooks>`__.
Informations techniques
Géomédian
Les composites de pixels sont créés en compilant plusieurs observations satellites d’une même zone pour former une image représentative. Ils sont devenus un élément essentiel de la recherche sur l’observation de la Terre, car la combinaison des mesures compense les données manquantes, telles que les lacunes causées par la couverture nuageuse. Il en résulte des ensembles de données complets qui permettent une analyse approfondie de vastes zones d’intérêt.
Il existe de nombreuses façons de former cette image. GeoMAD utilise la statistique récapitulative géomédienne pour combiner six mois ou une année de données en un composite scientifiquement rigoureux. Il produit une observation multispectrale pour chaque pixel de l’Afrique continentale.
La statistique géomédiane est parfois appelée « médiane géométrique », comme dans la figure ci-dessous. Pour lever toute ambiguïté avec d’autres types de statistiques portant des noms similaires, on l’appelle toujours « géomédiane » en Afrique de l’Ouest.
Figure 2 : Explication illustrée de la géomédiane.

La figure 2 utilise un exemple tridimensionnel pour illustrer comment la géomédiane est calculée pour un seul pixel contenant plusieurs mesures de données rouges, bleues et vertes.
L’ensemble de données contient \(N\) intervalles de temps de données satellite. Dans le cas de la figure 2, \(N=20\)
Chaque pas de temps contient \(p\) bandes. Dans ce cas, \(p = 3\) (une dimension pour le rouge, le vert et le bleu)
Par conséquent, chaque pas de temps peut être représenté par un vecteur tridimensionnel \(\mathbf{x}\). Un vecteur unique au pas de temps \(t\), \(\mathbf{x}^{(t)}\), ressemble à ceci :
:nbsphinx-math:`begin{align*} mathbf{x}^{(t)} = begin{bmatrix}
x^{(t)}_{red} \ x^{(t)}_{green}\ x^{(t)}_{blue}
end{bmatrix} end{align*}`
L’ensemble de données peut être représenté comme la collection des vecteurs à chaque pas de temps \(\mathbf{x}^{(1)}, \mathbf{x}^{(2)}, \dots \mathbf{x}^{(20)}\)
Projeté sur un plan, il ressemblera au tracé de la figure 2.2 - vingt points placés en fonction de leurs valeurs de rouge, vert et bleu. La géomédiane de ce pixel est alors le point où la distance euclidienne (distance en ligne droite) entre tous les points de données est minimisée. Ceci est illustré dans la figure 2.3 ; pour plus d’informations sur la distance euclidienne, voir la section ci-dessous sur la distance euclidienne MAD.
Appelons le point géomédian dans cet exemple \(\mathbf{m}_\text{example}\). La distance euclidienne entre un point \(\mathbf{x}\) et les points de données \(\mathbf{x}^{(t)}\) est donnée par \(\lVert \mathbf{x} - \mathbf{x}^{(t)} \rVert\). Le point auquel les vingt distances sont minimisées est trouvé en prenant \(\mathrm{argmin}\); l’argument des minima. Le géomédian peut alors être exprimé par l’équation suivante :
\begin{align*} \mathbf{m}_\text{exemple} = \underset{\mathbf{x} \in \mathbb{R}^3}{\mathrm{argmin}} \sum^{20}_{t=1} \lVert \mathbf{x} - \mathbf{x}^{(t)} \rVert \end{align*}
Dans cet exemple, le \(\mathbf{m}_\text{example}\) résultant, comme tout \(\mathbf{x}\), sera un vecteur tridimensionnel, avec une valeur pour le rouge, le vert et le bleu.
:nbsphinx-math:`begin{align*} mathbf{m}_text{exemple} =begin{bmatrix}
m_{red} \ m_{green}\ m_{blue}
end{bmatrix} end{align*}`
Le point géomédian \(\mathbf{m}\) n’est pas sélectionné parmi les vingt points de données. Il s’agit d’un vecteur distinct avec des valeurs uniques qui ne correspondent pas nécessairement aux valeurs de bande existantes de l’ensemble de données d’observation.
La formule de la géomédiane d’un seul pixel peut être généralisée pour p bandes et N pas de temps, comme indiqué dans Roberts et al., 2017 <https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8004469> __ :
\begin{align*} \mathbf{m} = \underset{\mathbf{x} \in \mathbb{R}^p}{\mathrm{argmin}} \sum^{N}_ {t=1} \lVert \mathbf{x} - \mathbf{x}^{(t)} \rVert \end{align*}
Dans les GeoMADs Sentinel-2, les dix bandes de la géomédiane donnent un espace à 10 dimensions - dans les GeoMADs Landsat, les six bandes de la géomédiane donnent un espace à 6 dimensions. Il est difficile d’illustrer cet exemple en six (ou dix !) dimensions, mais nous pouvons à la place fournir l’équation et la forme du résultat. Ici, le nombre de pas de temps N varie par pixel ; les pixels sur le chevauchement entre les bandes de satellites peuvent avoir un très grand N (jusqu’à environ 140 par an pour les services annuels Sentinel-2), tandis que les pixels au centre du trajet ne sont observés qu’une fois par survol et ont un N plus proche de 70.
:nbsphinx-math:`begin{align*} mathbf{m}_text{GeoMAD} = underset{mathbf{x} in mathbb{R}^{10}}{mathrm{argmin} } sum^{N}_{t=1} lVert mathbf{x} - mathbf{x}^{(t)} rVert = begin{bmatrix}
m_{B02} \ m_{B03}\ m_{B04}\ m_{B05} \ m_{B06}\ m_{B07}\ m_{B08} \ m_{B8A}\ m_{B11}\ m_{B12}
end{bmatrix} end{align*}`
Ce calcul est répété pour chaque pixel dans l’étendue spécifiée.
L’intérêt de la géomédiane réside dans le fait que toutes les bandes sont prises en compte simultanément. Cela permet de maintenir la relation spectrale entre les bandes, ce qui permet d’obtenir la valeur la plus représentative. De plus, la statistique géomédiane réduit le bruit spatial et améliore l’équilibre des couleurs par rapport à des statistiques similaires telles que la médiane ou la médoïde.
La géomédiane est donc un ensemble de données de base essentiel pour des applications telles que l’analyse de l’indice de bande pour la détection de la végétation, de l’eau et des zones urbaines. Elle est également utile comme couche d’entités dans les algorithmes d’apprentissage automatique.
DE Africa propose une visualisation géomédiane interactive disponible sous forme de widget Jupyter Notebook. Il compare graphiquement la géomédiane à une médiane pour un exemple 3D. Une capture d’écran d’exemple est présentée ci-dessous.
Figure 3 : Widget de visualisation géomédiane.
Pour interagir avec le widget, connectez-vous au Digital Earth Africa Sandbox et accédez au dossier Datasets > GeoMAD.
Écarts absolus médians triples (MAD)
Par définition, la géomédiane lisse les variations des données satellites pour sélectionner la valeur la plus centrale et la plus représentative. Les extrêmes extrêmes extrêmes sont généralement filtrés par la robustesse du calcul de la géomédiane. Cependant, il est toujours utile de connaître la variation au sein de l’ensemble de données. Cela donne lieu à un ensemble de statistiques de second ordre : les écarts absolus médians (MAD).
Les MAD sont des statistiques de changement basées sur la géomédiane. Elles montrent le degré de variation subi par chaque pixel au cours de la période donnée.
Décomposons l’acronyme « MAD » ; comme dans le titre, il signifie écart absolu médian :
Cela implique que nous avons une collection de mesures
Nous trouvons ensuite l’écart de chaque mesure par rapport à une valeur de référence, obtenant un écart pour chaque mesure
Ces écarts sont tous des valeurs absolues, donc chaque écart est égal ou supérieur à 0
Nous trouvons ensuite la médiane, ou valeur moyenne, de ces écarts
Cela nous donne un écart absolu médian
Dans ce cas, notre « collection de mesures » correspond aux données satellite de chaque survol. Même pour un seul pixel, nous disposons de plusieurs mesures dans l’axe temporel : une à chaque passage.
La « valeur de base » est la géomédiane, qui fournit un résultat multispectral pour chaque pixel.
Les « écarts » ici correspondent à trois valeurs différentes de distance ou de dissimilarité. Il existe plusieurs façons de quantifier la manière dont un changement s’est produit, c’est pourquoi ce service calcule trois MAD différents à utiliser dans l’analyse des données. Nous calculons, de trois manières distinctes, l’écart entre la géomédiane et la mesure d’un seul survol. Ces trois valeurs ont été choisies pour refléter une gamme de changements qui apparaissent dans les données d’observation de la Terre, et c’est pourquoi cette section de l’ensemble de données est souvent appelée « triple MAD ».
Les trois MAD utilisés en Afrique de l’Est sont :
Distance euclidienne MAD, EMAD (basée sur la distance euclidienne)
MAD spectral, SMAD (basé sur la distance cosinus)
Bray-Curtis MAD, BCMAD (basé sur la dissimilarité Bray-Curtis)
Chacun de ces calculs sera expliqué dans sa propre section ci-dessous. Des exemples de calculs avec des nombres réels sont présentés en annexe.
Notez qu’il existe de nombreux autres types de distances et de dissimilarités statistiques qui peuvent être utilisées pour l’analyse de l’écart absolu médian (par exemple : la distance de Manhattan, la distance de Canberra, « il y en a beaucoup <https://ricottalab.files.wordpress.com/2015/05/ricotta-podani-2017-ecocom-full.pdf> » et elles peuvent toutes être utilisées pour calculer un MAD). Cependant, dans les services DE Africa, les termes « triple MAD » ou « MAD » font toujours spécifiquement référence aux trois MAD inclus dans l’ensemble de données GeoMAD : EMAD, SMAD et BCMAD.
MAD euclidien (EMAD)
Le point de départ le plus logique pour réfléchir à l’un des MAD est le MAD euclidien (EMAD). En effet, EMAD vient de la distance euclidienne, et la distance euclidienne peut être expliquée par une analogie physique : c’est la façon dont nous mesurons les distances en ligne droite entre des points. Dans notre monde tridimensionnel, cela peut ressembler à ceci :
Figure 4 : Distance euclidienne en trois dimensions.
Dans le cas des données satellite, nous mesurons la distance euclidienne entre la valeur géomédiane d’un pixel et une mesure multispectrale unique. Le nombre de dimensions est égal au nombre de bandes dans les données. Dans l’illustration ci-dessous, \(m\) est la valeur géomédiane et \(\mathbf{x}\) la valeur mesurée. Dans les données réelles, il y aura plusieurs mesures sur une période de temps, donc \(t\) est le numéro du pas de temps, sinon noté dans les équations par un exposant \((t)\).
Par exemple, si nous avions trois bandes de données (rouge, verte et bleue) et trois pas de temps de données, nous pouvons alors calculer les distances euclidiennes comme suit :
Figure 5 : Distance euclidienne en trois dimensions sur trois pas de temps.
Chaque pas de temps donne un résultat de distance euclidienne distinct. EMAD est alors la médiane de toutes ces distances.
Dans la plupart des conditions de la vie réelle, il y aura plus de trois pas de temps et plus de trois bandes. Une expression générale de la distance euclidienne pour p bandes est donnée comme suit :
\begin{align*} &\text{Multispectral Euclidean distance for timestep }t \\ =& \sqrt{ \left( x^{(t)}_{\text{band 1}} - m_{\text{band 1}} \right)^2 + \left( x^{(t)}_{\text{band 2}} - m_{\text{band 2}} \right)^2 + \dots + \left( x^{(t)}_{\text{band p}} - m_{\text{band p}} \right)^2 }\\ =& \lVert \mathbf{x}^{(t)} - m \rVert_{\mathbb{R}^p} \end{align*}
Ensuite, l’EMAD pour \(N\) pas de temps est donné par Roberts et al, 2018, comme la médiane des distances euclidiennes de tous les pas de temps.
\begin{align*} \text{EMAD} = \text{médiane} \gauche( \gauche\{ \lVert \mathbf{x}^{(t)} - \mathbf{m} \rVert_{\mathbb{R}^p}, t = 1, \points , N \droite\} \droite) \end{align*}
Dans GeoMAD, les MAD sont calculés à partir des dix mêmes bandes que celles utilisées dans la géomédiane, donc \(p=10\). Le résultat de \(\lVert \mathbf{x}^{(t)} - \mathbf{m} \rVert_{\mathbb{R}^p}\) est un scalaire positif, donc \(\text{EMAD}_\text{GeoMAD}\) est un nombre scalaire positif. Comme dans la géomédiane, \(N\) dépend du nombre de survols de satellites propres à ce pixel.
\begin{align*} \text{EMAD}_\text{GeoMAD} = \text{médiane} \gauche( \gauche\{ \lVert \mathbf{x}^{(t)} - \mathbf{m} \rVert_{\mathbb{R}^{10}}, t = 1, \points , N \droite\} \droite) \end{align*}
La valeur maximale possible pour EMAD dépend des plages de valeurs pour chacune des bandes de l’ensemble de données. Dans le cas de GeoMAD, qui utilise au maximum des échelles de temps annuelles de dix bandes de données Sentinel-2, les valeurs EMAD valides vont de « 0 à 31 623 ».
L’EMAD est utile pour montrer les décalages d’albédo dans les spectres satellites.
MAD spectral (SMAD)
Le MAD spectral (SMAD) est basé sur les écarts absolus médians de la distance cosinus entre la géomédiane et les mesures individuelles.
En deux dimensions, la distance cosinus peut être comparée graphiquement à la distance euclidienne par la figure suivante :
Figure 6 : Relations relatives entre les distances euclidiennes et cosinus.
En général, la distance cosinus est liée à l’angle entre les deux points \(\theta\), tandis que la distance euclidienne est liée à la distance en ligne droite entre les deux points \(d\). Comme la distance euclidienne, les points sont plus semblables lorsque la distance cosinus entre eux est faible. La valeur de la distance cosinus est plus petite lorsque \(\theta\) est faible (c’est-à-dire proche de 0) ou lorsque \(\theta\) est proche de 180\(^{\circ}\).
Notez que nous pourrions avoir une petite distance cosinus mais une grande distance euclidienne ; par exemple, si l’angle entre les vecteurs est petit, mais que l’un est beaucoup plus long que l’autre. Il s’agit d’une propriété importante de la distance cosinus (et donc du SMAD) - contrairement à la distance euclidienne, la distance cosinus n’est pas faussée par l’amplitude des mesures.
La distance cosinus est définie plus formellement comme :
\begin{align*} \text{Distance cosinus (deux dimensions)} = 1 - \frac{x_1 y_1 + x_2 y_2}{ \left( \sqrt{ \left( x_1\right) ^2 + \left( x_2\right) ^2 } \right) \left( \sqrt{ \left( y_1\right) ^2 + \left( y_2\right) ^2 } \right)} \end{align*}
Pour plus de deux dimensions, nous pouvons généraliser la formule de distance cosinus pour un seul pixel. Pour une mesure multispectrale de \(p\) bandes au pas de temps \(t\), \(\mathbf{x}^{(t)}\), et la géomédiane au même point \(\mathbf{m}\), la distance cosinus est :
\begin{align*}\small &\text{Multispectral cosdist}\left( \mathbf{x}^{(t)}, m \right) \text{ for timestep } t \\ &= 1 - \frac{ \mathbf{x}^{(t)} \cdot \mathbf{m} }{ \lVert \mathbf{x}^{(t)} \rVert \ \lVert \mathbf{m} \rVert} \ \text{ for } \mathbf{x}^{(t)}, \mathbf{m} \in \mathbb{R}_{p}\\ &= 1 - \left( \frac{\left( x_{\text{band 1}}^{(t)} \right) \left(m_{\text{band 1}} \right) + \left( x_{\text{band 2}}^{(t)} \right) \left(m_{\text{band 2}} \right) + \cdots + \left( x_{\text{band p}}^{(t)} \right) \left(m_{\text{band p}} \right)}{ \left(\sqrt{\left( x_{\text{band 1}}^{(t)} \right)^2 + \cdots+ \left( x_{\text{band p}}^{(t)} \right)^2} \right) \left( \sqrt{\left( m_{\text{band 1}} \right)^2 + \cdots+ \left( m_{\text{band p}} \right)^2 } \right)} \right) \end{align*}
Ensuite, pour \(N\) pas de temps, SMAD est la médiane des distances cosinus.
\begin{align*} \text{SMAD} = \text{médiane} \gauche( \gauche\{ \text{cosdist}\gauche( \mathbf{x}^{(t)}, \mathbf{m} \droit), t = 1, \points , N \droit\} \droit) \end{align*}
Comme pour les autres distances et dissimilarités utilisées dans les MAD, cela donne une valeur scalaire positive, donc SMAD est un scalaire positif. Les valeurs valides pour SMAD se situent entre « 0 » et « 1 ».
Dans les applications de données d’observation de la Terre, le SMAD est utile pour montrer les zones de changement de couverture terrestre. L’une des raisons est que le SMAD est moins affecté par les nuages ; contrairement à l’EMAD, il est invariant aux changements d’albédo, tels que ceux causés par la diffusion du rayonnement solaire. Le SMAD peut également être utilisé pour suivre les plans d’eau, car l’eau présente une forte variation de réflectance.
Bray-Curtis MAD (BCMAD)
Le Bray-Curtis MAD (BCMAD) est calculé à partir de la dissimilarité de Bray-Curtis. La dissimilarité de Bray-Curtis met en évidence les différences dans chaque bande entre la mesure et la géomédiane.
Pour une seule bande de données satellite, la dissimilarité Bray-Curtis ressemble remarquablement à un indice de bande normalisé. Par exemple, si nous n’avions que des données de bande rouge, cela pourrait ressembler à ceci :
\begin{align*} \text{Dissimilarité Bray-Curtis monobande au pas de temps }t = \frac{\left| x_{\text{red}}^{(t)} - m_{\text{red}}\right|}{ \left| x_{\text{red}}^{(t)} + m_{\text{red}} \right| } \end{align*}
Il peut être généralisé à un ensemble de données multispectrales avec \(p\) bandes :
\begin{align*} &\text{Multispectral Bray-Curtis dissimilarity for timestep }t\\ &= \frac{\left| x_{\text{band 1}}^{(t)} - m_{\text{band 1}}\right| + \left| x_{\text{band 2}}^{(t)} - m_{\text{band 2}} \right| + \dots + \left| x_{\text{band p}}^{(t)} - m_{\text{band p}} \right| }{ \left| x_{\text{band 1}}^{(t)} + m_{\text{band 1}} \right| + \left| x_{\text{band 2}}^{(t)} + m_{\text{band 2}} \right| + \dots + \left| x_{\text{band p}}^{(t)} + m_{\text{band p}} \right|} \end{align*}
La dissimilarité de Bray-Curtis sera maximisée à une valeur de « 1 » lorsque les mesures de chaque bande sont complètement différentes. Inversement, la valeur de la dissimilarité sera faible lorsque chaque observation de bande est similaire à la géomédiane de cette bande.
Comme pour les autres MAD, le BCMAD est trouvé en prenant la médiane de toutes les dissemblances de Bray-Curtis à partir de \(N\) pas de temps. Pour GeoMAD, \(p=10\).
\begin{align*} \text{BCMAD} = \text{médiane} \gauche( \gauche\{ \frac{\gauche| \mathbf{x}^{(t)} - \mathbf{m} \droit|_{\mathbb{R}^p}}{\gauche| \mathbf{x}^{(t)} + \mathbf{m} \droit| _{\mathbb{R}^p}}, t = 1, \points , N \droite\} \droite) \end{align*}
BCMAD prend des valeurs de « 0 à 1 ».
Appendice
Exemple : calcul de la distance euclidienne
Prenons une sélection de bandes d’un pixel, d’un pas de temps. Pour ce pixel, nous avons à la fois les mesures prises par le survol d’un seul satellite et la valeur géomédiane.
Tableau A.1 : Exemple de données multispectrales - un pas de temps, quatre bandes
Groupe |
Mesure de la réflectance de surface \(x^{(t)}\) |
Géomédiane de la réflectance de surface \(m\) |
|---|---|---|
Bleu |
1028 |
969 |
Vert |
1468 |
1406 |
Rouge |
2176 |
2032 |
Proche infrarouge (NIR) 1 |
3090 |
3078 |
Alors la distance euclidienne pour ce pixel à ce pas de temps, \(t\), est :
\begin{align*} &\text{Euclidean distance} \\ \tiny &= \sqrt{\left( x^{(t)}_{\text{band 1}} - m_{\text{band 1}} \right)^2 + \left( x^{(t)}_{\text{band 2}} - m_{\text{band 2}} \right)^2 + \dots + \left( x^{(t)}_{\text{band p}} - m_{\text{band p}} \right)^2 }\\ &= \sqrt{\left( x^{(t)}_{\text{red}} - m_{\text{red}} \right)^2 + \left( x^{(t)}_{\text{green}} - m_{\text{green}} \right)^2 + \left( x^{(t)}_{\text{blue}} - m_{\text{blue}} \right)^2 + \left( x^{(t)}_{\text{nir1}} - m_{\text{nir1}} \right)^2}\\ &= \sqrt{\left( 2176 - 2032 \right)^2 + \left( 1468 - 1406 \right)^2 + \left(1028 - 969 \right)^2 + \left( 3090 - 3078 \right)^2}\\ &= 167.9 \end{align*}
Pour trouver ensuite l’EMAD de cet ensemble de données, le calcul de la distance euclidienne devrait d’abord être répété pour tous les autres pas de temps (non fournis dans les données d’exemple).
Exemple : calcul de la distance cosinus
En utilisant les données multispectrales d’exemple du tableau A.1, nous pouvons calculer manuellement la valeur de la distance cosinus pour le pas de temps \(t\).
\begin{align*} &\text{Cosine distance} \\ &= 1 - \left( \frac{\left( x_{\text{band 1}}^{(t)} \right) \left(m_{\text{band 1}} \right) + \left( x_{\text{band 2}}^{(t)} \right) \left(m_{\text{band 2}} \right) + \cdots + \left( x_{\text{band p}}^{(t)} \right) \left(m_{\text{band p}} \right)}{ \left(\sqrt{\left( x_{\text{band 1}}^{(t)} \right)^2 + \cdots+ \left( x_{\text{band p}}^{(t)} \right)^2} \right) \left( \sqrt{\left( m_{\text{band 1}} \right)^2 + \cdots+ \left( m_{\text{band p}} \right)^2 } \right)} \right) \\ &= 1 -\\ & \ \frac{\left( x_{\text{blue}}^{(t)} \right) \left(m_{\text{blue}} \right) + \left( x_{\text{green}}^{(t)} \right) \left(m_{\text{green}} \right) + \left( x_{\text{red}}^{(t)} \right) \left(m_{\text{red}} \right) + \left( x_{\text{nir1}}^{(t)} \right) \left(m_{\text{nir1}} \right)}{\sqrt{\left( x_{\text{blue}}^{(t)} \right)^2 + \left( x_{\text{green}}^{(t)} \right)^2 + \left( x_{\text{red}}^{(t)} \right)^2+ \left( x_{\text{nir1}}^{(t)} \right)^2}\sqrt{\left( m_{\text{blue}} \right)^2 + \left( m_{\text{green}} \right)^2 + \left( m_{\text{red}} \right)^2 + \left(m_{\text{nir1}}\right)^2 } }\\ &= 1 -\\ & \ \frac{\left( 1028 \right) \left(969 \right) + \left(1468 \right) \left(1406 \right) + \left(2176 \right) \left(2032\right) + \left( 3090 \right) \left(3078\right)}{\sqrt{\left( 1028 \right)^2 + \left( 1468\right)^2 + \left( 2176 \right)^2+ \left(3090\right)^2} \sqrt{\left( 969 \right)^2 + \left(1406 \right)^2 + \left( 2032\right)^2 + \left(3078 \right)^2 }}\\ &=0.0004176 \end{align*}
Exemple : calcul de la dissimilarité de Bray-Curtis
En utilisant les données multispectrales d’exemple du tableau A.1, nous pouvons calculer manuellement la valeur de la dissimilarité de Bray-Curtis pour le pas de temps \(t\).
\begin{align*} &\text{Bray-Curtis dissimilarity} \\ &= \frac{\left| x_{\text{band 1}}^{(t)} - m_{\text{band 1}}\right| + \left| x_{\text{band 2}}^{(t)} - m_{\text{band 2}} \right| + \dots + \left| x_{\text{band p}}^{(t)} - m_{\text{band p}} \right| }{ \left| x_{\text{band 1}}^{(t)} + m_{\text{band 1}} \right| + \left| x_{\text{band 2}}^{(t)} + m_{\text{band 2}} \right| + \dots + \left| x_{\text{band p}}^{(t)} + m_{\text{band p}} \right|} \\ &= \frac{\left| x_{\text{nir1}}^{(t)} - m_{\text{nir1}}\right| + \left| x_{\text{green}}^{(t)} - m_{\text{green}} \right| + \left| x_{\text{red}}^{(t)} - m_{\text{red}} \right| + \left| x_{\text{blue}}^{(t)} - m_{\text{blue}} \right|}{\left| x_{\text{nir1}}^{(t)} + m_{\text{nir1}}\right| + \left| x_{\text{green}}^{(t)} + m_{\text{green}} \right| + \left| x_{\text{red}}^{(t)} + m_{\text{red}} \right| + \left| x_{\text{blue}}^{(t)} + m_{\text{blue}} \right|} \\ &= \frac{\left| 3090 - 3078\right| + \left| 1468 - 1406 \right| + \left|2176 - 2032 \right| + \left| 1028 - 969 \right|}{\left| 3090 + 3078\right| + \left| 1468 + 1406 \right| + \left|2176 + 2032 \right| + \left| 1028 + 969 \right|}\\ &= 0.01817 \end{align*}