Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

L’idée de base du krigeage d’indicatrices (KI) repose sur le fait que le krigeage est un bon estimateur de l’espérance conditionnelle d’une variable aléatoire (v.a.). On rappelle que le krigeage ordinaire est presque sans biais conditionnel dans le cas normal et que le krigeage simple est sans biais conditionnel.

Si l’on considère un seuil donné, disons cc, on peut coder, par rapport à ce seuil, la v.a. Z(x)Z(x) en une variable indicatrice I(x,c)I(x,c) prenant la valeur 0 ou 1 :

I(x,c)={1si Z(x)c,0si Z(x)>c.I(x,c) = \begin{cases} 1 & \text{si } Z(x) \leq c, \\ 0 & \text{si } Z(x) > c. \end{cases}

Considérons l’espérance de cette indicatrice, I(x,c)I(x,c). Par définition, on a :

E[I(x,c)]=P(Z(x)c)=FZ(x)(c),\mathbb{E}[I(x,c)] = P(Z(x) \leq c) = F_{Z(x)}(c),

FZ(x)(c)F_{Z(x)}(c) est la fonction de répartition de ZZ à la localisation xx pour le seuil cc.

Le problème consiste donc à estimer I(x,c)I(x,c) à partir de l’information disponible, c’est-à-dire les observations Z(xi)Z(x_i) à nn points.

La méthode s’effectue ainsi :

  1. Codage des observations. Pour un seuil donné cc, on transforme les valeurs observées Z(xi)Z(x_i) en variables indicatrices I(xi,c)I(x_i, c), qui prennent la valeur 0 ou 1 selon que Z(xi)Z(x_i) est inférieur ou supérieur au seuil.

  2. Krigage des indicatrices. On effectue ensuite, au point x0x_0, le krigeage de I(x0,c)I(x_0, c) à partir des indicatrices observées I(xi,c)I(x_i, c). Comme le krigeage fournit une approximation de l’espérance conditionnelle, la valeur obtenue peut s’interpréter comme une estimation de P(Z(x0)cZ(x1),,Z(xn))I^(x0,c)P(Z(x_0) \leq c \mid Z(x_1), \ldots, Z(x_n)) \approx \hat{I}(x_0, c). Cette étape nécessite de calculer et de modéliser au préalable le variogramme des indicatrices I(xi,c)I(x_i, c), qui dépend du seuil considéré.

  3. Répétition pour plusieurs seuils. Le procédé est répété pour une série de seuils c2,c3,c_2, c_3, \ldots. Pour chaque seuil, on recode les observations, on calcule et on modélise le variogramme spécifique, puis on réalise un nouveau krigeage, ce qui permet de reconstruire progressivement la distribution locale de Z(x0)Z(x_0).

En combinant les résultats des krigeages réalisés pour les différents seuils, on reconstruit une version discrétisée de la fonction de répartition conditionnelle FZ(x0,zZ1,,Zn)F^*_Z(x_0, z \mid Z_1, \ldots, Z_n) que nous noterons désormais par FKI(x0,z)F_{KI}(x_0, z). Cette fonction représente une approximation complète de la distribution locale conditionnelle de Z(x0)Z(x_0) et permet d’en déduire directement l’estimée conditionnelle (par intégration), la variance conditionnelle, ainsi qu’un large éventail de quantités dérivées — probabilités de dépassement, quantiles, médiane, fonctions de coût, etc. — c’est-à-dire toutes les statistiques qui s’obtiennent à partir d’une fonction de répartition.


Notes importantes :


Malgré ses défauts, le krigeage d’indicatrices s’est imposé comme une méthode d’estimation répandue. La simplicité mathématique et la facilité de sa mise en oeuvre (un programme de krigeage ordinaire suffit) justifie sa popularité auprès des utilisateurs. Sa robustesse face aux valeurs extrêmes, pour certaines applications, ainsi que sa capacité à intégrer des données incertaines (“soft kriging”) ont également contribué à sa popularité. Le KI est particulièrement pertinent dans les situations où le changement de support n’intervient pas ou demeure limité.