Skip to article frontmatterSkip to article content

L’idée de base du krigeage d’indicatrices (KI) repose sur le fait que le krigeage est un bon estimateur de l’espérance conditionnelle d’une variable aléatoire (v.a.). On rappelle que le krigeage ordinaire est presque sans biais conditionnel dans le cas normal et que le krigeage simple est sans biais conditionnel.

Si l’on considère un seuil donné, disons cc, on peut coder, par rapport à ce seuil, la v.a. Z(x)Z(x) en une variable indicatrice I(x,c)I(x,c) prenant la valeur 0 ou 1 :

I(x,c)={1si Z(x)c,0si Z(x)>c.I(x,c) = \begin{cases} 1 & \text{si } Z(x) \leq c, \\ 0 & \text{si } Z(x) > c. \end{cases}

Considérons l’espérance de I(x,c)I(x,c). Par définition, on a :

E[I(x,c)]=P(Z(x)c)=FZ(x)(c),\mathbb{E}[I(x,c)] = P(Z(x) \leq c) = F_{Z(x)}(c),

FZ(x)(c)F_{Z(x)}(c) est la fonction de distribution de ZZ à la localisation xx pour le seuil cc.

Le problème consiste donc à estimer I(x,c)I(x,c) en se servant de l’information disponible, c’est-à-dire les observations Z(xi)Z(x_i) en nn points.

La méthode s’effectue ainsi :

  1. On code les valeurs observées Z(xi)Z(x_i) par rapport au seuil cc. On obtient ainsi de nouvelles variables indicatrices I(xi,c)I(x_i, c), valant 0 ou 1 selon la position relative à cc.
  2. On effectue le krigeage, en un point x0x_0, de I(x0,c)I(x_0, c) à partir des I(xi,c)I(x_i, c) connus. Comme le krigeage approxime l’espérance conditionnelle, la valeur krigée peut être interprétée comme une estimation de
    P(Z(x0)cZ(x1),,Z(xn))I^(x0,c).P(Z(x_0) \leq c \mid Z(x_1), \ldots, Z(x_n)) \approx \hat{I}(x_0, c).

    Avant cela, il faut calculer et modéliser le variogramme des indicatrices I(xi,c)I(x_i,c) pour pouvoir effectuer le krigeage.
  3. On répète le processus pour différents seuils c2,c3,c_2, c_3, \ldots. Pour chaque seuil, on code les valeurs originales, calcule et modélise le variogramme (différent selon le seuil), puis effectue un nouveau krigeage.

En combinant les résultats des krigeages pour ces différents seuils, on obtient une version discrétisée de la fonction de distribution conditionnelle

FZ(x0,zZ1,,Zn),F^*_Z(x_0, z \mid Z_1, \ldots, Z_n),

que l’on note dorénavant FKI(x0,z)F_{KI}(x_0, z).
Cette fonction permet ensuite de calculer diverses quantités utiles : probabilités, quantiles, médiane, fonction de coût, etc., toutes dérivables d’une fonction de distribution.


Notes importantes :


Malgré ses défauts, le krigeage d’indicatrices est une méthode répandue, en raison de sa simplicité mathématique et de sa facilité de mise en œuvre (un programme de krigeage ordinaire suffit). Sa robustesse face aux valeurs extrêmes (pour certaines tâches) et sa capacité à intégrer des données incertaines (“soft kriging”) ont aussi contribué à sa popularité. Le KI est particulièrement utile lorsque le changement de support n’intervient pas.