Skip to article frontmatterSkip to article content
Site not loading correctly?

This may be due to an incorrect BASE_URL configuration. See the MyST Documentation for reference.

On considère quatre valeurs observées Z1,,Z4Z_1,\ldots,Z_4 aux positions x1,,x4x_1,\ldots,x_4, formant un rectangle. On souhaite effectuer un krigeage d’indicatrices (KI) au point x0x_0, situé au centre de ce rectangle :

Z1=2.2Z_1=2.2Z2=5.1Z_2=5.1
x0x_0
Z3=6.4Z_3=6.4Z4=4.7Z_4=4.7

On choisit les seuils c=1,2,3,4,5,6,7c = 1, 2, 3, 4, 5, 6, 7.

Par symétrie, le krigeage ordinaire fournit les poids :

λi,c=14,i,c.\lambda_{i,c} = \frac{1}{4}, \quad \forall i, \forall c.

Pour chaque seuil cc, les indicatrices sont définies par :

I(xi,c)={1,Z(xi)c,0,Z(xi)>c.I(x_i,c) = \begin{cases} 1, & Z(x_i) \le c, \\ 0, & Z(x_i) > c. \end{cases}

Le krigeage d’indicatrices donne :

I(x0,c)=i=14λi,cI(xi,c).I^*(x_0,c) = \sum_{i=1}^4 \lambda_{i,c} \, I(x_i,c).

La table suivante résume les valeurs obtenues :

ccI(x1,c)I(x_1,c)I(x2,c)I(x_2,c)I(x3,c)I(x_3,c)I(x4,c)I(x_4,c)I(x0,c)I^*(x_0,c)
100000
200000
310001/4
410001/4
510011/2
611013/4
711111

Cette table constitue une approximation discrète de la fonction de répartition conditionnelle :

FKI(x0,c)P(Z(x0)c).F_{KI}(x_0,c) \approx P(Z(x_0) \le c).

La Fig. 1 présente le tableau sous forme de graphique. On y observe la fonction de répartition discrète ainsi estimée. À partir de ce graphique, il est ensuite possible de calculer plusieurs grandeurs, comme illustré ci-dessous.

Fonction de répartition estimée au point x_0.

Figure 1:Fonction de répartition estimée au point x0x_0.


1. Quelle est la probabilité qu’au point x0x_0 la valeur ZZ soit supérieure à 3.5, à 4.3?

Formule générale :

P(Z0>c)=1FKI(x0,c).P(Z_0 > c) = 1 - F_{KI}(x_0,c).

Pour c=3.5c = 3.5

FKI(x0,3)=0.25,FKI(x0,4)=0.25,F_{KI}(x_0,3) = 0.25, \quad F_{KI}(x_0,4) = 0.25,
P(Z0>3.5)=10.25=0.75.P(Z_0 > 3.5) = 1 - 0.25 = 0.75.

Pour c=4.3c = 4.3

Interpolation linéaire entre 4 et 5 :

FKI(x0,4.3)=FKI(x0,4)+4.3454(FKI(x0,5)FKI(x0,4))F_{KI}(x_0,4.3) = F_{KI}(x_0,4) + \frac{4.3 - 4}{5 - 4} \left( F_{KI}(x_0,5) - F_{KI}(x_0,4) \right)
=0.25+0.3(0.500.25)=0.25+0.075=0.325.= 0.25 + 0.3(0.50 - 0.25) = 0.25 + 0.075 = 0.325.

Donc :

P(Z0>4.3)=10.325=0.675.P(Z_0 > 4.3) = 1 - 0.325 = 0.675.

2. Quelle est la médiane de la distribution au point x0x_0 ? Quelle est la valeur correspondant au 65ᵉ percentile ?

La médiane mm satisfait :

FKI(x0,m)=0.5.F_{KI}(x_0,m) = 0.5.

Comme FKI(x0,5)=0.5F_{KI}(x_0,5)=0.5 :

meˊdiane=5.\text{médiane} = 5.

Pour le 65e percentile, on cherche zz tel que :

FKI(x0,z)=0.65.F_{KI}(x_0,z) = 0.65.

On constate que cela se produit entre les seuils 5 et 6. Ainsi, on doit faire l’interpolation linéaire pour retrouver le seuil correspondant au 65ᵉ percentile :

z=5+0.650.500.750.50(65)=5.6.z = 5 + \frac{0.65 - 0.50}{0.75 - 0.50} (6 - 5) = 5.6.

.


3. Quelle est l’espérance mathématique de ZZ au point x0x_0 ?

Le KI fournit une distribution discrète sous la forme d’une probabilité d’appartenance aux classes définies par des seuils. Pour obtenir l’espérance mathématique, on associe à chaque classe une valeur représentative. Celle-ci peut provenir de l’histogramme global (moyenne des observations dans chaque intervalle) ou, plus simplement, être prise comme le milieu de la classe.

L’espérance estimée s’écrit alors :

EKI[Z0]=k=17pkmk.\mathbb{E}_{KI}[Z_0] = \sum_{k=1}^{7} p_k\, m_k.

En utilisant les milieux de classes mkm_k et les probabilités pkp_k issues du KI, on obtient l’espérance conditionnelle au point x0x_0 par :

EKI[Z0]=00.5+01.5+0.252.5+03.5+0.254.5+0.255.5+0.256.5=4.75.\mathbb{E}_{KI}[Z_0] = 0\cdot 0.5 + 0\cdot 1.5 + 0.25\cdot 2.5 + 0\cdot 3.5 + 0.25\cdot 4.5 + 0.25\cdot 5.5 + 0.25\cdot 6.5 = 4.75.

Notes :


4. Quelle est la variance conditionnelle de ZZ au point x0x_0 ?

La variance conditionnelle peut être calculée directement à partir de la fonction de répartition discrète estimée par le KI.
On utilise la formule classique :

VarKI[Z0]=E[Z02](E[Z0])2.\mathrm{Var}_{KI}[Z_0] = \mathbb{E}[Z_0^2] - \left( \mathbb{E}[Z_0] \right)^2.

Pour cela, il faut d’abord calculer l’espérance du carré :

EKI[Z02]=k=17pkmk2.\mathbb{E}_{KI}[Z_0^2] = \sum_{k=1}^{7} p_k\, m_k^2.

Les milieux de classes et probabilités non nulles sont :

Intervallemkm_kpkp_k
[3,4)2.50.25
[4,5)4.50.25
[5,6)5.50.25
[6,7)6.50.25

On calcule donc :

EKI[Z02]=0.25(2.52)+0.25(4.52)+0.25(5.52)+0.25(6.52).=24.75.\mathbb{E}_{KI}[Z_0^2] = 0.25(2.5^2) + 0.25(4.5^2) + 0.25(5.5^2) + 0.25(6.5^2). = 24.75.

L’espérance déjà obtenue est :

EKI[Z0]=4.75.\mathbb{E}_{KI}[Z_0] = 4.75.

Ainsi, la variance conditionnelle estimée est :

VarKI[Z0]=24.75(4.75)2.=24.7522.5625=2.1875.\mathrm{Var}_{KI}[Z_0] = 24.75 - (4.75)^2. = 24.75 - 22.5625 = 2.1875.

5. Quelle est l’espérance associée à un coût C(Z)C(Z) ?

Supposons que l’on connaisse une fonction de coût associée aux valeurs de Z(x)Z(x) (par exemple un coût de décontamination qui augmente en fonction du niveau de contamination). On aimerait connaitre la valeur de ce coût. Supposon que C(Z)=Z2C(Z) = Z^2, alors on a :

E[C(Z0)]=i=0nc[I(x0,zi)I(x0,zi1)]C(zi),\mathbb{E}[C(Z_0)] = \sum_{i=0}^{n_c} \left[ I^*(x_0, z_i) - I^*(x_0, z_{i-1}) \right] C(z_i),

ncn_c est le nombre de seuils considérés, I(x0,zi)I^*(x_0,z_i) la valeur krigée pour le seuil ziz_i (avec I(x0,z0)=0I^*(x_0,z_0)=0 et I(x0,znc+1)=1I^*(x_0,z_{n_c+1})=1), et ziz_i une valeur représentative de la classe ii (centre de la classe ou moyenne de l’histogramme global).

Ici, avec I(x,c)=14I^*(x,c) = \frac{1}{4} pour 2<z<32 < z < 3 et 4<z<74 < z < 7, 0 ailleurs, l’espérance du coût est donc :

14×(2.52+4.52+5.52+6.52)=24.8.\frac{1}{4} \times (2.5^2 + 4.5^2 + 5.5^2 + 6.5^2) = 24.8.

Krigeage simple d’indicatrice

La formulation simple du krigeage d’indicatrice est la suivante :

I(x,c)=i=1nλiI(xi,c)+(1i=1nλi)FZ(c),I^*(x,c) = \sum_{i=1}^n \lambda_i I(x_i, c) + (1 - \sum_{i=1}^n \lambda_i) F_Z(c),

FZ(c)F_Z(c) est la proportion globale des données telles que ZcZ \le c. Les poids λi\lambda_i sont obtenus en résolvant le système de krigeage simple (KS) basé sur la covariance ou le variogramme des indicatrices pour le seuil considéré.

Le krigeage simple d’indicatrices est particulièrement intéressant lorsque la distribution globale est bien connue ou lorsque l’on dispose d’un grand volume de données fournissant une estimation fiable de FZ(c)F_Z(c). Dans ces situations, la moyenne globale des indicatrices constitue une information précieuse : elle représente la probabilité globale d’être sous le seuil cc et sert d’ancre probabiliste. Le krigeage simple permet d’intégrer cette information directement dans l’estimation locale, tout en pondérant correctement la contribution des données voisines via les poids issus du variogramme.

En comparaison avec le krigeage ordinaire d’indicatrices, le KSI offre une solution plus stable lorsque les données sont peu nombreuses ou très dispersées, car le terme (1λi)FZ(c)(1-\sum \lambda_i)F_Z(c) évite que l’estimation locale dérive en l’absence de support spatial suffisant. Autrement dit, si les données voisines sont rares, éloignées ou peu corrélées, l’estimation locale se rapproche naturellement de la distribution globale, ce qui est cohérent d’un point de vue probabiliste.

Lorsque le variogramme est un effet de pépite pur, les poids λi\lambda_i sont nuls et l’estimation se réduit à la distribution globale :

I(x,c)=FZ(c)I^*(x,c) = F_Z(c)

Cela signifie que l’espace n’apporte aucune information supplémentaire — seule la probabilité globale a du sens. À l’inverse, si le variogramme montre une forte continuité spatiale, les poids deviennent significatifs (typiquement λi0.25\lambda_i \approx 0.25 dans l’exemple ci-haut), et l’estimation locale s’appuie alors davantage sur les données voisines.