On a vu précédemment que le cokrigeage nécessite la connaissance des covariances , , et $\mathrm{Cov}(Y_i, Z_j). Les deux premières sont appelées covariances directes, car elles concernent la même variable, tandis que les dernières sont des covariances croisées, puisqu’elles mettent en relation les deux variables simultanément (on croise les données).
La covariance croisée joue un rôle essentiel : elle permet de transférer l’information d’une variable à l’autre lorsqu’elles sont corrélées spatialement. Autrement dit, même si la variable principale est peu échantillonnée, les observations de la variable secondaire peuvent contribuer à améliorer l’estimation de grâce à la relation statistique entre les deux variables.
Comme dans le cas univariable, on utilise généralement des modèles de covariance connus et admissibles pour modéliser les covariances directes. En revanche, la covariance croisée présente certaines particularités : 1) les coefficients d’effet de pépite et les paliers peuvent être négatifs, notamment lorsqu’il existe une corrélation négative entre les variables et , et 2) Il n’est pas toujours vrai que les fonctions de covariance croisées soient symétriques ; autrement dit, n’est pas nécessairement égal à . Les covariances croisées peuvent être asymétriques. Ainsi, le comportement statistique entre la variable principale et la variable secondaire peut s’avérer relativement complexe.
Ainsi, la vérification de l’admissibilité d’un modèle multivariable (c’est-à-dire l’ensemble des covariances directes et croisées) est plus délicate que dans le cas univariable. En principe, il faut : 1) calculer les transformées de Fourier (analytiques) de chaque modèle de covariance ; 2) former, pour chaque fréquence, la matrice de densité spectrale associée ; 3) vérifier que cette matrice est positive semi-définie pour toutes les fréquences. Un processus… disons, mathématiquement exigeant.
Heureusement, il existe des cas particuliers où l’admissibilité est plus facile à garantir. Nous en étudierons trois exemples dans la suite.
Cas où la vérification est plus aisée¶
1. Relations déterministes entre et ¶
S’il est possible de lier mathématiquement la variable secondaire à la variable principale , il est possible de déduire, à partir de la covariance , les covariances croisées et .
Par exemple, si est la dérivée de , alors il existe une relation directe entre les covariances simples et croisées des deux variables, ce qui garantit l’admissibilité. Il suffit d’avoir un modèle admissible pour la variable , et les covariances directs et croisées déduites à partir de ce modèle seront elles-mêmes admissibles.
Plus généralement, si l’on considère une transformation linéaire appliquée à (par exemple une dérivée, une intégrale ou une combinaison linéaire), alors :
Exemple 1D — est la dérivée de ¶
On suppose que la variable secondaire correspond à la dérivée spatiale de la variable principale :
Dans ce cas, les covariances croisées et directes peuvent être dérivées analytiquement à partir de la covariance de :
2. Covariances proportionnelles¶
Dans ce cas, toutes les fonctions de covariance (simples et croisées) sont proportionnelles à une même fonction de base , à des constantes multiplicatives près. La matrice de covariance s’écrit alors :
où est une matrice symétrique et positive semi-définie (c’est-à-dire que son déterminant est nul ou positif).
Dans ce modèle, si les deux variables et sont observées aux mêmes emplacements (ou si est observée sur un sous-ensemble des points de ), alors le cokrigeage revient exactement à un krigeage classique, et n’apporte donc aucun gain.
En revanche, si est disponible à des emplacements différents de , et qu’il existe une corrélation suffisamment forte entre les deux variables, le cokrigeage peut améliorer significativement les estimations de .
Remarque :
Le modèle proportionnel est unique en ce qu’il maintient une corrélation constante entre et , quelle que soit l’échelle spatiale (ou le support de mesure).
C’est aussi le seul cadre où une décomposition en composantes principales produit des facteurs orthogonaux pour toutes les distances — autrement dit, la covariance croisée entre les facteurs est nulle partout dans l’espace.
3. Modèle linéaire de corégionalisation (MLC)¶
Il s’agit du modèle multivariable le plus utilisé en géostatistique. Le principe est de représenter toutes les fonctions de covariance (simples et croisées) comme une combinaison linéaire de structures élémentaires partagées :
où :
Chaque est une fonction de covariance admissible (ex. : sphérique, exponentielle, gaussienne, etc.) de palier unitaire ;
Chaque est une matrice de coefficients symétrique et positive semi-définie représentant les paliers des modèles directs et croisés de la composante .
Ces matrices représentent la matrice de corrélation inter-variables pour chaque structure élémentaire .
Si l’une des matrices n’est pas positive semi-définie, alors le modèle n’est pas un modèle linéaire de corégionalisation valide, et il faut procéder à une vérification spectrale (par exemple via la densité spectrale) pour s’assurer de son admissibilité. Si la matrice associée à la l’effet de pépite n’est pas positive semi-définie, alors nous somme certains que le modèle n’est pas admissible.
Remarque :
Le MLC offre une grande flexibilité : plusieurs structures peuvent modéliser différents effets (pépite, structures à courte et à longue portée, etc.), chacune avec des relations directes et croisées spécifiques.
Exemple¶
On considère deux variables et .
présente un effet de pépite de 1 et une covariance sphérique de portée de 30 m, avec un palier 2.
présente un effet de pépite de 1 et une covariance sphérique de portée de 30 m, avec un palier 4.
La covariance entre et est symétrique, avec effet de pépite nul et covariance sphérique de portée 30 m et de palier 2.4.
On peut écrire :
où si et 0 sinon (effet de pépite).
La forme du modèle est celle d’un modèle linéaire de corégionalisation.
Le déterminant de la première matrice est 1, celui de la seconde est 2.24. Donc, le modèle est admissible.
Exemple de calcul avec le MLC¶
Supposons que l’on cherche à évaluer .
Avec le modèle ci-haut, on obtient :
Note : ce modèle procure une corrélation à la distance 0 de :
qui est faible.
Toutefois, si on interprète l’effet de pépite comme un bruit blanc, la corrélation entre les variables non bruitées serait :
beaucoup plus élevée.
Exemple de cokrigeage¶
Supposons les observations suivantes :
et en ,
en ,
en .
On compare l’estimation de (au point ) par krigeage simple et par cokrigeage simple. On suppose que les deux variables ont une moyenne nulle.
Configuration :
x: 0 5 10 Z1, Y1 Y0 Z2 Z0 ?
Exemple de krigeage simple et cokrigeage simple¶
Par krigeage simple¶
Le système s’écrit :
et l’application numérique donne les valeurs suivantes :
La résolution du système donne :
Par cokrigeage simple¶
On forme la matrice croisée et les poids correspondants, par exemple :
Il est désormais important de lire attentivement la matrice de corégionalisation linéaire pour effectuer les calculs. Il faut sélectioner adéquation les paliers respectant les paires de point en jeu. Une fois réaliser, on obtient la matrice complète suivante :
La résolution du système de cokrigeage simple donne :
Notons que 1) la variable secondaire a reçu un poids important, car la propriété de l’effet d’écran du krigeage s’applique aussi au cokrigeage, 2) la symétrie des poids des 2 observations en n’est pas préservée, car, à un de ces points, on connaît aussi la variable secondaire , et 3) la réduction de la variance d’estimation procurée par le cokrigeage est assez importante.
Si nous réalsons les calculs pour le krigeage ordinaire et le cokrigeage ordinaire nous aurions les résultat suivants :
Krigeage ordinaire:
Cokrigeage ordinaire:
Noter que la somme des poids de la variable principale donne 1, et celle de la variable secondaire donne 0, comme prévu. Cette dernière contrainte empêche ici le cokrigeage ordinaire d’améliorer substantiellement la prédiction du krigeage ordinaire comme l’indique les variance d’estimation.
Le variogramme croisé¶
Le variogramme croisé est une fonction de structure croisée utilisée lorsque les covariances sont symétriques. Il est défini par :
Cette fonction est symétrique et ne peut être estimée que sur les points où les deux variables sont connues.
Malgré cette contrainte, le variogramme croisé présente deux avantages :
Il n’est pas nécessaire d’estimer les moyennes de et de .
Les modèles n’ont pas nécessairement de palier.
Dans la plupart des cas, il est toutefois préférable d’utiliser la covariance croisée, notamment pour les calculs de cokrigeage.
Une relation utile relie la covariance croisée et le variogramme croisé :
Si , on obtient alors la formule du variogramme univarié classique.
Exemple d’application (inspiré de Gloaguen, M.Sc.A., 2000)¶
Des forages dans un aquifère à nappe libre ont permis de déterminer le niveau du fond de l’aquifère en quatre points : , , et .
Un levé géoradar a également été réalisé sur une grille régulière de 10 m, couvrant la zone de 0 à 100 m en et .
Objectif : décrire la forme du fond de l’aquifère en combinant les deux sources d’information.
Un cokrigeage ordinaire est effectué en utilisant :
Les 4 forages (valeur observée : -1)
Les 121 points radar (valeurs observées : -0.5 ou -3.5 ; cette dernière correspondant au fond d’un chenal)
On note un décalage entre les données radar et forage (−0.5 vs −1).
Un modèle linéaire de corégionalisation est utilisé avec :
Une composante sphérique de portée 100 m
Une corrélation inter-variété de 0.9
Résultat : Les estimations aux points radar prennent deux valeurs : -1.11 et -3.8, correspondant respectivement aux zones en dehors et dans le chenal.
Ainsi, le cokrigeage a corrigé le biais systématique des données radar, tout en récupérant la géométrie du chenal.
La matrice de coefficients utilisée était :
Remarque : Si l’on avait utilisé uniquement les 4 forages pour un krigeage ordinaire, la surface estimée aurait été plane, égale à la moyenne, et la structure du chenal aurait été perdue.