Quand on dispose de nombreuses observations et que l’on souhaite estimer une moyenne sur un grand volume, le calcul direct de la variance d’estimation peut devenir lourd. Une approche simplifiée consiste à utiliser le principe de combinaison des erreurs élémentaires, qui décompose l’estimation globale en une série d’estimations locales approximativement indépendantes.
i. Grille régulière¶
Pour une grille régulière, l’estimé global est simplement :
Chaque point est supposé représenter un bloc de taille égale. Si la variance d’erreur pour chaque bloc est , la variance d’estimation globale est :
Les erreurs sont approximativement indépendantes, car chaque bloc est estimé avec un seul point.
ii. Échantillonnage aléatoire uniforme (stratifié)¶
Chaque point représente un bloc positionné aléatoirement dans le domaine. Pour un bloc , la variance d’estimation est :
Donc la variance d’estimation globale est encore :
iii. Échantillonnage quelconque¶
Supposons que nous somme en mesure de calculer la variance d’estimation sur un sous domaine . Ainsi, pour l’ensemble du domaine , l’estimé est obtenu en combinant, selon des poids proportionnels aux volumes des sous-domaines, les différents estimés obtenus. On aura donc :
et la variance d’estimation sera, puisque chaque erreur est considérée indépendante :
où les variances d’estimation élémentaires sont celles correspondant aux différents sous-domaines que l’on a pu reconnaître.
Remarques¶
L’estimateur particulier utilisé pour obtenir l’estimé pour la moyenne du champ n’intervient pas dans le calcul de la variance d’estimation globale par la méthode des erreurs élémentaires. L’estimation aurait pu être obtenu par krigeage, par inverse de la distance, par méthode polygonale, etc.. La raison de cette apparente anomalie est que les estimés globaux obtenus par ces méthodes sont très similaires. Ils consistent plus ou moins en une moyenne, pondérée par la zone d’influence de chaque observation, des valeurs observées. Puisque les estimations sont similaires, il n’est pas surprenant qu’elles aient toutes à peu près la même précision. Ce raisonnement n’est pas vrai si l’on cherche à prédire les variances d’estimation pour une estimation locale, i.e. pour une petite portion du champ. Alors, la technique d’estimation utilisée a une forte influence sur la précision obtenue
Si l’on dispose d’un programme permettant d’effectuer le krigeage et de calculer les variances de krigeage (variance d’estimation), alors on peut les combiner suivant le principe précédent, i.e. il suffit de segmenter le domaine en blocs et d’estimer chaque bloc en n’utilisant que les données qui s’y trouvent, puis de combiner les variances de krigeage en fonction de la taille des blocs comme l’indique la formule précédente. Il est important de ne pas avoir des données communes pour l’estimation de deux blocs car alors les erreurs d’estimation ne pourraient plus être considérées comme indépendantes.
Exemple¶
Une zone a été estimée directement par krigeage (variance d’estimation 0.36) puis par combinaison de 4 parcelles selon 2 scénarios différents (Fig. 1). Pour l’estimation de chaque parcelle, on n’utilise que les points s’y retrouvant. On calcule les variances d’estimation pour chaque parcelle et on combine le tout suivant le carré des surfaces de chaque parcelle. Les résultats obtenus par subdivision, dans les deux cas, sont quasi-identiques au résultat direct.
Figure 1:Illustration des paramètres du variogramme - effet de pépite, palier et portée.