Krigování

Doc. Dr. Vladimír Homola, Ph.D.

Definice problému

Jednou z často používaných metod pro získávání lokálních a globálních odhadů sledovaných veličin je krigování.

 

 

Problém jest následující: na jisté zájmové ploše (v terénu) mějme - obecně velmi nepravidelně - rozmístěno několik lokalit, ve kterých jsou známy (např. po analýze odebraného vzorku) hodnoty veličiny, kterou sledujeme - viz obr. 1. Úkolem je poskytnout co nejlepší odhad hodnoty sledované veličiny v libovolném místě zájmové plochy, a to na základě oněch několika známých hodnot.

Tato základní formulace úlohy definuje tzv. bodové krigování. Výchozím elementem je zde bod v terénu a známá hodnota sledované veličiny v něm.

Shora formulovaná úloha je v praxi asi nejčastěji řešená. Jde o trojrozměrnou úlohu: dva rozměry (určované většinou souřadnicemi x a y) tvoří zájmová plocha - terén, třetím rozměrem je sledovaná veličina. V geo- praxi je úloha často chápána čtyřrozměrně: známé body leží ne v rovině, ale v prostoru - v horninném bloku, geologickém tělese ap. Poloha bodu je dána souřadnicemi x a y udávajícími průmět bodu na zemský povrch, a souřadnicí z udávající např. hloubku, nadmořskou (podmořskou) výšku ap. Hodnoty sledované veličiny jsou pak čtvrtým rozměrem.

 

 

V obou případech je možno formulaci úlohy rozšířit na tzv. blokové krigování. Známé hodnoty jsou vázány ne na body, ale jsou získávány ze vzorků určité plochy s nebo určitého objemu v. Cílem krigování je v tomto případě získat nejlepší odhad sledované veličiny v jiné ploše s (objemu v) dané polohy na základě těchto známých hodnot.

Další výklad se bude pro názornost opírat o bodové krigování a trojrozměrný model. Bude tedy řešit problém naznačený na předchozím obrázku.

Bodové krigování

Krigování je jednou z metod, kterou by bylo možno označit jako "příspěvková". Hodnotu sledované veličiny v místě X si lze představit jako souhrn příspěvků z jednotlivých známých míst do X. Jednotlivé příspěvky jsou závislé především na jednotlivých známých hodnotách, a dále na vzdálenostech vzájemných i od bodu X, na struktuře sledované veličiny na celé ploše a dalších okolnostech.

Krigování proto stanoví odhad v místě X jako součet vážených známých hodnot

                                   (1)

kde na váhy mi je kladena podmínka normalizace

                                      (2)

Odhad stanovený vztahem (1) se ovšem obecně liší od skutečné (nezměřené, nám neznámé) hodnoty sledované veličiny. Rozdíl mezi těmito dvěmi hodnotami je nazýván chybou odhadu. Existuje jediná n-tice koeficientů mi taková, že chyba odhadu je právě pro tuto n-tici minimální. Určení těchto koeficientů je založeno na minimalizaci rozptylu odhadů s2:

             (3)

v místě X, přičemž Ki,j jsou kovariance mezi i-tým a j-tým známým bodem vázané se semivariancemi vztahem

                             (4)

a hodnoty KX,X resp. KX,i jsou vypočítávány dle (4) z hodnot semivariancí aproximovaných pro vzdálenosti hX,X resp. hX,i.

Minimalizace s2 vede k soustavě (n+1) lineárních rovnic

(5)

o n neznámých mi a další jedné neznámé l (tzv. Lagrangeův multiplikátor). Předchozí soustavu lze zapsat v maticovém tvaru jako

                                  (6)

z čehož plyne řešení pro neznámou matici (pro úsporu místa zapsáno "vodorovně") M = [m 1, m2, ... , mn, l]

                                 (7)

Nejlepší odhad v bodě X je pak dán vztahem (1) a variance tohoto odhadu vztahem

                            (8)

Příklad

Popsaný postup bude demonstrován na následující modelové situaci (převzato z Freek D. van der Meer: Introduction to Geostatistics, ITC 1992): mějme ve třech bodech terénu, v němž je zavedena lokální soustava souřadná v [km], měřenou úroveň hladiny vody v [m] podle následujícího obrázku. Spočtěme odhad hladiny vody v bodě X.

 

 

Hledaný odhad je dán vztahem (1). Jest tedy určit koeficienty m1, m2, m3. Tyto koeficienty jsou výsledkem řešení soustavy lineárních rovnic (5).

Jako prvky rozšířené matice soustavy (5) vystupují hodnoty semivariance. Protože jde o aproximované hodnoty, je prvním úkolem stanovení modelu (=teoretického semivariogramu), který odečtení semivariancí pro dané vzdálenosti umožní.

Otázce stanovení teoretických semivariogramů na základě experimentálních semivariancí je věnována samostatná kapitola (viz). Na tomto místě přijmeme za model lineární semivariogram bez zbytkového rozptylu se směrnicí přímky rovné 4.0 m2/km. Platí tedy

Pro zjištění prvků rozšířené matice soustavy je tedy zapotřebí

Hodnoty zjištěné v těchto třech krocích jsou následující:

 

Bod Souřadnice X Souřadnice Y Hladina vody  
1 3.0 4.0 120  
2 6.3 3.4 103  
3 2.0 1.3 142  
X 3.0 3.0

???

 
  
z - do [km] 1 2 3 X
1 0.000 3.354 2.879 1.000
2   0.000 4.785 3.324
3     0.000 1.972
X  

 

 

0.000
  
Semivariance 1 2 3 X
1 0.000 13.416 11.517 4.000
2   0.000 19.142 13.297
3     0.000 7.889
X  

 

 

0.000

 

Řešíme tedy soustavu

 

 

Řešením je čtveřice [m1, m2, m3, l] = [0.5954, 0.0975, 0.3071, -0.7298]. Odhad hladiny vody v bodě X je tedy s ohledem na (1)

ZX = 0.5954 x 120 + 0.0975 x 103 + 0.3071 x 142 = 125.1 [m]

s variancí chyby odhadu s ohledem na (8)

s2 = 0.5954 x 4 + 0.0975 x 13.416 + 0.3071 x 7.889 - 0.7298 x 1 = 5.3826 [m2]

 

 

Rev 10 / 2002