Semivariogramy

Metody uváděné v této kapitole lze použít pro zpracování dvourozměrného, trojrozměrného i čtyřrozměrného statistického souboru. Důležitým předpokladem je však to, že první statistická proměnná (resp. první dvě resp. první tři statistické proměnné) udávají lokalizaci místa na přímce (resp. v rovině resp. v prostoru), ke kterému je vázána hodnota poslední, závislé statistické proměnné.

Teoretický model semivariogramu používá při výpočtu jedna z metod odhadu veličin - krigování. Čím lépe bude model vystihovat charakter zpracovávaných dat, tím přesnější budou odhady krigováním. Metoda je široce uplatňována v řadě programových aplikací zabývajících se geostatistickým modelováním. Bohužel, uživatelé těchto programů před použitím krigování žádné předzpracování dat za účelem zjištění semivariancí neprovádí, což je zásadním nedostatkem při pozdější aplikaci výsledků.

Experimentální semivariogram

Semivariogram je základní geostatistický nástroj pro vizualizaci, modelování a využití prostorové autokorelace regionalizované proměnné. Jak vyplývá z názvu, semivariance je míra variance. To, jak se hodnoty proměnné z mění při přechodu od x k x+h (tj. při změně vzdálenosti o h) je možno vyjádřit vztahem

kde g(h) je semivariance proměnné z pro vzdálenost h. V tomto pojetí je hodnota semivariance závislá na hodnotě vzdálenosti h; je tedy funkcí h a jako s funkční závislostí s ní lze nakládat.

 Příklad: Zkoumejme obsah zinku ve vzorcích hornin, pocházejících z konkrétního průzkumného vrtu. V laboratoři byly zjištěny následující hodnoty vzorků různých hloubkových úrovní:

 

Tab.8.1: Obsah zinku v různých hloubkových úrovních

Vypočítejme semivariance pro různé vzdálenosti zadaných bodů podle vztahu (1).

Pozn.: Pokud jsou data (jako např. v tabulce) k disposici s pravidelnou vzdáleností (zde 1.52 m), je možno počítat semivarianci s pravidelným přírůstkem (1.52 m). Pokud však data takto pravidelně k disposici nejsou, zvolí se minimální krok m, který dělí množinu vzdáleností jednotlivých bodů na třídy tak, že v každé třídě je dostačující počet hodnot. Tak krok např. m=2 znamená, že všechna data se vzájemnou vzdáleností d např. 11 Ł d < 13 budou zahrnuty do výpočtu podle (1) pro h=12.

Základní schéma výpočtu pro vzdálenost h sestává z následujících kroků:

Po provedení uvedeného výpočtu pro všechny hodnoty h se získá řada hodnot nazývaných experimentální semivariance. Pro data z předchozí tabulky jsou hodnoty experimentální semivariance tyto:

 

Tab. 8.2: Experimentální semivariance pro obsah zinku

Graf hodnot experimentální semivariance se nazývá experimentální semivariogram. Pro hodnoty z předchozí tabulky ukazuje experimentální semivariogram následující graf:

 

Obr. 8.1: Experimentální semivariogram pro obsah zinku

Na křivce semivariogramu je zřetelný pokles na úrovni okolo 25 [m] a druhý na úrovni okolo 35 [m]. Na druhé straně jsou lokální extrémy na úrovních okolo 15 [m] resp. 30 [m]. To znamená, že je výrazně menší diference mezi daty vzdálenými 25 [m] než mezi daty vzdálenými 15 [m] nebo 35 [m]. Obrátíme-li se zpět na data v tabulce 1, zjistíme, že semivariogram popisuje maximy a minimy data regulérně: hodnoty okolo 47 metrů jsou výrazně "hodně rozházené" a vyšší než "okolí", stejně tak hodnoty okolo 81 metrů a konečně do třetice okolo 106 metrů. Vzdálenosti mezi těmito lokalitami jsou 34 resp. 35 metrů, což je v dobré shodě s grafem na předchozím obrázku.

Zvláštní případy

Ukažme chování experimentálních semivariogramů ve dvou zvláštních případech.

Mějme data popisující nějakou sledovanou veličinu vázanou na typ horniny. Mějme podloží tvořené dvěma horninovými bloky s oddělující plochou. Nechť data v hornině A mají výrazně odlišnou hodnotu než v hornině B. Stejně jako shora předpokládejme pro jednoduchost lineární strukturu tvořenou např. vrtem; hloubka, ze které byl odebrán vzorek, jest tedy hodnotou nezávisle proměnné.

Příklad: V průzkumném vrtu (viz shora) se do hloubky 30 [m] sledovala navíc pórovitost, přičemž blok A je tvořen písky a blok B jíly:

 

Obr. 8.2: Dva bloky různého charakteru

Hodnotou nezávisle proměnné x je hloubka, hodnotou závisle proměnné y je pórovitost. Hodnoty jsou pro jednoduchost znázorněny pouze graficky:

 

Obr. 8.3: Data dvou bloků

Data tedy mají jistou zhruba konstantní hodnotu pórovitosti až do hloubky, kde se písky a jíly stýkají. Od této hloubky pórovitost prakticky zcela vymizí.

 

Aplikujme nyní vztah (1). Nechť je h relativně malá vzdálenost. Pak v součtu (1) převažují členy s velmi blízkými hodnotami (a tedy xi - xj je velmi malé) až na případ, že xi bude v A a xj v B nebo naopak: zde bude xi - xj velké - avšak čím menší bude h, tím více bude malých Dij a méně velkých a tedy průměr bude spíše menší (opačně se zvětšujícím se h).

Jestliže ovšem h přesáhne velikost většího úseku, pak je zaručeno, že vždy patří jedna hodnota xi do A a druhá xj do B a proto všechny sčítance ve (1) budou mít maximální (a se zvětšujícím se h téměř konstantní) hodnotu; od této vzdálenosti se tedy dá očekávat konstantní hodnota semivariance.

Příklad: Skutečný semivariogram dat z předchozího obrázku je tento:

 

Obr. 8.4: Semivariogram dvou bloků

 

Na druhé straně mějme jiný geologický stav. Nechť je jednolitý horninový masiv A porušen velmi úzkou vrstvou B.

Příklad: Nechť stejně jako v předchozím případě jsou A písky, B jíly, sledované veličina nechť je opět pórovitost. Situaci naznačuje následující obrázek:

 

Obr. 8.5: Blok s vrstvou

Data odpovídající naznačenému případu jsou např. tato (uvádíme jen jejich grafické vyjádření):

 

Obr. 8.6: Data bloku s vrstvou

Aplikujme opět vztah (1). Vrstva je v hloubce 10  [m]. Ve vztahu (1) bude narůstat počet dvojic "přejíždějících" tenkou vrstvu a tedy bude narůstat i součet v (1) - a to až do vzájemné vzdálenosti 10 [m]. Pak dojde k prudkému poklesu, protože ubudou dvojice "přejíždějících" vrstvu "zprava" (na grafu 6). A počínaje vzájemnou vzdáleností 20 [m] už žádná dvojice nebude mít jeden z bodů ve vrstvě, oba budou mít přibližně stejnou hodnotu a proto součet v (1) bude minimální.

Příklad: Experimentální semivariogram odpovídající tomuto druhému druhu poruchy je pak následující:

 

Obr. 8.7: Semivariogram bloku s vrstvou

Teoretický semivariogram

Chování semivariogramu je možno - víceméně intuitivně a pro "rozumná" data - popsat takto:

  • velmi blízká data mají velmi malou odchylku

  • data ve větších vzdálenostech mají větší odchylky, avšak odchylky pro velmi vzdálená data a velmi velice vzdálená data se už zas tak moc neliší

  • od jisté vzdálenosti už vzájemné odchylky nerostou - např. proto, že vzdálenost překračuje rozměry zkoumané plochy nebo tělesa.

  • Takto se chová např. křivka na následujícím obrázku:

     

    Obr. 8.8: Teoretický semivariogram

    Křivku na předchozím grafu je možno analyticky vyjádřit vztahem

    Semivariogram % Zn na obr. 1 by celkem měl tendenci se ideálnímu semivariogramu na obr. 8 zhruba podobat, nebýt dvou lokálních minim. Obecně lze říci, že v praxi se mnoho dat chová právě takto: až na větší či menší odchylky celkem tvar funkce (2) sledují. Ovšem na druhé straně je stejně tak mnoho dat, které tento tvar vůbec nesledují. Funkční vztah - např. (2) - který pokud možno dobře sleduje (modeluje) experimentální semivariogram, se nazývá teoretický semivariogram.

    Proto je proces hledání teoretického semivariogramu pro daný experimentální semivariogram významnou praktickou úlohou. Tento proces je nazýván strukturní analýza. Model nalezený pro danou množinu dat závisí jak na experimentálních, tak teoretických předpokladech. Vlastnosti, které prakticky vedou k určení konkrétního teoretického modelu, jsou

    Dosah je mírou korelace uvnitř množiny dat; "dlouhý" dosah indikuje vysokou korelaci, "krátký" dosah korelaci nízkou. Hodnota prahu je rovna celkovému rozptylu.

    Velmi často nenabývají experimentální semivariogramy v počátku nulové hodnoty; protínají osu y v nenulové hodnotě, která je nazývána zbytkový rozptyl (nugget effect). To může ukazovat na rozptyl menší než je "vzorkovací" vzdálenost, nebo na malou přesnost měření, kdy např. jsou v datech obsaženy dva vzorky ze stejného místa, pokaždé s jinou hodnotou.

    V teorii i v praxi se ponejvíce užívá modelů experimentálních semivariogramů, popsaných následovně:

    - Sférický model je popsán výše uvedenou rovnicí (2):

    - Exponenciální model je dán vztahem

    - Gaussův model je popsán rovnicí

    Gaussův model stejně jako sférický vykazuje výrazný práh, ale v okolí počátku se chová parabolicky, jak to ukazuje následující obrázek.

    Obr. 8.9: Gaussův model semivariogramu

    Složené modely

    Bohužel, v praxi se však experimentální semivariogramy nechovají jako estetické hladké a plynulé křivky. I takové rozložení semivariancí jako na obr. 1 nebývá časté. Tento obrázek však demonstruje řešení jiného problému: při modelování jednou z funkcí (2) až (4) nedostaneme nikdy uspokojivý výsledek; buď je počáteční stoupání křivky málo strmé, nebo sice sleduje počáteční data, ale zase práh je příliš vysoko ap. Pro co nejvěrnější sledování experimentálních semivariancí je možno použít složené modely. Teoretický semivariogram z následujícího grafu vznikl složením

    pro h<14,

    pro h mezi 14 a 50, a konečně

    pro h>50.

    Obr. 8.10: Složený semivariogram

    Směrovost semivariancí

    V předchozích odstavcích byly experimentální semivariogramy konstruovány za předpokladu, že statistika byla závislá na vzdálenosti h a nezávislá na směrové orientaci vektorů daných jako spojnice dvojic bodů. Je však skutečností, že mnohé geologické fenomény nevykazují prostorovou isotropii rozptylu - naopak se chovají anisotropně; rozsah influence je různý v různých směrech.

    Pro data, vykazující anisotropii, se využívá postupu spočívajícího v konstrukci dílčích semivariogramů pro stanovené směrové tolerance. V nejjednodušším případě rozdělme všesměrové pole rovnoměrně např. na směry sever±22.5o, jih±22.5o, východ±22.5o, západ±22.5o, severovýchod±22.5o, jihovýchod±22.5o, jihozápad±22.5o, severozápad±22.5o a zkonstruujme osm dílčích směrových semivariogramů tak, že do každého z nich zahrneme pouze ty dvojice daných bodů, jejichž směrový vektor padne do intervalu směrů daného dílčího semivariogramu.

    Z charakteru úlohy je zřejmé, že jde o směrově symetrický problém (míra variance mezi body A a B je stejná jako mezi body B a A), stačí tedy konstruovat pouze polovinu počtu semivariogramů. Po zjištění jejich dosahů se tyto dosahy zanesou do růžicového diagramu obsahujícího ty směry, pro něž byly dílčí semivariogramy sestaveny. Anizotropická množina dat je charakterizována směrem maximální variance a směrem minimální variance. Tyto směry jsou směry hlavní a vedlejší poloosy tzv. elipsy anizotropie. Elipsa anizotropie je pak zjistitelná jako elipsa, která aproximuje dosahy vynesené do shora zmíněného růžicového diagramu.

    Praktický příklad uvažuje soubor odběrních míst podzemní vody v oblasti Nové Vsi a sleduje jejich analýzu na pH. Pro tato data bylo použito směrového rozdělení podle předchozích odstavců. Ze zkonstruovaných semivariogramů byly zjištěny následující hodnoty dosahů:

     

    Směr Dosah [m]
    Východ
    3154.230
    Severovýchod
    3518.480
    Sever
    5951.340
    Severozápad
    4492.220

    Tab. 8.3: Směrové dosahy

    Na následujícím obrázku je uvedena konstrukce elipsy anizotropie popsaného praktického příkladu. Na směry východ, severovýchod ... jsou vyneseny hodnoty dosahů. Následně je zkonstruována elipsa tyto body aproximující. Osy elipsy (čárkovaně) jsou osy anizotropie. Odečtem úhlů lze konstatovat, že maximální dosah odpovídá 105° (měřeno od východu proti směru hodinových ručiček) - něco méně než severo - severo - západ.

    Obr. 8.11: Elipsa anizotropie