Interpolace a extrapolace v rovině

Obecné úvahy

Mějme statistický soubor S s rozsahem n, přičemž každý prvek s Î S je roven uspořádané dvojici hodnot [x,y] dvou argumentů X, Y. Mluvíme pak o statistickém souboru se dvěma argumenty X, Y nebo také o dvourozměrném statistickém souboru s argumenty X a Y.

Takový statistický soubor bývá nejčastěji dán tabulkou mající dva sloupce X a Y, a n řádků (=jednotlivých dvojic). Lze jej samozřejmě zkoumat metodami jednorozměrných statistik, tj. samostatně “sloupec” X a samostatně “sloupec” Y. Dvourozměrné statistické soubory se však vytváří právě za účelem zkoumání X a Y “dohromady”: ví se nebo se předpokládá, že X a Y nějak spolu souvisí a úkolem je tuto souvislost co nejlépe popsat.

Z tohoto hlediska jsou zřejmé pojmy nezávisle a závisle statistická proměnná. Předpokládá se, že např. Y závisí na X a X nezávisí na Y. Jest tedy Y závisle proměnná, X nezávisle proměnná.

Takové pojetí má výhodu snadného grafického znázornění. Dvojice [x,y] lze totiž chápat také jako souřadnice bodů v rovině, na které je zavedena (např. kartézská) soustava souřadná. Vizualizací dvourozměrného statistického souboru je pak rovinný graf.

Mějme např. následující tabulku statistických dat:

X	Y
1,0	1,0
2,5	2,0
3,0	3,0
3,5	2,0
5,0	2,8

Tab. 6.1: Příklad dat dvourozměrného statistického souboru

Datům odpovídá následující rovinný graf:

Obr. 6.1: Grafické znázornění dvourozměrného statistického souboru

Na první pohled je zřejmé: se zvětšující se hodnou X se zvětšuje i hodnota Y přibližně “polovičním tempem”. Jistá závislost je tedy patrná.

V praxi se v souvislosti s dvourozměrnými statistickými soubory vyskytují dva typy úloh:

Zjištění závislosti Y na X
Zjištění hodnoty y_k Î Y pro takové x_k Î X, že uspořádaná dvojice [x_k,y_k] Ď S.

Zjištění (nejlépe funkční: Y = f (X)) závislosti Y na X současně umožní i zjišťování neznámých hodnot – např. pouhým dosazením x_k do rovnice funkční závislosti. Naopak zjištění hodnoty y_k pro “nezadané” x_k nemusí být vázáno na zjištění závislosti.

Problém ad A. řeší úlohy interpolace a extrapolace, problém ad B. řeší úlohy lokálních a globálních odhadů.

Interpolace a extrapolace

Obecná úloha interpolace:

Najít k funkci y=f(x) takovou funkci y=g(x), která nabývá pro n různých argumentů x₁, x₂, ... , x_n stejných hodnot jako funkce f (tj. pro kterou platí f(x_i)=g(x_i) pro i=1, ... ,n).
Odhadnout nepřesnost náhrady hodnot funkce f(x) hodnotami funkce g(x) pro x ą x_i.
Počítat z tabulky funkce y_i = f(x_i) přibližné hodnoty f(x) pomocí g(x) pro x ą x_i.

Pro statistické účely se úloha interpolace definuje ve zjednodušeném tvaru; jest při tom x_i Î X, y_i Î Y:

Určit vhodnou funkci y=f(x) takovou, která v daných bodech (někdy nazývaných uzlové body) x_i nabývá předem daných hodnot y_i – tedy pro níž je y_i=f(x_i).
Počítat z tabulky funkce y_i=f(x_i) hodnoty f(x) pro x ą xi, x Î X, a prohlásit je za pravděpodobné hodnoty y Î Y.
Odhadnout nepřesnost takto zjištěného y pro x ą x_i.

Pokud je při zjišťování y podle předchozího odstavce x Î < min {x_i}, max{x_i} >, jedná se o interpolaci. Je-li x < min {x_i} nebo x > max{x_i}, jedná se o extrapolaci. Funkce g(x) z obecné úlohy interpolace bývá nazývána funkcí, která aproximuje funkci f(x) na zadaném intervalu.

Polynomická aproximace

Polynom - mnohočlen - stupně k je obecně vyjádřen součtem

Polynomiální funkcí je pak analogicky

(1)

Polynomická funkce stupně k má (k+1) koeficientů. Je-li tedy naopak známo (k+1) dvojic [x_i, y_i = f (x_i)], kde f(x) je polynom stupně k, lze sestavit (k+1) lineárních rovnic o (k+1) neznámých koeficientech a_i. Jejich řešením se získají koeficienty toho (jediného) polynomu stupně k, který danými k+1 “body přesně prochází”.

Aplikováno na statistický problém aproximace nastíněný shora: má-li tabulka dat [x,y] celkem n řádků (=je-li známo n “bodů”), pak existuje jediný polynom stupně n-1, který danými “body” přesně prochází. Řešme tedy soustavu

(2)

Až na případy singulární matice soustavy existuje jediné řešení [a_n-1, a_n-2, ... ,a₀] koeficientů polynomu, který “přesně” prochází danými “body” [x_i, y_i].

Zdálo by se, že problém výpočtu hodnot v “neznámých místech” x na základě “známých míst” x_i je vyřešen: známými n body proložíme polynomickou funkci stupně (n-1) a pak stačí jen dosazovat.

Teoreticky to jistě pravda je. Pokusme se uvedený postup aplikovat na data ve shora uvedené tabulce. Rozšířená matice soustavy je

1,000	1,000	1,000	1,000	1,000	1,000
39,063	15,625	6,250	2,500	1,000	2,000
81,000	27,000	9,000	3,000	1,000	3,000
150,063	42,875	12,250	3,500	1,000	2,000
625,000	125,000	25,000	5,000	1,000	2,800

Jejím řešením jsou hodnoty koeficientů [a₄, ... ,a₀] polynomické funkce stupně 4, která je uvedena v následujícím grafu. Tamtéž je však patrný zásadní důvod praktické nepoužitelnosti tohoto postupu pro zjišťování pravděpodobných hodnot v “neznámých” místech: pokud data vyjadřují např. experimentálně zjištěné hodnoty délkové roztažnosti (Y) v závislosti na teplotě (X), pak záporná hodnota pro x=1.5 nebo x=4.5 je vysoce nepravděpodobná!

Obr. 6.2: Graf aproximující polynomické funkce

Uvedenou metodu je proto nutno aplikovat velmi uvážlivě.

Odhad hodnot lineární interpolací

Při lineární interpolaci je interpolační funkcí funkce lineární: y = f(x) = a.x + b (grafem této funkce je přímka). Obecně však pro daný statistický soubor taková přímka neexistuje (data by musela být kolineární, a to obecně nejsou). Lineární funkce má totiž dva parametry (a a b) a ty jsou jednoznačně dány dvěma dvojicemi [x_i, y_i] a [x_k, y_k] dat. Řešíme pak soustavu

y_i = a . x_i + b
y_k = a . x_k + b

Tomu odpovídá tvrzení Eukleidovské geometrie, že dvěmi různými body prochází jediná přímka. Pro různé dvojice dat statistického souboru pak existují různé lineární funkce.

Odhad hodnot metodou lineární interpolace především předpokládá, že statistická data jsou "seřazena podle X" (pokud ne, lze je evidentně takto uspořádat), tj. x_min = x₁ Ł x₂Ł .. Ł x_n = x_max. Nechť jest odhadnout y₀ = f(x₀) pro nějaké x₀Î <x_min, x_max>. Existuje-li i tak, že x₀=x_i, pak je odhadem y₀=y_i. Pokud ne, jistě existuje k tak, že x₀ Î (x_k, x_k+1). Je logické předpokládat, že bude i y₀Î (y_k, y_k+1). Dvojicí [x_k, y_k], [x_k+1, y_k+1] je určena jediná "přímka" - jediná lineární funkce y = a.x + b, jejíž koeficienty a a b se spočtou pomocí soustavy uvedené shora. Je pak odhad y₀

y₀ = a . x₀ + b

Geometricky vzato, bod [x₀, y₀] leží uvnitř úsečky <[x_k, y_k], [x_k+1, y_k+1]>. Metoda lineární interpolace tedy místo přímky používá soustavu úseček tvořících lomenou čáru.

Právě z geometrického hlediska vyplývá druhý způsob výpočtu odhadu y₀ (viz následující obrázek):

Obr. 6.3: Princip lineární interpolace

Z podobnosti trojúhelníků vyplývá rovnost

dy₁ : dx₁ = dy₂ : dx₂

(a podíl rovný oběma stranám rovnosti je mj. směrnice přímky, jejíž částí je první úsečka). Je tedy

dy₁ = dy₂ : dx₂ . dx₁

a proto

y₀ = y₁ + dy₁ = y₁ + dy₂ : dx₂ . dx₁

Proveďme výpočet pro x₀ = 1,6 tak, jak je to naznačeno na hořejším obrázku. Je x₀ = 1,6 Î <1; 2,5>. Nejprve odhadněme y₀ řešením dvou rovnic pro koeficienty přímky a dosazením do její rovnice. Je

1,0 = a . 1,0 + b
2,0 = a . 2,5 + b

Odečtením první rovnice od druhé je

1,0 = a . 1,5

a tedy a=2/3 a proto b=1/3. Rovnice přímky je

y = 2/3 . x + 1/3

Dosazením x₀=1,6 je y₀=1,4, což je v dobrém souladu s grafickým řešením.

Nyní druhým způsobem:

dy1 : (1,6 - 1,0) = (2,0 - 1,0) : (2,5 - 1,0)
dy1 : 0,6 = 1 : 1,5
dy1 = 0,4
y0 = 1,0 + 0,4 = 1,4

Interpolace vyšších řádů

Zobecněním postupu uvedeného pro lineární interpolace získáme interpolace vyšších řádů. Jde však o postup mechanický, užívaný jen v odůvodněných případech. Princip vyplývá z obrázku uvedeného níže; používá interpolaci druhého řádu, tj. kvadratickou.

Analogicky k lineární interpolaci: při kvadratické interpolaci je interpolační funkcí funkce kvadratická: y = f(x) = a.x² + b.x + c (grafem této funkce je parabola). Obecně však pro daný statistický soubor jediná taková parabola neexistuje. Kvadratická funkce má totiž tři parametry (a, b a c) a ty jsou jednoznačně dány třemi dvojicemi [x_i, y_i], [x_m, y_m] a [x_k, y_k] dat. Řešíme pak soustavu

y_i = a . x_i² + b . x_i + c
y_m = a . x_m² + b . x_m + c
y_k = a . x_k² + b . x_k + c

Tomu odpovídá tvrzení, že třemi různými body prochází jediná parabola. Pro různé trojice dat statistického souboru pak existují různé kvadratické funkce.

Odhad hodnot metodou kvadratické interpolace především předpokládá, že statistická data jsou "seřazena podle X" (pokud ne, lze je evidentně takto uspořádat), tj. x_min = x₁ Ł x₂ Ł.. Ł x_n = x_max. Nechť jest odhadnout y₀ = f(x₀) pro nějaké x₀Î <x_min, x_max>. Existuje-li i tak, že x₀=x_i, pak je odhadem y₀=y_i. Pokud ne, jistě existuje k tak, že x₀ Î (x_k, x_k+1). Trojicí [x_k, y_k], [x_k+1, y_k+1], [x_k+2, y_k+2] (resp. [x_k-1, y_k-1], [x_k, y_k] , [x_k+1, y_k+1] pro poslední interval) je určena jediná "parabola" - jediná kvadratická funkce y = a.x² + b.x + c, jejíž koeficienty a, b a c se spočtou pomocí soustavy uvedené shora. Je pak odhad y₀

y₀ = a . x₀² + b . x₀ + c

Geometricky vzato, bod [x₀, y₀] leží uvnitř segmentu paraboly <[x_k, y_k], [x_k+1, y_k+1]>. Metoda kvadratické interpolace tedy místo celé paraboly používá soustavu parabolických segmentů.

Obr. 6.4: Princip kvadratické interpolace

Splain křivky

Odhady hodnot pomocí splain křivek patří k velmi populárním metodám zvláště při grafickém zobrazení, kdy jsou body "spojeny hladkou čarou". Metoda je značně náročná jak teoreticky, tak početně; proto je využívána nejvíce v počítačovém prostředí.

Princip je následující: vychází z interpolace pomocí - nejčastěji kubických - funkcí (viz předchozí kapitola). "Spojuje" tedy dvojice daných bodů segmenty kubické křivky (ten je dán čtyřmi body). Z prvních čtyř bodů se spočte kubická křivka a první dva body se spojí jejím segmentem. Pak se z druhého až pátého bodu spočte kubická křivka a druhé dva body se spojí jejím segmentem, atd.

Nevýhodou takového postupu je to, že v daných bodech na sebe jednotlivé segmenty "nenavazují hladce"; je tam prostě zub. Při konstrukci splain křivek je proto jednou z určujících podmínek pro výpočet jedné kubické křivky to, že v koncovém bodě jejího segmentu (např. [x_p, y_p]) má společnou tečnu se segmentem druhé, "následující" kubické křivky, jejímž je [x_p, y_p] bodem počátečním.

Matematicky je podmínka vyjádřena tím, že derivace zleva v x_p jedné kubické funkce je rovna derivaci zprava v x_p druhé kubické funkce. Problémem je však to, že pro určení té druhé musíme znát tu první, a to v okamžiku, kdy právě tu první počítáme. Právě proto jsou tyto algoritmy realizovány především programově.

Výsledný efekt ukazuje následující obrázek. Body tabulky jsou spojeny křivkou, přičemž body křivky byly spočteny splain interpolací.

Obr. 6.5: Splain křivka

Extrapolace

Extrapolací se provádí odhad hodnot pro x₀ < x_min nebo pro x₀ > x_max. Je pravdou, že v praxi mají význam odhady jen "blízko" koncovým bodům intervalu <x_min, x_max>. Používá se dvou metod, přičemž jejich volba je dána povahou řešeného problému.

"Až do x₁ jsou všechny y rovny y₁ (od x_n jsou všechny y rovny y_n)":
y = f(x) = y₁ pro x Ł x₁=x_min,
y = f(x) = y_n pro x ł x_n=x_max.
"Až do x₂ se vše spočte jako pro <x₁, x₂> (už od x_n-1 se vše spočte jako pro <x_n-1, x_n>)".

Způsob výpočtu zde závisí na použité interpolační metodě (viz shora).

Rozdíl mezi oběma metodami ukažme na lineární interpolaci:

Obr. 6.6: Princip extrapolace