Testování statistických hypotéz

Od statistického šetření neočekáváme pouze elementární informaci o velikosti některých statistických ukazatelů. Používáme je i k ověřování našich očekávání o výsledcích nějakého procesu, k posuzování významnosti změn, které byly způsobeny změnou technologie, apod. Ukážeme, že ač formulace úloh toho typu se liší od formulace úlohy o odhadech parametrů, jde zpravidla vždy o řešení inverzní úlohy o intervalovém odhadu. Zaveďme si však napřed příslušnou terminologii.

Definice 12.1.1.

Statistická hypotéza: je tvrzení, které se týká neznámé vlastnosti rozdělení pravděpodobnosti náhodné proměnné (i vícerozměrné) nebo jejích parametrů.
Hypotéza, jejíž platnost ověřujeme, se nazývá nulová hypotéza H₀.
Proti nulové hypotéze stavíme alternativní hypotézu H₁. Ta může být buď oboustranná nebo jednostranná. Pak i testy jsou buď oboustranné nebo jednostranné.
Hypotézy se mohu týkat pouze neznámých číselných parametrů rozložení náhodné veličiny, pak jde o testy parametrické.
Ostatní typy jsou testy neparametrické.
Statistické testy: jsou postupy, jimiž prověřujeme platnost nulové hypotézy. Na základě nich pak hypotézu buď přijmeme nebo odmítneme.
Testovací kritérium: je náhodná veličina závislá na náhodném výběru (též nazývaná statistika) mající vztah k nulové hypotéze.

Jednostranné a oboustranné testy se od sebe rozlišují z hlediska alternativní hypotézy, kterou stavíme proti prověřované nulové hypotéze a která může být dvojího druhu, jak plyne z tohoto příkladu:
Nechť nulová hypotéza předpokládá, že A = B. V případě, že tuto hypotézu zamítneme, je buď A ≠ B, nebo A > B (resp. A < B).

a) V prvém případě (A ≠ B) nebereme zřetel na znaménko rozdílu A - B, takže může být buďA - B < 0 nebo A - B > 0. V těchto případech používáme oboustranný test.

b) V druhém případě, kdy proti hypotéze A = B klademe možnost A > B (resp. A < B), používáme jednostranných testů.

Pro kritické hodnoty testovacího kritéria a_p, b_p platí:

.
Tyto hodnoty oddělují interval prakticky možných hodnot (interval spolehlivosti, konfidenční interval) <a_p, b_p> od kritických intervalů, v nichž se hodnoty veličiny X vyskytují s pravděpodobností p, které říkáme hladina významnosti. Nejčastěji volíme p = 0,01 nebo p = 0,05.

Porovnání hodnoty testovacího kritéria s jeho kritickými hodnotami slouží k rozhodnutí o výsledku testu. Musíme si uvědomit, že nemůžeme mluvit o dokazování správnosti či nesprávnosti zvolené hypotézy - to není v možnostech statistické indukce. Závěr testu pouze rozhodne mezi dvěmi možnostmi:

hypotézu přijímáme (zamítáme alternativní hypotézu), leží-li pozorovaná hodnota testovacího kritéria v intervalu prakticky možných hodnot. Znamená to, že rozdíl mezi pozorovanou a teoretickou hodnotou testovacího kritéria je vysvětlitelný na dané hladině významnosti p náhodností výběru.
hypotézu zamítáme (přijímáme alternativní hypotézu), leží-li pozorovaná hodnota testovacího kritéria v kritickém oboru. Rozdíly považujeme za statisticky významné na zvolené hladině významnosti p, tzn., že se nedají vysvětlit pouze náhodností výběru.

Příklady otázek, na které se dá odpovídat pomocí výsledků příslušných statistických testů:

Má základní soubor (ZS) předpokládanou střední hodnotu?
Mají dva soubory stejnou disperzi?
Můžeme předpokládat, že dva výběry pocházejí z téhož ZS?
Má ZS předpokládané rozdělení?
atd.

Těmito slovy jistě nebudou technici formulovat své otázky v konkrétním průmyslovém podniku. Bude je ale např. zajímat,
zda

bylo dodáno uhlí deklarované kvality
dva měřící přístroje pracují stejně přesně
se nezměnily provozní podmínky ovlivňující výrobu (např. seřízení obráběcích strojů)
produkce zmetků v jednotlivých hodinách je rovnoměrná

(Pokuste se popsat konkrétní provozní realizace výše uvedených situací.)

Definice 12.1.2.

Nechť b je pozorovaná, kdežto β teoretická hodnota statistiky B a nechť <a_p, b_p> je interval prakticky možných hodnot veličiny B na 100p% hladině významnosti.: Pak říkáme, že rozdíl b - β je
1.  náhodně vysvětlitelný, když ;
2.  statisticky významný, když ;
3.  slabě statisticky významný, když , ale .

Formulace výzkumné otázky ve formě nulové a alternativní statistické hypotézy
Zvolení přijatelné úrovně chyby rozhodování (volba hladiny významnosti p)
Volba testovacího kritéria
Výpočet hodnoty testovacího kritéria
Určení kritických hodnot testovacího kritéria
Doporučení (přijmutí nebo zamítnutí nulové hypotézy H₀)

Poznámky

Hladina významnosti je pravděpodobnost, že se zamítne nulová hypotéza, ačkoliv ona platí. Pochopitelně se tato hodnota volí velmi malá, jak již bylo řečeno, nejčastěji 0,05 nebo 0,01.
Jestliže test neindikuje zamítnutí nulové hypotézy H₀, je nesprávné přijmout nulovou hypotézu jako definitivně pravdivou. Správně můžeme pouze prohlásit, že není dostatek dokladů pro zamítnutí nulové hypotézy.
Netvrďme, že data ukazují, že teorie platí/neplatí. Správnější je říct, že data podporují nebo nepodporují rozhodnutí o zamítnutí platnosti nulové hypotézy.

Při testování hypotéz mohou nastat čtyři možnosti, které popisuje následující tabulka:

		Závěr testu
		H₀ platí	H₀ neplatí
Skutečnost	H₀ platí	správný	chyba I. druhu
Skutečnost	H₀ neplatí	chyba II. druhu	správný

Přirovnáme-li tuto situaci k medicínskému testování, pak chyba I. druhu znamená falešně pozitivní výsledek (pacient je zdráv, ale testování ukazuje na nemoc), chyba II. druhu odpovídá falešně negativnímu výsledku (pacient je nemocný, ale test to neodhalí).

Pravděpodobnost chyby I. druhu je podmíněná pravděpodobnost, že zamítneme nulovou hypotézu za předpokladu, že platí - označujeme p - viz. výše. Pravděpodobnost chyby II. druhu je podmíněná pravděpodobnost, že nezamítneme nulovou hypotézu za předpokladu, že neplatí, označujeme p₀:

P(chyba I. druhu | H₀ platí) = p
P(chyba II. druhu | H₁ neplatí) = p₀

Konvenční hodnoty pro p₀ jsou 0,2 nebo 0,1.

Někdy můžeme také mluvit o opačných jevech k chybě I. a II. druhu, tzn. o podmíněné pravděpodobnosti, že neuděláme chybu I. druhu (spolehlivost testu) nebo že neuděláme chybu II. druhu. Síla testu odpovídá hodnotě (1 - p₀). Jedná se tedy o podmíněnou pravděpodobnost, že správně odhalíme testem neplatnost nulové hypotézy:

P(neuděláme chybu I. druhu | H₀ platí) = 1 - p = _”spolehlivost“
P(neuděláme chybu II. druhu | H₁ neplatí) = 1 - p₀ = _”síla testu“

Cílem při testování nulové hypotézy je omezit úrovně pravděpodobnosti chyb I. a II.druhu. Jinými slovy - usilujeme o maximalizaci spolehlivosti a síly testu.

Řešení: Soudní systém se řídí zásadou, že obžalovaný je nevinen, dokud se nepodaří prokázat opak. Formulace hypotéz má tedy tuto podobu:

H₀: Obžalovaný je nevinen.
H₁: Obžalovaný je vinen.

Různé možnosti vztahu mezi pravdou a rozhodnutím soudu vidíme v tabulce:

Uvědomme si, že chyba I. druhu má pro jedince fatální následky. Proto její možnost eliminujeme na nejmenší možnou míru. Soud musí jasně prokázat vinu obžalovaného. Jeho rozhodnutí také podléhají přezkoumání vyšších instancí. Odpovídá to volbě velmi malé hladiny významnosti. V mnoha jiných případech však nevíme zcela přesně, která chyba je pro nás důležitější.

Předpoklady:
Jsou dány dva výběry o rozsazích n₁, n₂ s rozptyly s₁², s₂², vybrané ze dvou základních souborů s rozděleními N(m₁, s₁²) a N(m₂, s₂²).
Nulová hypotéza:
H₀: s₁² = s₂²
Alternativní hypotéza:
H₁: s₁² ≠ s₂²
Testovací kritérium:

má Fisherovo-Snedecorovo rozdělení F(n₁ - 1, n₂ - 1).
Závěr:
Jestliže

, zamítáme hypotézu H₀ (přijímáme H₁).
Indexy 1, 2 volíme tak, aby testovací kritérium F > 1.

Řešené úlohy

Příklad 12.2.1. Byly sledovány výsledky běhu na 50 m (ve vteřinách) u skupiny desetiletých chlapců a dívek. Posuďte získané výsledky z hlediska vyrovnanosti výkonů v jednotlivých skupinách.
Chlapci:

1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
10,80	9,30	9,40	9,90	10,20	9,30	9,40	8,90	8,90	9,60	9,70	10,60	9,40	9,50	9,60	10,00	9,30

18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33
9,40	8,40	9,80	8,80	9,20	9,50	9,80	9,00	10,50	9,40	9,30	9,90	9,10	9,60	8,70	8,10

Dívky:

1	2	3	4	5	6	7	8	9	10	11	12	13	14
10,70	10,80	10,00	10,60	9,20	10,20	9,90	10,00	9,30	10,20	9,80	10,00	10,00	11,00

15	16	17	18	19	20	21	22	23	24	25	26	27	28
12,00	10,00	10,00	11,20	9,40	10,70	9,30	10,10	9,10	10,20	9,30	10,00	9,40	10,90

Řešení: Hladinu významnosti zvolíme p = 0,05.
Určíme potřebné charakteristiky u obou skupin (prohodili jsme pořadí tak, aby vyšlo F > 1):

Dívky:
n₁ = 28
s₁² = 0,4521

Chlapci:
n₂ = 33
s₂² = 0,3302

Určíme hodnotu testovacího kritéria:

Kritická hodnota (vypočtená např. v Excelu pomocí předdefinované funkce FINV):
F_0,025(27,32) = FINV(0,025;27;32) = 2,0689
Testovací kritérium nepřekročilo kritickou hodnotu, tudíž přijmeme H₀. Mezi rozptyly není statisticky významný rozdíl.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Předpoklady:
Je dán výběr ze základního souboru s rozdělením N(m, s²) o rozsahu n se střední hodnotou m a disperzí s².
Nulová hypotéza:
H₀: m = m₀
Alternativní hypotéza:
H₁: m ≠ m₀
Testovací kritérium:

má Studentovo rozdělení t(n - 1).
Závěr:
Jestliže |T | > t_p(n - 1), zamítáme hypotézu H₀ (přijímáme H₁).

Řešené úlohy

Příklad 12.3.1. V pivovaru došlo k opravě plnící linky. Na hladině významnosti p = 0,05 ověřte, zda se oprava zdařila, tj., zda linka plní do láhví pivo o objemu 500ml. Výsledky u vybraných vzorků (v mililitrech):

495,2	496,8	502,1	498,5	501	503	500,7
501,5	501,8	499,1	500,9	502,2	501,7	500,4
500,2	501,1	499,9	500,2	501,1	500,8	499,3

Řešení: m₀ = 500, tudíž:
H₀: m = 500
H₁: m ≠ 500
Výpočet základních charakteristik:

n = 21

m = 500,3571

s = 1,77806

Testovací kritérium:

Kritická hodnota (vypočteme např. v Excelu pomocí předdefinované funkce TINV):
t_0,05(20) = TINV(0,05;20) = 2,086
Závěr:
Testovací kritérium nepřekročilo kritickou hodnotu, tudíž přijmeme H₀. Oprava se zdařila, linka plní lahve správně.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Předpoklady:
Jsou dány dva výběry o rozsazích n₁, n₂ se středními hodnotami m₁, m₂ a disperzemi s₁², s₂², které pocházejí ze dvou základních souborů s rozděleními N(m₁;s₁²) a N(m₂;s₂²).
Nulová hypotéza:
H₀: m₁ = m₂
Alternativní hypotéza:
H₁: m₁ ≠ m₂

b) jestliže předpokládáme s₁² ≠ s₂² (prověříme F-testem), volíme testovací kritérium:

,
které má rozdělení, složené ze dvou Studentových rozdělení.
Kritické hodnoty určíme podle vzorce:

Závěr:
Jestliže | T | > t_p, zamítneme H₀.

Poznámka
t-test používáme např. k ověřování následujících hypotéz:

Pocházejí dva vzorky z téhož základního souboru?
Nedopustili jsme se při dvou měřeních, jejichž výsledkem bylo určení dvou středních hodnot m₁, m₂, systematických chyb?
Má určitý faktor vliv na zkoumaný argument? Zde zkoumáme dva vzorky - jeden při působení daného faktoru, druhý bez jeho působení.

Řešené úlohy

Příklad 12.3.2. Odběratel dostává zářivky od dvou dodavatelů. Při hodnocení kvality zářivek se sleduje také počet zapojení, který snesou zářivky bez poškození. Zkoušky výrobků vedly k těmto výsledkům:

dodavatel A:	2139	2041	1968	1903	1952	1980	2089	1915
	2389	2163	2072	1712	2018	1792	1849

dodavatel B:	1947	1602	1906	2031	2072
	1812	1942	2074	2132

Ověřte hypotézu, že kvalita obou dodávek je stejná. Hladinu významnosti volte p = 0,05.

Řešení: V Excelu vypočteme charakteristiky obou souborů:

n₁ = 15	m₁ = 1998,8	s₁² = 25444,69
n₂ = 9	m₂ = 1946,4	s₂² = 23554,25

Nejdříve provedeme F-test:
Testovací kritérium:

Kritická hodnota:
F_0,025(14,8) = FINV(0,025;14;8) = 4,1297
Přijmeme tedy hypotézu o shodě rozptylů s₁² = s₂².
Dále tedy postupujeme jako v případě a):
Testovací kritérium:

Kritická hodnota:
t_0,05(22) = TINV(0,05;22) = 2,074
Závěr:
Testovací kritérium nepřekročilo kritickou hodnotu, přijmeme H₀: m₁ = m₂. Kvalita obou dodávek je stejná.

Tato úloha se dá v Excelu řešit i jednodušším způsobem, máme-li nainstalován doplňkový nástroj Excelu Analýza dat (instalace je podrobněji popsána v 7. kapitole, příkladu 7.3.1.). Tento doplněk by mělo být možné spustit z nabídky Nástroje. V dialogovém okně Analýza dat klepneme na analytický nástroj Dvouvýběrový t-test s rovností rozptylů. Objeví se nám okno, do kterého zadáme vstupy, tj. 1. soubor hodnoty od dodavatele A, 2. soubor hodnoty od dodavatele B. Výstupem pak bude následující (nebo velmi podobná) tabulka:

V této tabulce máme všechny potřebné údaje.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Příklad 12.3.3. Při antropologických měřeních obyvatelstva Egypta byla mimo jiné sledována šířka nosu (cm) u skupiny mužů 21-50 letých na severní části země a u skupiny stejně starých mužů z jižní části. Naměřené výsledky viz v tabulce. Posuďte významnost rozdílu ve výsledcích. Hladinu významnosti volte p = 0,05.

sever	3,6	4,1	3,3	3,4	3,7	3,1	4,0	4,0	3,6	3,0	3,3
	3,7	4,3	3,3	3,4	3,4	3,3	3,6	4,0	3,4	3,7
jih	4,3	3,9	4,3	3,8	4,1	4,2	3,8	3,9	3,8	3,8	4,0	3,7
	3,9	4,4	3,7	3,8	3,9	3,9	4,0	4,1	3,8	4,0	4,3

Řešení: V Excelu vypočteme charakteristiky obou souborů:

n₁ = 21	m₁ = 3,580952	s₁² = 0,112971
n₂ = 23	m₂ = 3,973913	s₂² = 0,0429249

Nejdříve provedeme F-test:
Po dosazení do testovacího kritéria vyšla hodnota:
F = 2,763409
Kritická hodnota:
F_0,025(20,22) = FINV(0,025;20;22) = 2,38898
Tudíž nemůžeme přijmout hypotézu o shodě rozptylů: s₁² ≠ s₂².
Dále tedy postupujeme jako v případě b):
Testovací kritérium:

Kritická hodnota, po dosazení:

Závěr:
Testovací kritérium v absolutní hodnotě překročilo kritickou hodnotu, nemůžeme přijmout H₀. Šířky nosu na severu se liší od těch na jihu.

Stejně jako u předchozí úlohy můžeme vyřešit v Excelu i pomocí doplňkového nástroje Analýza dat. V dialogovém okně Analýza dat klepneme na analytický nástroj Dvouvýběrový t-test s nerovností rozptylů. Objeví se nám okno, do kterého zadáme vstupy, tj. 1. soubor hodnoty ze severní části země, 2. soubor hodnoty z jihu. Výstupem bude opět následující (nebo velmi podobná) tabulka:

V této tabulce opět najdeme všechny potřebné údaje.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Předpoklady:
Ze dvou normálně rozložených základních souborů s parametry μ₁, σ₁² a μ₂, σ₂² byly vybrány dva výběry se stejnými rozsahy n. Přitom každému prvku prvého výběru x_1i odpovídá právě jeden prvek druhého výběru x_2i. Vznikly tedy páry (x_1i ; x_2i), i = 1, ... n.
Nulová hypotéza:
H₀: μ₁ = μ₂ , což lze jinak zapsat: d = 0, když d je střední hodnota rozdílů d_i = x_1i - x_2i , tedy:

.
Alternativní hypotéza:
H₁: μ₁ ≠ μ₂ nebo tedy: d ≠ 0
Testovací kritérium:

(s_d je směrodatná odchylka hodnot d_i)
Veličina t má Studentovo rozložení s n - 1 stupni volnosti t(n - 1).
Závěr:
Jestliže | t | > t_p(n - 1), zamítneme hypotézu H₀.

Řešené úlohy

Příklad 12.3.4. Stanovení thiocyanového iontu (SCN-) bylo paralelně provedeno dvěma metodami (Aldridge a Barker) na 12 vzorcích. Srovnejte obě metodiky otestováním výsledků. Hladina významnosti p = 0,05.

	1	2	3	4	5	6	7	8	9	10	11	12
Aldridge	0,38	0,56	0,45	0,49	0,38	0,41	0,6	0,36	0,26	0,41	0,43	0,4
Barker	0,39	0,58	0,44	0,52	0,41	0,45	0,59	0,37	0,28	0,42	0,42	0,38

Řešení: Nejprve vytvoříme veličinu d:

Z tabulky jednoduše vypočteme potřebné charakteristiky:

(nebo v Excelu pomocí funkce PRŮMĚR)
Obdobně směrodatnou odchylku:
s_d = 0,018257
Testovací kritérium:

Kritická hodnota:
t_0,05(12 - 1) = TINV(0,05;11) = 2,201
Testovací kritérium nepřekročilo kritickou hodnotu, přijmeme H₀. Obě metodiky dávají stejné výsledky.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Přejděme nyní k ukázkám testů neparametrických, u nichž se nezaměřujeme na hodnoty některých parametrů základního souboru, ale studujeme shodu rozložení náhodné veličiny. Ověřujeme tedy např., zda určitý teoretický základní soubor může být modelem pro studovaný výběr, zda rozložení těchto souborů je možno považovat za totožná. Předveďme některé testy dobré shody.

Předpoklady:
Nechť výsledky pozorování jsou roztříděny do k skupin a v každé skupině je zjištěna skupinová četnost f_ej (četnosti experimentální). Uvažujme určité rozdělení, které budeme považovat za model pro náš výběr. Pro každou třídu určíme teoretické, modelové, očekávané četnosti f_oj (j = 1,...,k).
Nulová hypotéza:
H₀: Základní soubor má očekávané rozložení, tzn. že četnosti f_ej a f_oj (j = 1,...,k) se liší pouze náhodně.
Testovací kritérium:

Tato veličina má Pearsonovo rozložení χ² s ν = k - s - 1 stupni volnosti. Veličina s značí počet parametrů očekávaného rozložení odhadnutých na základě výběru.
Závěr:
Jestliže χ² > χ_p²(k - s - 1), zamítneme hypotézu H₀.

Poznámky
Při použití tohoto testu se vyžaduje splnění těchto podmínek:

všechny očekávané třídní četnosti mají být větší než 1,
nejvýše 20 % očekávaných třídních četností může být menších než 5,
nedoporučuje se volit počet tříd větší než 20.

Nejsou-li splněny, lze přikročit k sloučení sousedních tříd v nezbytném rozsahu.
Pozn. ke stupňům volnosti: Ověřujeme-li např. normalitu základního souboru, je s rovno 2, protože teoretické normální rozložení se stanovuje na základě odhadu střední hodnoty a disperze výběru, tedy na základě dvou charakteristik.

Řešené úlohy

Příklad 12.4.1. Je dán statistický soubor:

i	1	2	3	4	5	6	7	8	9	10	11	12
obsah Al₂O₃	8-9	9-10	10-11	11-12	12-13	13-14	14-15	15-16	16-17	17-18	18-19	19-20
f_ei	2	5	7	19	52	57	72	61	19	14	4	1

Na hladině významnosti 5 % otestujte hypotézu, že soubor má normální rozdělení.

Řešení: Nejdříve vypočteme příslušné charakteristiky, tj. parametry normálního rozdělení - střední hodnotu a rozptyl. Výpočet provedeme způsobem, který byl popsán v 7. kapitole, příkladu 7.4.1.:

Střední hodnota:

Rozptyl:

Směrodatná odchylka:

Pomocí parametrů normálního rozdělení můžeme vypočítat očekávané četnosti f_oi:
Uvedeme např. výpočet f_o1:
f_o1 = N.P(8 ≤ X ≤ 9) = 313.(F(9) - F(8)) = (v Excelu) =
= 313*(NORMDIST(9;14,11342;1,808871;1) -
- NORMDIST(8;14,11342;1,808871;1)) =
= 0,6220961
Zbylé očekávané četnosti vypočteme analogicky, viz. tabulka:

Z tabulky je patrné, že nejsou splněny všechny podmínky z předchozí poznámky, proto sloučíme třídy 1,2 a třídy 11,12:

Po sloučení tříd jsou všechny podmínky splněny, v posledním sloupci je vypočtena hodnota testovacího kritéria:

Kritická hodnota:

Závěr:
Testovací kritérium nepřekročilo kritickou hodnotu. Daný soubor má normální rozdělení.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Předpoklady:
Nechť výsledky pozorování jsou roztříděny do k skupin a v každé skupině je zjištěna skupinová četnost n_ej (četnosti experimentální). Uvažujme určité rozdělení, které budeme považovat za model pro náš výběr. Pro každou třídu určíme teoretické, modelové, očekávané četnosti n_oj (j = 1,...,k).
Pro empirické i teoretické očekávané rozdělení stanovíme kumulativní četnosti N_ej a N_oj, j = 1,...,k.
Nulová hypotéza:
H₀: Základní soubor má očekávané rozložení, tzn. že četnosti N_ej a N_oj (j = 1,...,k) se liší pouze náhodně.
Testovací kritérium:

Tato veličina má speciální rozložení, jehož kritické hodnoty jsou tabelovány pro n < 40 (viz tabulky). Pro n ≥ 40 se počítají podle přibližných vzorců.
Pro hladinu významnosti p = 0,05 je

,
pro hladinu významnosti p = 0,01 je

Závěr:
Jestliže D₁ ≥ D_1;p, zamítneme hypotézu H₀.

Řešení: Parametry normálního rozdělení a očekávané četnosti jsme už vypočetli v příkladě 12.4.1., stačí dopočítat kumulativní četnosti a testovací kritérium:

Testovací kritérium:

.
Kritická hodnota:

.
Testovací kritérium nepřekročilo kritickou hodnotu. Daný soubor má normální rozdělení.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Předchozí dva testy ověřovaly, zda rozložení výběru neodporuje předpokladu o určitém rozložení základního souboru. Následující test bude ověřovat, shodu rozložení dvou výběrů.

Předpoklady:
U dvou výběrových souborů s rozsahy n₁ a n₂ bylo provedeno roztřídění do k skupin a zjištěny kumulativní třídní četnosti pro každou třídu: N_1,j a N_2,j.
Nulová hypotéza:
Oba výběrové soubory mají totéž rozložení (pocházejí tedy z téhož základního souboru).
Testovací kritérium:
a) n₁ = n₂ ≤ 40

má speciální rozložení, jeho kritické hodnoty se vyčtou z příslušných tabulek (viz tabulky),

b) n₁ > 40 a n₂ >40 (i různě velké):

.
Kritické hodnoty se počítají podle vzorců:
pro p = 0,05 je

a
pro p = 0,01 je

Závěr:
Jestliže D₂ ≥ D_2:p(n₁,n₂), zamítneme nulovou hypotézu H₀.

Řešené úlohy

Příklad 12.4.3. Ve dvaceti vybraných závodech byly zkoušeny dva typy filtrů odpadních vod. Bylo zjišťováno, jaké procento nečistot filtr zadrží, a to tak, že nejprve byly instalovány filtry 1. typu a po určité době filtry 2. typu. Výsledky jsou v tabulce:

množství zadržených nečistot (v %)	10	20	30	40	50	60	70
n_1,j	1	2	3	8	5	1	0
n_2,j	0	2	3	2	3	7	3

Zjistěte, jestli se porovnávané filtry kvalitativně liší.

Řešení:
H₀: Dva základní soubory mají totéž rozdělení (porovnávané filtry se kvalitativně neliší).
Volíme hladinu významnosti p = 0,05

Z tabulky vidíme, že n₁ = n₂ < 40, tudíž testovací kritérium:

Kritická hodnota:
D_2;0,05(20) = 9 (viz tabulky)
Závěr:
D₂ = D_2;0,05(20) = 9, zamítneme H₀.
Filtry se kvalitativně liší.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Existují i neparametrické testy, které neověřují rozložení výběrového souboru. Uveďme test, který se snaží zjistit, zda výběrový soubor neobsahuje údaj zatížený hrubou chybou měření, popř. chybou v zápise. Jde o jeden z testů extrémních odchylek.

Předpoklady:
Ve výběrovém souboru o rozsahu n je x₁ = min(x_i), resp. x_n = max(x_i) (např. hodnoty jsou seřazeny podle velikosti od x₁ do x_n).
Nulová hypotéza:
H₀: Hodnota x₁ (nejmenší hodnota), resp. x_n (největší hodnota) se neliší významně od ostatních hodnot souboru.
Testovací kritérium:

, nebo

,
podle toho, testujeme-li minimální nebo maximální hodnotu ve výběru. Kritické hodnoty Q_1;p, resp. Q_n;p se vyčtou z příslušných tabulek (viz tabulky).
Závěr:
Jestliže Q₁ > Q_1;p , resp. Q_n > Q_n;p, zamítneme nulovou hypotézu H₀.

Test extrémních odchylek je možno ovšem také provést užitím parametrického testu:

Předpoklady:
Ve výběrovém souboru o rozsahu n je x₁ = min(x_i), resp. x_n = max(x_i) (např. hodnoty jsou seřazeny podle velikosti od x₁ do x_n). x je střední hodnota výběru, S je výběrová směrodatná odchylka.
Nulová hypotéza:
H₀: Hodnota x₁, resp. x_n se neliší významně od ostatních hodnot souboru.
Testovací kritérium:

, resp.

,
podle toho, testujeme-li minimální nebo maximální hodnotu ve výběru.
Kritické hodnoty T_1;p, resp. T_n;p se vyčtou z příslušných tabulek (viz tabulky),
Závěr:
Jestliže T₁ > T_1;p , resp. T_n > T_n;p, zamítneme nulovou hypotézu H₀.

Řešené úlohy

Příklad 12.5.1. Při kalibraci titrační metody k stanovení krevního cukru bylo provedeno 12 paralelních analýz z jednoho vzorku s těmito výsledky:

83	88	84	78	82	82
86	81	98	83	85	80

Otestujte, zda hodnota 98 není chybná.

Řešení: Dixonovým testem:
x₁ = 78 (nejmenší hodnota)
x_n - 1 = 88 (druhá největší hodnota)
Testovací kritérium:

Kritická hodnota:
Q_12;0,05 = 0,376;
Q_12;0,01 = 0,482 (viz tabulky).
Závěr:
Testovací kritérium překročilo kritickou hodnotu (pro obě zkoumané hladiny významnosti). Zamítáme nulovou hypotézu H₀.
Hodnota 98 se významně liší od ostatních hodnot.

Grubbsovým testem:
Nejdříve vypočteme potřebné charakteristiky:

x = 84,16667

s = 4,896144

Testovací kritérium:

Kritická hodnota:
Q_12;0,05 = 2,387;
Q_12;0,01 = 2,663 (viz tabulky).
Závěr:
Testovací kritérium překročilo kritickou hodnotu (pro obě zkoumané hladiny významnosti). Zamítáme nulovou hypotézu H₀.
Hodnota 98 se významně liší od ostatních hodnot.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

Uveďme ještě test, který se týká koeficientu korelace u dvojrozměrné náhodné veličiny.

Předpoklady:
Dvojrozměrný základní soubor má normální rozložení a korelační koeficient ρ.
Náhodný výběr z tohoto souboru má rozsah n a koeficient korelace r.
Nulová hypotéza:
ρ = 0
Testovací kritérium:

Tato veličina má Studentovo rozložení s n - 2 stupni volnosti t(n - 2).
Závěr:
Jestliže

, zamítneme H₀.

Řešení: Použijeme předchozí test lineární nezávislosti v základním souboru.
Nejdříve (např. v Excelu vypočteme výběrový koeficient korelace:
R = 0,752064.
Tuto hodnotu dosadíme do testovacího kritéria:

.
Kritická hodnota:
t_0,05(7-2) = TINV(0,05;D22) = 2,570582.
Závěr:
Hodnota testovacího kritéria nepřekročila kritickou hodnotu.
Není nutno zamítnout hypotézu o lineární nezávislosti x a y.

Tuto úlohu si zde můžete otevřít vyřešenou v Excelu.

		Závěr soudu
		Obžalovaný je nevinen	Obžalovaný je vinen
Skutečnost	Obžalovaný je nevinen	správný	chyba I. druhu
Skutečnost	Obžalovaný je vinen	chyba II. druhu	správný

x	0,0	0,5	1,0	1,5	2,0	2,5	3,0
y	0,0	1,7	3,1	3,8	3,9	3,8	3,0