niedziela, 13 stycznia 2013

Podstawy teorii weryfikacji hipotez statystycznych

Hipotezą statystyczną nazywamy każdą taką hipotezę, która dotyczy bądź postaci rozkładu, bądź wartości parametrów rozkładu pewnej zmiennej losowej i która może być weryfikowana statystycznie, to znaczy w oparciu o wyniki zaobserwowane w próbie.
Testem statystycznym nazywamy każdą jednoznacznie zdefiniowaną regułę postępowania określającą warunki przy których należy weryfikowaną hipotezę przyjąć bądź odrzucić. Weryfikacja hipotez statystycznych odbywa się na podstawie wyników zaobserwowanych w próbie. W rezultacie test statystyczny podaje reguły, przy jakiego rodzaju wynikach próby sprawdzaną hipotezę się przyjmuje, a przy jakich odrzuca.
Weryfikowaną hipotezę nazywa się zwykle hipotezą zerową: H0 
D e cy z j a
Hipoteza H0 Przyjąć H0 Odrzucić H0
Jest prawdziwa Decyzja poprawna Błąd I rodzaju. Prawdopodobieństwo popełnienia tego błędu = 

Jest fałszywa Błąd II rodzaju Decyzja poprawna

Wartość prawdopodobieństwa popełnienia błędu I rodzaju - nazywamy poziomem istotności testu; najczęściej przyjmuje się = 0,05 , lub = 0,1.
Oprócz hipotezy zerowej formułujemy również hipotezę H1 ( hipotezę alternatywna), którą skłonni jesteśmy przyjąć, jeśli weryfikowaną hipotezę H0 należy odrzucić. 
Sprawdzian hipotezy jest to pewna funkcja wyników z próby, na podstawie której decydujemy, czy można hipotezę H0 przyjąć, czy odrzucić. Przez obszar krytyczny rozumie się taki zbiór wartości sprawdzianu hipotezy, że jeżeli zaobserwowana wartość sprawdzianu znajdzie się w tym obszarze, to odrzuca się hipotezę H0 na korzyść H1. Prawdopodobieństwo tego, że sprawdzian przyjmie wartość należącą do obszaru krytycznego, jest przy założeniu prawdziwości hipotezy H0 równe założonemu poziomowi istotności 


Przykład

Należy dokonać oceny partii pudelek zapalek liczącej 100 tys. sztuk. dostawca twierdzi, że w pudelku znajdują się przecietnie 54 zapalki. Zweryfikować hipotezę H0(m = m0 = 54). Ponieważ nie znamy rozkładu liczby zapałek w pudełkach w populacji generalnej, a mozemy łatwo pobrać próbę >= 30 możemy wieć w przybliżeniu skorzystać z rozkładu normalnego. Zkaldamy, że przy próbie o wielkości n = 100 odnotowano średnią arytmetyczną mn = 51,21 natomiast σn' = 2,54. Weryfikujemy przy poziomie istotności α = 0,02 ponieważ obraliśmy dużą próbę wiec \sigma_{M_n} \approx {{\sigma_n'} \over { \sqrt{n}}} = 0{,}245. Musimy zatem wyznaczyć t dla ktorego P \left ( {{|M_n-m_0|} \over {\sigma_{M_n}}} \ge t \right ) = 0{,}02
Definiujemy unormowaną zmienną Y:
Y={{M_n-m_0} \over {\sigma_{M_n}}}
podstawiamy do wzoru
P(|Y| \ge t) = 0{,}02
Z własności bezwzględnej wartości:
P[(Y \ge t) \vee (Y \le -t)] = 0{,}02
P(Y \ge t)+P(Y \le -t) = 0{,}02
Ponieważ funkcja gęstości jest dla rozkładu N(0,1) parzysta to zachodzi równość:
P(Y \ge t) = P(Y \le -t)
2P(Y \ge t) = 0{,}02
P(Y \ge t) = 0{,}01
Wiadomo, że P(A) to to samo co 1-P(A') więc:
1 − P(Y < t) = 0,01
P(Y < t) = 0,99
A P(Y<x) to dystrybuanta - czyli F(x):
F(t) = 0,99
Teraz w tablicy rozkładu normalnego znajdujemy najmniejszą wartość t dla której F(t) wynosi conajmniej 0,99. Jest to wartość 2,33.
Hipotezę H0 należy wiec odrzucić na poziomie istotności α jeżeli |M_n - 54| \ge t \cdot 0{,}245, w przeciwnym wypadku przy zadanej istotności α = 0,02 nie możemy ani potwierdzić hipotezy, ani jej odrzucić.
Zgodnie z naszymi danymi wychodzi:
| Mn − 54 | = | 51,21 − 54 | = 2,79
\sigma_{M_n} \cdot t = 0{,}245 \cdot 2{,}33 = 0{,}57085
Więc:
| M_n - 54 | \ge \sigma_{M_n} \cdot t
2{,}79 \ge 0{,}57085
Zatem hipotezę możemy odrzucić (jeśli wyjdzie odwrotnie to piszemy że nie odrzucamy ani nie potwierdzamy - tak właśnie trzeba było zrobić na egzaminie, bo wychodziło <).

Brak komentarzy:

Prześlij komentarz