Korelacja
Korelacja jest to miara współwystępowania dwóch
zmiennych. Mimo, iż stwierdzenie „miara związku między zmiennymi” brzmi
bardzo naukowo i poważnie, tak naprawdę z korelacją w
naszym codziennym życiu mamy do czynienia częściej niż nam się wydaje.
Któż z nas bowiem, nie słyszał narzekań typu: „kiedy wychodzi się z domu
bez parasola, to zaraz zaczyna padać deszcz”? Takie współwystępowanie
dwóch zmiennych: brak parasola- opad deszczu to właśnie jest korelacja.
Innym książkowym przykładem obrazującym współczynnik korelacji
jest stwierdzenie: „im ktoś jest wyższy, tym więcej waży”. Oczywiście,
już na pierwszy rzut oka, można zauważyć, iż w obu przywołanych
przykładach mamy do czynienia z odmienną skalą pomiarową, na której są
mierzone zmienne. W pierwszym przypadku (brak parasola- opad deszczu)
odwołujemy się do zmiennych nominalnych, w przypadku wagi i wzrostu
zmienne są mierzone na skali ilościowej. Dobór współczynnika korelacji zależy właśnie od tego na jakiej skali pomiarowej mierzone są analizowane zmienne.
Korelacja liniowa prosta (r Pearsona)
Współczynnik korelacji liniowej Pearsona (dalej nazywany po prostu współczynnikiem korelacji), wymaga, aby dwie zmienne zostały zmierzone co najmniej na skali przedziałowej. Określa on stopień "proporcjonalnych" powiązań wartości dwóch zmiennych. Wartość korelacji (współczynnik korelacji) nie zależy od jednostek miary, w jakich wyrażamy badane zmienne, np. korelacja pomiędzy wzrostem i ciężarem będzie taka sama bez względu na to, w jakich jednostkach (cale i funty czy centymetry i kilogramy) wyrazimy badane wielkości. Określenie proporcjonalne znaczy zależne liniowo, to znaczy, że korelacja jest silna, jeśli może być "opisana" przy pomocy linii prostej (nachylonej do góry lub na dół).
Nieliniowe powiązania pomiędzy zmiennymi
Innym potencjalnym źródłem problemów w przypadku stosowania korelacji liniowej (r Pearsona) jest kształt zależności. Odstępstwa od liniowości spowodują wzrost sumy kwadratów odchyleń od linii regresji, nawet jeśli reprezentują one "prawdziwy" i ścisły związek dwóch zmiennych. Okoliczność ta powoduje, że analizowanie wykresu rozrzutu jest niezbędnym elementem analizy przy obliczaniu korelacji.
Korelacje pozorne
Chociaż w oparciu o wartości współczynników korelacji nie można dowieść istnienia związku przyczynowego , to jednak można zidentyfikować tzw. korelacje pozorne; to znaczy korelacje, które powstają głównie w wyniku wpływu "innych" zmiennych. Na przykład nietrudno się domyślić, że istnieje korelacja pomiędzy wielkością strat związanych z pożarem a liczbą strażaków biorących udział w gaszeniu. Jednakże nie można z tego wyciągnąć wniosku, że jeśli wezwiemy mniej strażaków, to straty będą mniejsze. Decydujący wpływ ma tu trzecia zmienna (mianowicie wielkość pożaru), która ma decydujący wpływ zarówno na straty, jak i na liczbę strażaków. Jeślibyśmy byli w stanie "kontrolować" tę zmienną (to znaczy rozpatrywać jedynie pożary o ustalonej wielkości), wówczas korelacja wspomniana na wstępie albo w ogóle zniknie albo nawet może zmienić znak. Główny problem z korelacjami pozornymi jest taki, że w zasadzie nigdy nie wiemy, co jest tym "ukrytym" czynnikiem. Jeśli jednak znamy przyczynę, to wtedy możemy obliczyć korelacje cząstkowe, które uwzględniają (usuwają) wpływ określonych zmiennych.
Jak określić istotność różnic pomiędzy dwoma współczynnikami korelacji
Dostępny jest test sprawdzający istotność różnic pomiędzy dwoma współczynnikami korelacji w dwóch próbkach. Wynik tego testu zależy nie tylko od bezwzględnej wielkości różnicy tych współczynników, ale także od wielkości próbek, jak również od samych wartości tych współczynników. Zgodnie z wcześniej omawianą zasadą, im większa liczność próbki, tym mniejsze efekty można na jej podstawie wykryć. W ogólności, z powodu faktu, że wiarygodność współczynnika korelacji rośnie wraz z jego bezwzględną wartością to relatywnie małe różnice pomiędzy dużymi współczynnikami korelacji mogą być istotne. Na przykład różnica równa 0,10 może okazać się nieistotna w przypadku dwóch współczynników równych 0,15 i 0,25, a w takich samych próbkach będzie ona wysoce istotna, jeśli współczynniki są równe 0,80 i 0,90.
Korelacja Spearmana
pozwala sprawdzić czy pomiędzy dwiema zmiennymi istnieje związek (współzależność). Korelacja Spearmana należy do grupy testów nieparametrycznych, jej parametrycznym odpowiednikiem jest korelacja Pearsona. stosujemy ją najczęściej wtedy gdy nasze zmienne nie spełniają założeń testów parametrycznych takich jak normalność rozkładu oraz ilościowy charakter testowanych zmiennych.
Brak komentarzy:
Prześlij komentarz