1.17. TESTY PARAMETRYCZNE: ANALIZA WARIANCJI (ANOVA) (WPROWADZENIE DO STATYSTYKI PORÓWNAWCZEJ)

1.17. TESTY PARAMETRYCZNE: ANALIZA WARIANCJI (ANOVA) (WPROWADZENIE DO STATYSTYKI PORÓWNAWCZEJ)

W analizie statystycznej często mamy do czynienia z wieloma grupami lub kategoriami danych, których wyniki chcemy porównać. To może być różne leczenie w badaniach medycznych (np. 4 grupy pacjentów – każda leczona innym lekiem), różne grupy wiekowe w badaniach społecznych, lub różne warunki w eksperymencie. ANOVA (analiza wariancji) pozwala nam odpowiedzieć na pytanie, czy różnice między grupami są wynikiem rzeczywistych różnic czy też są efektem przypadku.

Analiza wariancji jako metoda parametryczna ma dwa założenia takie jak:

1. Homogeniczność wariancji – założenie to mówi, że wariancje w poszczególnych grupach są podobne. Oznacza to, że rozrzut danych w każdej grupie jest zbliżony.

2. Normalność rozkładu – dane w każdej grupie powinny mieć rozkład przybliżony do normalnego. Innymi słowy, dane nie powinny być skośne ani mocno nieliniowe.

O tym, jak to działa w praktyce, opisaliśmy w artykule „Rozkłady prawdopodobieństwa: Klucz do zrozumienia statystyki”.

3. Losowy wybór – obserwacje w każdej grupie powinny być losowe i niezależne od siebie.

Więcej na ten temat przeczytasz w naszych wpisach „Jak planować badania do pracy dyplomowej?”„Ocena jakości danych i ich wpływ na wyniki statystyczne w rozprawach doktorskich”.

Istnieje kilka różnych rodzajów testów ANOVA, z których każdy jest używany w określonych kontekstach. Najpopularniejsze rodzaje to:

1. Jednoczynnikowa ANOVA (one-way ANOVA) – to najprostsza forma ANOVA, używana do porównywania trzech lub więcej grup na podstawie jednego czynnika.

2. Dwuczynnikowa ANOVA (two-way ANOVA) – ta forma pozwala na porównywanie grup na podstawie dwóch różnych czynników, co pozwala na ocenę wpływu obu czynników i ich interakcji.

3. ANOVA z powtarzalnymi pomiarami (Repeated Measures ANOVA) – służy do oceny czy zmiany parametru w wielu punktach czasowych różnią się od siebie np. badamy, czy zastosowany lek działa na pacjentów i dokonujemy pomiarów po 1, 2, 3 i 4 tygodniach.

Nieodzownym elementem w analizie wariancji są testy post-hoc. Służą one do dokładnej oceny miedzy, którymi grupami (lub pomiarami) zaszła istotna statystycznie różnica. Szersze wyjaśnienie czym są testy post-hoc znajduje się w osobnym wpisie. Jeśli chcesz zgłębić tę kwestię, polecamy artykuły: „Testy post-hoc – uzupełnienie analizy wariancji”„Testy nieparametryczne: test Kruskala-Wallisa i test Friedmana”.

Przykład zastosowania analizy wariancji

Badacz podjął się oceny efektywności 3 leków (A, B, C) w obniżeniu poziomu cholesterolu. Wynik jednoczynnikowej analizy wariancji okazał się być istotny statystycznie (p wartość wyniosła 0,0021). Oznacza to, że przynajmniej pomiędzy jedną parą leków badany efekt jest istotnie różny statystycznie (A vs B, A vs C, B vs C). Na tym etapie należy użyć testu post-hoc. W przypadku tego badania, wyniki testów post-hoc wykazały, że uzyskano istotne statystycznie obniżenie poziomu cholesterolu w grupie leczonej lekiem A w porównaniu do grupy leczonej lekiem B. Co więcej pomiędzy pozostałymi grupami nie uzyskano istotnych statystycznie różnic (B vs C, A vs C).

Analiza wariancji to narzędzie, które pomaga w zrozumieniu, czy istnieją statystycznie istotne różnice między grupami, co może mieć znaczenie w badaniach naukowych.