1.20. RANGOWANIE DANYCH

1.20. RANGOWANIE DANYCH

Rangowanie danych to proces przypisywania kolejnym obserwacjom w zbiorze danych unikalnych rang lub pozycji w uporządkowanych wartościach. Każda obserwacja otrzymuje rangę w zależności od swojej pozycji w porządku rosnącym lub malejącym wartości. Rangowanie danych jest często używane w statystyce, zwłaszcza przy stosowaniu testów nieparametrycznych, takich jak Test U Manna-Whitneya, Test Wilcoxona czy Test Kruskala-Wallisa. Zapraszamy do lektury naszego wpisu „Testy nieparametryczne w analizie statystycznej: krótki przegląd”.

Proces rangowania danych można wyjaśnić za pomocą kilku kluczowych punktów:

1. Sortowanie danych to pierwszy krok w rangowaniu danych, który polega uporządkowanie ich według wartości. Możemy to zrobić w porządku rosnącym (od najniższej do najwyższej wartości) lub malejącym (od najwyższej do najniższej wartości).

2. Przypisanie rang obserwacjom w uporządkowanych danych. Pierwsza obserwacja otrzymuje rangę 1, druga obserwacja otrzymuje rangę 2, i tak dalej. Jeśli dwie obserwacje mają taką samą wartość, otrzymają tę samą rangę, która będzie średnią rangą dla tych obserwacji.

3. Wartości rang mogą być teraz używane, jako nowe dane do analizy statystycznej. Wartości rang są przydatne w testach nieparametrycznych, które porównują rangi między grupami lub próbkami danych.

Zastosowanie rangowania danych:

Rangowanie danych jest często stosowane w sytuacjach, gdy nie możemy przyjąć założenia o normalności rozkładu danych lub gdy mamy dane w skali porządkowej, a nie ilościowej. Poniżej przedstawiamy kilka przykładów zastosowania rangowania danych:

1. Test U Manna-Whitneya porównuje rangi dwóch niezależnych grup danych, aby stwierdzić, czy istnieją istotne statystycznie różnice między nimi. Zapraszamy do lektury naszego wpisu „Testy nieparametryczne: test Manna-Whitneya i test Wilcoxona”, gdzie omawiamy ten temat bardziej szczegółowo.

2. Test Wilcoxona jest używany do porównywania rang dwóch powiązanych grup danych, aby ocenić, czy interwencja miała wpływ na wyniki.

3. Test Kruskala-Wallisa porównuje rangi trzech lub więcej niezależnych grup danych, aby sprawdzić, czy istnieją istotne statystycznie różnice między nimi. Aby dowiedzieć się więcej, sprawdź nasz artykuł poświęcony temu zagadnieniu: „Testy nieparametryczne: test Kruskala-Wallisa i test Friedmana”.

4. Test Friedmana to odpowiednik testu ANOVA dla powtarzalnych pomiarów. Porównuje rangi trzech lub więcej powiązanych grup.

Rangowanie danych pozwala przekształcić dane ilościowe lub porządkowe w formę, która może być używana w testach nieparametrycznych. Jest to szczególnie przydatne w przypadkach, gdy standardowe testy parametryczne nie są odpowiednie ze względu na założenia dotyczące rozkładu danych.