Wróć do informacji o e-podręczniku Wydrukuj Pobierz materiał do PDF Pobierz materiał do EPUB Pobierz materiał do MOBI Zaloguj się, aby dodać do ulubionych Zaloguj się, aby skopiować i edytować materiał Zaloguj się, aby udostępnić materiał Zaloguj się, aby dodać całą stronę do teczki

Miary rozproszenia

Rozpatrzymy wyniki dwóch serii rzutów kostką do gry.

Seria 1

Seria 2

4, 4, 4, 4, 4

1, 3, 4, 6, 6

W obu przypadkach średnia arytmetyczna liczby wyrzuconych oczek jest równa 4. Mediana obu zestawu danych też jest równa i wynosi 4. Jednak oba te zestawy danych wyraźnie się różnią. Pierwszy zestaw nie jest zróżnicowany, a drugi – zróżnicowany. Widać więc, że zastosowanie miar tendencji centralnej nie opisuje dobrze różnic między tymi zestawami.

Aby więc analiza danych była pełniejsza, warto zastosować jeszcze charakterystyki zróżnicowania (rozproszenia) danych, zwane miarami rozproszenia (dyspersji). Miary te pozwalają na określenie, jak duże są różnice (odchylenia) między poszczególnymi wartościami jednostek zbiorowości, a ich wartością przeciętną (średnią).

Miara rozproszenia
Definicja: Miara rozproszenia

Miary rozproszenia (rozrzutu, zmienności, dyspersji) to miary charakteryzujące stopień zróżnicowania między sobą jednostek statystycznych pod względem badanej cechy.

Przykładowe miary rozproszenia to rozstęp, wariancja, odchylenie standardowe.

Rozstęp

Rozstęp jest miarą służącą do wstępnej analizy rozproszenia.

Rozstęp
Definicja: Rozstęp

Rozstępem (obszarem zmienności) nazywamy różnicę między największą a najmniejszą wartością cechy w szeregu statystycznym.

Rozstęp oznaczamy literą R.

R=xmax-xmin,

gdzie:
xmax – największa wartość cechy,
xmin – najmniejsza wartość cechy.

Przykład 1

W tabeli przedstawiono oceny z historii uzyskane przez Anię, Ewę i Julka.

Osoba

Oceny z historii

Ania

4, 5, 6, 4, 5, 4, 6

Ewa

3, 4, 4, 4, 4, 3, 3, 3

Julek

2, 1, 3, 4, 4, 4, 3, 5

R=64=2

R=43=1

R=51=4

Odchylenie przeciętne

Odchylenie od średniej
Definicja: Odchylenie od średniej

Odchyleniem wartości xi cechy statystycznej od średniej arytmetycznej x¯ nazywamy liczbę xi-x¯.

1
Przykład 2

Policzono ile bombek zawieszono na 4 choinkach stojących na Placu Ratuszowym. Otrzymano następujące wyniki: 126, 47, 24, 183.

Obliczymy średnią arytmetyczną liczby bombek i dla każdego wyniku podamy odchylenie od średniej liczb bombek.

Rozwiązanie:

Obliczamy średnią arytmetyczną:

x¯=126+47+24+1834=95

Obliczamy odchylenie od średniej.

Argumenty i Wartości

xi

126

47

24

183

xi-x¯

126-95=31

47-95=48

24-95=71

183-95=88

Wniosek:

Największe odchylenie od średniej jest w przypadku choinki, na której zawieszono 183 bombki.

Miarą rozproszenia, która uwzględnia wszystkie dane rozkładu (a nie poszczególne elementy – tak jak odchylenie od średniej), jest odchylenie przeciętne (średnie).

Odchylenie przeciętne
Definicja: Odchylenie przeciętne

Odchyleniem przeciętnym zestawu danych statystycznych x1, x2, , xn od ich średniej arytmetycznej x¯ nazywamy liczbę:

d=x1-x¯+x2-x¯++xn-x¯n
Przykład 3

Obliczymy odchylenie przeciętne dla zestawu danych z Przykładu 2.

d=31+48+71+884=59,560

Możemy powiedzieć, że liczby bombek na poszczególnych choinkach różnią się o ok. 60 od średniej dla wszystkich choinek.

Wariancja

Podstawową miarą zmienności obserwowanych wyników jest wariancja. Wariancja informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze danych – czy wyniki są bardziej czy mniej skoncentrowane wokół średniej.

Wariancja
Definicja: Wariancja

Wariancją zestawu danych statystycznych x1, x2, , xn nazywamy średnią arytmetyczną kwadratów odchyleń od ich średniej arytmetycznej x¯.

Wariancję oznaczamy symbolem σ2 (σ – sigma) i określamy wzorem:

σ2=x1-x¯2+x2-x¯2++xn-x¯2n
Przykład 4

W loterii fantowej wzięły udział 3 osoby. Każda wyciągnęła 10 losów. Pierwsza z osób wyciągnęła 4 losy pełne, druga 6, a trzecia 2. Obliczymy wariancję wyciagnięcia losów pełnych.

Obliczamy średnią arytmetyczną liczb: 4, 6, 2.

x¯=4+6+23=4

Obliczamy wariancję.

σ2=4-42+6-42+2-423=0+4+43=832,7

Wariancja jest równa w przybliżeniu 2,7.

Przykład 5

Obliczymy wariancję dla zestawu danych zapisanych w tabeli liczebności.

Argumenty i Wartości

Wartość xi cechy

2

4

6

10

Liczebność ni

2

5

1

2

Obliczamy średnią arytmetyczną.

x¯=2·2+4·5+6·1+10·22+5+1+2=4+20+6+2010=5

Obliczymy wariancję.

σ2=2·2-52+5·4-52+1·6-52+2·10-5210
σ2=2·9+5·1+1·1+2·2510=7410=7,4

Wariancjawariancja zestawu danych statystycznychWariancja dla podanego zestawu danych jest równa 7,4.

Przykład 6

Obliczymy rozstęp, średnią arytmetyczną, odchylenie przeciętne i wariancję dla zestawu danych: -4, 10, -1, 0, 5.

Rozwiązanie:

Zapisujemy dane w postaci uporządkowanego szeregu statystycznego.

xi

x1

x2

x3

x4

x5

-4

-1

0

5

10

Obliczamy rozstęp.

R=x5-x1=10--4=14

Obliczamy średnią arytmetyczną.

x¯=-4-1+0+5+105=2

Obliczamy odchylenie przeciętne.

d=-4-2+10-2+-1-2+0-2+5-25=6+8+3+2+35=4,4

Obliczamy wariancję.

σ2=-4-22+10-22+-1-22+0-22+5-225
σ2=62+82+32+22+325=1225=24,4

Na podstawie wartości uzyskanych parametrów zauważamy, że zróżnicowanie danych jest duże (różnica między wartością największą a najmniejszą to aż 14, wariancja to 24,4).

Słownik

wariancja zestawu danych statystycznych
wariancja zestawu danych statystycznych

średnia arytmetyczna kwadratów odchyleń od ich średniej arytmetycznej x¯