Przeczytaj
Miary rozproszenia
Rozpatrzymy wyniki dwóch serii rzutów kostką do gry.
Seria 1 | Seria 2 |
---|---|
W obu przypadkach średnia arytmetyczna liczby wyrzuconych oczek jest równa . Mediana obu zestawu danych też jest równa i wynosi . Jednak oba te zestawy danych wyraźnie się różnią. Pierwszy zestaw nie jest zróżnicowany, a drugi – zróżnicowany. Widać więc, że zastosowanie miar tendencji centralnej nie opisuje dobrze różnic między tymi zestawami.
Aby więc analiza danych była pełniejsza, warto zastosować jeszcze charakterystyki zróżnicowania (rozproszenia) danych, zwane miarami rozproszenia (dyspersji). Miary te pozwalają na określenie, jak duże są różnice (odchylenia) między poszczególnymi wartościami jednostek zbiorowości, a ich wartością przeciętną (średnią).
Miary rozproszenia (rozrzutu, zmienności, dyspersji) to miary charakteryzujące stopień zróżnicowania między sobą jednostek statystycznych pod względem badanej cechy.
Przykładowe miary rozproszenia to rozstęp, wariancja, odchylenie standardowe.
Rozstęp
Rozstęp jest miarą służącą do wstępnej analizy rozproszenia.
Rozstępem (obszarem zmienności) nazywamy różnicę między największą a najmniejszą wartością cechy w szeregu statystycznym.
Rozstęp oznaczamy literą .
gdzie:
– największa wartość cechy,
– najmniejsza wartość cechy.
W tabeli przedstawiono oceny z historii uzyskane przez Anię, Ewę i Julka.
Osoba | Oceny z historii |
---|---|
Ania | |
Ewa | |
Julek |
Odchylenie przeciętne
Odchyleniem wartości cechy statystycznej od średniej arytmetycznej nazywamy liczbę .
Policzono ile bombek zawieszono na choinkach stojących na Placu Ratuszowym. Otrzymano następujące wyniki: , , , .
Obliczymy średnią arytmetyczną liczby bombek i dla każdego wyniku podamy odchylenie od średniej liczb bombek.
Rozwiązanie:
Obliczamy średnią arytmetyczną:
Obliczamy odchylenie od średniej.
Argumenty i Wartości | ||||
---|---|---|---|---|
Wniosek:
Największe odchylenie od średniej jest w przypadku choinki, na której zawieszono bombki.
Miarą rozproszenia, która uwzględnia wszystkie dane rozkładu (a nie poszczególne elementy – tak jak odchylenie od średniej), jest odchylenie przeciętne (średnie).
Odchyleniem przeciętnym zestawu danych statystycznych od ich średniej arytmetycznej nazywamy liczbę:
Obliczymy odchylenie przeciętne dla zestawu danych z Przykładu .
Możemy powiedzieć, że liczby bombek na poszczególnych choinkach różnią się o ok. od średniej dla wszystkich choinek.
Wariancja
Podstawową miarą zmienności obserwowanych wyników jest wariancja. Wariancja informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze danych – czy wyniki są bardziej czy mniej skoncentrowane wokół średniej.
Wariancją zestawu danych statystycznych nazywamy średnią arytmetyczną kwadratów odchyleń od ich średniej arytmetycznej .
Wariancję oznaczamy symbolem ( – sigma) i określamy wzorem:
W loterii fantowej wzięły udział osoby. Każda wyciągnęła losów. Pierwsza z osób wyciągnęła 4 losy pełne, druga , a trzecia . Obliczymy wariancję wyciagnięcia losów pełnych.
Obliczamy średnią arytmetyczną liczb: , , .
Obliczamy wariancję.
Wariancja jest równa w przybliżeniu .
Obliczymy wariancję dla zestawu danych zapisanych w tabeli liczebności.
Argumenty i Wartości | ||||
---|---|---|---|---|
Wartość cechy | ||||
Liczebność |
Obliczamy średnią arytmetyczną.
Obliczymy wariancję.
WariancjaWariancja dla podanego zestawu danych jest równa .
Obliczymy rozstęp, średnią arytmetyczną, odchylenie przeciętne i wariancję dla zestawu danych: , , , , .
Rozwiązanie:
Zapisujemy dane w postaci uporządkowanego szeregu statystycznego.
Obliczamy rozstęp.
Obliczamy średnią arytmetyczną.
Obliczamy odchylenie przeciętne.
Obliczamy wariancję.
Na podstawie wartości uzyskanych parametrów zauważamy, że zróżnicowanie danych jest duże (różnica między wartością największą a najmniejszą to aż , wariancja to ).
Słownik
średnia arytmetyczna kwadratów odchyleń od ich średniej arytmetycznej