Wróć do informacji o e-podręczniku Wydrukuj Pobierz materiał do EPUB Pobierz materiał do MOBI Zaloguj się, aby dodać do ulubionych Zaloguj się, aby skopiować i edytować materiał Zaloguj się, aby udostępnić materiał Zaloguj się, aby dodać całą stronę do teczki

Warto przeczytać

Powtórzmy najbardziej ogólną definicję histogramu; mówi ona, że histogram to wykres o specyficznych osiach.

Oś odciętych (oś pozioma)

Specyfika osi odciętych histogramu polega na tym, że przedstawione są na niej przedziały liczbowe, a nie pojedyncze liczby. Te przedziały pełnią rolę argumentów funkcji (też specyficznej), którą obrazujemy za pomocą histogramu. 
Rys. 1. pokazuje oś odciętych histogramu, na którym przedstawiono rozkład długości skoków z pierwszej serii zawodów narciarskich Pucharu Świata na Wielkiej Krokwi, rozegranych 25 stycznia 2020 r.

R1PrliOuOCEJq
Rys. 1. Oś pozioma histogramu zawiera długości skoków narciarskich. Przedstawiono na niej trzynaście przedziałów o szerokości trzech metrów każdy

Dziedziną tego histogramu jest zbiór trzynastu przedziałów. Mają one jednakową szerokość, po trzy metry. Zakres histogramu - od 105 m do 144 m - odpowiada rozpiętości długości skoków oddanych przez zawodników. Najkrótszy skok to 105,5 m, najdłuższy to 140 m. 
Przedziały te umieszczone są w nieprzypadkowej kolejności i mają wspólne granice.

Ciekawostka

Oś odciętych histogramu nie musi zawierać przedziałów liczbowych. Może zawierać kategorie (często używana nazwa) niebędące zmiennymi ilościowymiZmienna ilościowazmiennymi ilościowymi. Przykład: histogram rozkładu kolorów oczu mógłby na osi odciętych zawierać pięć takich kategorii: szare, piwne, zielone, brązowe, niebieskie. Bez trudu uzupełnisz zbiór tych kategorii o inne znane kolory oczu. Kolejność ich umieszczenia na osi nie ma w takim przypadku znaczenia.

W fizyce najczęściej stosujemy histogramy rozkładu wielkości mierzalnych, a zatem możliwych do ujęcia w postaci liczb mianowanych i przedstawienia na osi z zachowaniem porządku, zgodnie z jej kierunkiem.

Jak w każdym wykresie, oś odciętych histogramu opisujemy nazwą lub symbolem przedstawianej zmiennej oraz jej jednostką.

Oś rzędnych (oś pionowa)

Specyfika osi rzędnych histogramu polega na tym, że przedstawione są na niej liczby całkowite. Mówią nam one, ile razy w zbiorze danych pojawiła się wartość należąca do każdego z przedziałów, pokazanych w dziedzinie histogramu. 
Rys. 2. pokazuje oś rzędnych histogramu tego samego rozkładu skoków, o którym już była mowa.

R1FbR5K6NXsZY
Rys. 2. Oś pionowa histogramu długości skoków narciarskich. Przedstawiono na niej skalę liczby zliczeń, od zera do 25

Przy tak dobranej skali histogram jest „przygotowany” na sytuację, w której maksymalnie 25 zawodników oddało skoki o długości mieszczących się w jednym z przedziałów. Można też odczytać, że w pierwszym przedziale, <105 m; 108 m) - czyli od 105 m (włącznie) do 108 m (wyłącznie) - pojawił się tylko jeden skok. Mówimy, że w tym przedziale pojawiło się jedno zliczenie.

Ciekawostka

Oś rzędnych histogramu może też być wyskalowana w procentach. Każdemu przedziałowi przypisuje się wtedy nie liczbę wyników (zliczeń) w tym przedziale, lecz stosunek tej liczby do wszystkich wyników, jakie mamy w serii danych. Stosunek ten wyrażany jest w procentach.
Ten sposób przedstawiania osi rzędnych zbliża histogram do opisu rozkładu prawdopodobieństwa wystąpienia zdarzenia, opisanego na osi odciętych. Wtedy określenia „liczba wyników (w przedziale)” czy „liczba zliczeń (w przedziale)” zastępujemy określeniami „częstotliwość występowania (w przedziale)” lub „prawdopodobieństwo wystąpienia (w przedziale)”. 
Jak widzisz, zależnie od zastosowania histogramu, używane są dla jego opisu bardzo różne nazwy.

Podsumujmy, co zrobiliśmy. Cały zakres długości skoków pierwszej serii, obejmujący skok najkrótszy (105,5 m) i najdłuższy (140 m) podzieliliśmy na równe przedziały (po 3 m), a następnie wyliczyliśmy, ile skoków znalazło się w każdym przedziale. 
Na tej podstawie utworzyliśmy wykres, w którym na osi poziomej są kolejne przedziały długości skoków, a na pionowej - liczby skoków w tych przedziałach. 
Taki wykres, przedstawiony na Rys. 3., to właśnie histogram.

R1Fn2rBSQb6OV
Rys. 3. Histogram rozkładu długości 50 skoków narciarskich w trzynastu trzymetrowych przedziałach
Dobór szerokości przedziałów i ich liczby

To umiejętność, która przychodzi waz z doświadczeniem. Przepis jest prosty: przedziały zbyt szerokie - zbyt mała ich liczba -  nie pozwalają rozpoznać nawet podstawowych cech zbioru danych. Można by rzec, że wkładamy wtedy do jednej szufladki wyniki nazbyt różne. 
Ale przedziały zbyt wąskie - jest ich wtedy za dużo - też nie prowadzą do przejrzystego obrazu. Tu ryzykujemy, że zbliżone wyniki trafią do różnych szufladek, a każda z nich będzie stanowiła oddzielną „kategorię”. 
Przyjrzyj się raz jeszcze histogramowi pokazującemu rozkład skoków (Rys. 3.). Łatwo znajdziesz pięć nazw dla poszczególnych przedziałów; uzupełnij taką listę: „outsiderzy”, ... , ... , ... ,”czołówka”. Możesz więc przypuszczać, że odbiorca Twego histogramu też sobie wyobrazi takie nazwy. Czy zadowala Cię pięć kategorii? Uważasz, że powinno ich być mniej? Więcej? Co o tym pomyśli Twój odbiorca? To Twój histogram, Ty ponosisz za niego odpowiedzialność, więc do Ciebie należy wybór szerokości i liczby przedziałów.

Nabierz odrobinę doświadczenia.

Polecam Ci metodę prób i błędów. Przejrzyj pięć wersji tego samego histogramu, przedstawione na Rys. 4a. Różnią się one liczbą przedziałów oraz ich szerokością. Określ samodzielnie, z którego histogramu najlepiej odczytujesz odpowiedzi na takie pytania:

  • Na ile najlepszy skoczek jest lepszy od pozostałych? Czy walka o podium była zacięta, czy jeden zawodnik zdeklasował wszystkich pozostałych?

  • Gdzie sytuuje się najliczniejsza grupa wyników? Blisko wyników lepszych, pośrodku, czy bliżej wyników gorszych? Żargonowo mówimy, że „rozkład wyników może być symetryczny albo asymetryczny”.

  • A może są dwie grupy wyników dalekich od siebie, stosunkowo licznie reprezentowanych? Żargonowo o takiej sytuacji mówimy, że „rozkład jest dwugarbny”.

  • A może odwrotnie: nie ma żadnej grupy wyników zauważalnie częściej występującej niż inne? Żargonowo w takiej sytuacji mówimy, że „rozkład jest płaski”.

  • A może zależy Ci na wyeksponowaniu innej właściwości rozkładu długości skoków?

RJci0GYHNyjU2
3 przedziały opis WCAG, 5 przedziałów opis WCAG, 9 przedziałów opis WCAG, 12 przedziałów opis WCAG, 18 przedziałów opis WCAG
Rys. 4a. Pięć wersji histogramu rozkładu długości skoków w pierwszej serii
Nabierz więcej doświadczenia.

Tym razem Twoim celem jest zaprezentowanie rozkładu wyników 2. serii skoków w tych samych zawodach, na tle wyników serii pierwszej. Zastanów się, jakie różnice należy uwypuklić i dobierz do tego odpowiednią parę histogramów spośród zaproponowanych w Rys. 4b.
A może dojdziesz do wniosku, że lepiej byłoby przedstawić te wyniki za pomocą innej organizacji histogramów?

RfHKJ8xAcK7kF
Tytuł nagłówka Treść
Rys. 4b. Pary histogramów obrazujące rozkład długości skoków w pierwszej oraz drugiej serii. W tej ostatniej startowało jedynie 30 zawodników, najlepszych po serii pierwszej
Histogram jest narzędziem uniwersalnym, stosowanym nie tylko w fizyce.

Z pomocą histogramów możemy przedstawić graficznie bardzo wiele różnych rozkładów i uzyskać z nich bardzo ciekawe informacje. Weźmy za przykład histogram ocen z fizyki w Twojej klasie. Od razu dowiesz się, gdzie jest Twoje miejsce, czy w czołówce, czy w ogonie? A czy w analogicznym histogramie, ale z polskiego albo historii jest podobnie? Klasa jest rzeczywiście bardzo dobrym przykładem do konstruowania ciekawych histogramów. Można skonstruować histogram wzrostu uczniów, ale można też histogram spóźnień na lekcje, czy nieobecności. To samo można zrobić dla innej klasy. Uogólniając, widzisz, że w ten sposób można uzyskać bardzo ciekawy obraz funkcjonowania szkoły.

Przykład

Przyjmijmy, że dwie klasy, 1A i 1B, o tym samym profilu, w tej samej szkole średniej, uzyskały na koniec roku jednakową średnią ocen dla ucznia: 4,00. To niezły wynik. Czy klasy te są pod tym względem jednakowe? Chciałoby się powiedzieć, że tak. Przyjrzyj się jednak histogramom rozkładu średniej ocen w każdej z klas (Rys. 5.). Czy rzeczywiście klasy te są podobne w kwestii wyników w nauce? Czy nauczycieli oraz wychowawców tych klas czeka taka sama praca z uczniami w klasie drugiej?

R1RUwmnnxvgzm
Rys. 5a. Rozkład średnich ocen uzyskanych przez uczniów w klasie 1A
RMGpiyqbOnToy
Rys. 5b. Rozkład średnich ocen uzyskanych przez uczniów w klasie 1B
R1YCEEez79HlH
Rys. 5c. Oba powyższe histogramy na jednym rysunku są łatwiejsze do porównania
R1K0NR7SR5ODh
Rys. 5d. Rozkład średnich dla obu klas przedstawiony na jednym histogramie

Inne przykłady

Zakłady transportu miejskiego mogą uzyskiwać informacje o rozkładach czasu jazdy autobusów czy tramwajów w różnych porach dnia i roku, na poszczególnych liniach. Mogą w ten sposób zorientować się, kiedy i jak „rozciągają się” czasy jazdy i odpowiednio zareagować, wprowadzając modyfikacje w rozkładach jazdy i trasach kursowania pojazdów. Podobnie można zrobić dla kolei, analizując wielkości opóźnień.

Histogramy świetnie nadają się do zilustrowania zmian klimatycznych. Mogą przedstawiać, dla kolejnych lat, liczbę dni z określonym poziomem zachmurzenia, z określonym poziomem opadów atmosferycznych, z określoną temperaturą itp.

Histogram, w każdej niemal dziedzinie życia, może dostarczyć ciekawych informacji, niedostępnych w inny sposób. Czy potrafisz wymyślić zastosowanie histogramu w dziedzinie pozornie odległej od badań ilościowych, np. w językoznawstwie czy literaturoznawstwie?

Słowniczek

Histogram
Histogram

(ang: histogram) rodzaj wykresu słupkowego, w którym: 
- oś odciętych zawiera przedziały wartości pewnej wielkości (cechy statystycznejCecha statystycznacechy statystycznej), 
- oś rzędnych zawiera liczby informujące, ile razy wielkość ta przyjmowała wartości z danego przedziału.
z j. greckiego: histos - maszt; z końcówką '-gram', oznaczającą zapis, rysunek.

Cecha statystyczna
Cecha statystyczna

(ang: statistical feature) to właściwość danego zbioru statystycznego. Zmienne cechy statystyczne rozróżniające jednostki tego zbioru, przedstawia się w rozkładzie empirycznymRozkład empirycznyrozkładzie empirycznym. Wyróżnić można wiele rodzajów cech: mierzalne albo niemierzalne, ciągłe albo skokowe, rzeczowe, czasowe itd.

Rozkład empiryczny
Rozkład empiryczny

(ang: empirical distribution) to opis wartości przyjmowanych przez daną cechę statystyczną i określany w postaci częstości występowania tych wartości. Jedną z form prezentowania rozkładu empirycznego jest histogramHistogramhistogram.

Zmienna ilościowa
Zmienna ilościowa

(ang: quantitative variable) to zmienna, której cechy możemy opisać w postaci liczbowej.