Temat: Analiza statystyczna badanego zjawiska. Opracowanie wyników badań.
Statystyka – nauka zajmująca się zbieraniem, prezentowaniem, analizą i interpretacją danych
Przedmiotem badań statystycznych są zbiorowości statystyczne (populacje). Każda populacja składa się z jednostek statystycznych, zaś badana cecha to cecha statystyczna (populacja to np. wszyscy uczniowie szkoły)
Cecha statystyczna – właściwość charakterystyczna populacji, która podlega badaniu statystycznemu (np. średnia ocen końcoworocznych uczniów).
Cechy statystyczne mogą być:
- stałe, wspólne dla całej populacji (określają np. miejsce i czas badania)
- zmienne, określają właściwości różniące poszczególne jednostki statystyczne; cechy zmienne dzielą się na niemierzalne jak wykształcenie, płeć oraz mierzalne jak wzrost, średnia ocen
Statystyka dzieli się na:
- statystykę opisową – badanie zbiorowości statystycznej na podstawie obserwacji całkowitej, tzn. obejmującej wszystkie jednostki całej badanej populacji
- statystykę matematyczną – metody wnioskowania statystycznego (oparte na rachunku prawdopodobieństwa) o całej zbiorowości statystycznej na podstawie obserwacji tylko jej części, czyli próby;
wnioski, które wyciągane są na podstawie badania próby, uogólnia się na całą zbiorowość statystyczną, w statystyce matematycznej zbiorowość statystyczną przyjęło się nazywać populacją generalną
Zbiorowość generalna (populacja) – wszystkie elementy, będące przedmiotem badania, dla których formułowane są wnioski ogólne (np. wszyscy uczniowie szkoły)
Zbiorowość próbna (próba) – podzbiór populacji generalnej, obejmujący część jej elementów – wybranych w określony sposób (np. uczniowie klas maturalnych).
Próba podlega badaniu statystycznemu, a wynik jest uogólniany na zbiorowość generalną.
Miary statystyczne
1. Średnia arytmetyczna – x
Jest jednym z najważniejszych pojęć statystycznych służącym do opisu zbiorowości masowej. Należy do grupy miar klasycznych. Wartość średniej arytmetycznej to suma liczb podzielona przez ich liczbę.
gdzie:
x – średnia arytmetyczna
xi (x1, x2, … xn) – wartość kolejnej (i-tej) badanej zmiennej
n – liczebność badanej populacji
Przykład
Obliczyć średnią arytmetyczną dla liczb x1 = 5, x2 = – 2, x3 = 4, x4 = 10
x = (5 + (-2) + 4 + 10) / 4 = 17/4
2. Wariancja – σ2
Jest miarą tego, jak średnio poszczególne dane z populacji oddalone są od średniej z populacji.
Wariancja liczb x1, x2, …, xn to średnia arytmetyczna kwadratów odchyleń od ich średniej arytmetycznej.
Odchylenie (xi – x) to różnica pomiędzy danym wynikiem a średnią.
gdzie:
σ2 (sigma) – wariancja
x – średnia arytmetyczna
xi (x1, x2, … xn) – wartość kolejnej (i-tej) badanej zmiennej
n – liczebność badanej populacji
Przykład
Obliczyć wariancję dla liczb x1 = 4, x2 = – 3, x3 = 2
Najpierw należy obliczyć średnią arytmetyczną:
x = (4+ (- 3) +2) / 3 = 1
Wariancja wynosi:
3. Odchylenie standardowe – s
Jest to miara rozrzutu, która mówi jak bardzo badane wartości oddalone są od średniej arytmetycznej. Informuje więc o tym, jak wartości cechy (zmiennej) są rozrzucone wokół średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej, im mniejsze odchylenie tym mniejsze zróżnicowanie
lub czyli odchylenie standardowe jest równe pierwiastkowi z wariancji
gdzie:
s (sigma) – odchylenie standardowe
s2 – wariancja
x – średnia arytmetyczna
xi (x1, x2, …xn) – wartość kolejnej (i-tej) badanej zmiennej
n – liczebność badanej populacji
Przykład
Obliczyć odchylenie standardowe i wariancję dla liczb: 4, 9, 11, 13, 13.
Średnia wynosi x = (4 + 9 + 11 + 13 + 13) / 5 = 10
Odchylenie standardowe jest równe
Wariancja wynosi
Ćwiczenie 1.
W zakładzie produkującym cukier pakowaniem cukru do papierowych torebek kilogramowych (1kg) zajmuje się automat. W ramach kontroli, za pomocą specjalnej wagi, sprawdzono poprawność działania automatu dla pewnej ilości zapakowanych torebek cukru. Wyniki pomiarów zapisane są w pliku cukier.xlsx.
Pobierz ten plik na komputer, a następnie oblicz średnią wagę, wariancję i odchylenie standardowe.
Dane i wyniki obliczeń przedstaw na dwóch wykresach (wykresy umieść w tym samym arkuszu co dane):
Wykres1 – wyniki pomiarów i średnia; dodaj pod wykresem tabelę danych
Wykres2 – odchylenia od średniej