Analityczne metody statystyczne analizy danych: obliczanie średniej, wariancji, mediany, rozstępu międzykwartylowego, sporządzanie histogramu, wykresu ramkowego, obliczanie średniej obciętej i ocena własności rozkładu.

Dodano: 15.01.2024 22:16:51

Rozwiązanie

Rozwiązanie tego zadania składa się z kilku kroków, które opiszę po kolei:

  1. Obliczenie średniej – jest to suma wszystkich wartości podzielona przez ich liczbę.
  2. Obliczenie wariancji – miara rozproszenia danych, czyli średnia kwadratów odchyleń każdej wartości od średniej.
  3. Obliczenie mediany – wartość środkowa danych po ich uporządkowaniu.
  4. Obliczenie rozstępu międzykwartylowego – różnica między trzecim a pierwszym kwartylem danych.
  5. Sporządzenie histogramu – graficzna reprezentacja rozkładu danych.
  6. Wykres ramkowy – inaczej wykres pudełkowy, pokazuje medianę, kwartyle i wartości ekstremalne.
  7. Obliczenie średniej obciętej – średnia, z której usunięto skrajne wartości, w tym przypadku po 15% z każdej strony.
  8. Ocena własności rozkładu – opis jednomodalności, skośności oraz spłaszczenia rozkładu.

Rozpocznijmy od obliczenia średniej. W tym celu sumujemy wszystkie wartości i dzielimy przez ich liczbę. Należy także zauważyć, że dane są nieco nieczytelne, więc nie będę w stanie dokładnie przeprowadzić wszystkich wyliczeń. Zamiast tego przedstawię schemat obliczeń:

sˊrednia=wszystkie wartosˊciliczba wszystkich wartosˊci\text{średnia} = \frac{\sum \text{wszystkie wartości}}{\text{liczba wszystkich wartości}}

Następnie obliczamy wariancję. Wariancja dla próby jest dana wzorem:

wariancja=(xisˊrednia)2n1\text{wariancja} = \frac{\sum (x_i - \text{średnia})^2}{n - 1}

gdzie xix_i to i-ta wartość, a nn to liczba wartości.

Mediana to wartość środkowa w uporządkowanym zbiorze danych. Jeśli liczba wartości jest nieparzysta, mediana jest środkową wartością. Jeśli liczba wartości jest parzysta, mediana jest średnią dwóch środkowych wartości.

Rozstęp międzykwartylowy obliczamy jako różnicę między trzecim a pierwszym kwartylem danych. Kwartyly to wartości dzielące uporządkowany zbiór danych na cztery równe części.

Histogram sporządzamy, grupując wartości w przedziały i rysując dla każdego przedziału słupki reprezentujące liczbę wartości w tym przedziale.

Wykres ramkowy tworzymy, zaznaczając medianę, pierwszy i trzeci kwartyl oraz ewentualne wartości odstające.

Średnia obcięta jest średnią, z której usunięto skrajne wartości, w tym przypadku po 15% z każdej strony. Aby to zrobić, usuwamy 15% najmniejszych i 15% największych wartości, a następnie obliczamy średnią z pozostałych wartości.

Własności rozkładu, takie jak jednomodalność, skośność i spłaszczenie, oceniamy na podstawie wykresów oraz obliczeń takich jak współczynnik skośności i kurtozy, ale bez konkretnych danych nie jestem w stanie dokonać tych ocen.

Ponieważ nie jestem w stanie przeczytać wszystkich wartości z obrazka, nie mogę przeprowadzić dokładnych obliczeń, ale powyższy opis pokazuje, jak należy podejść do rozwiązania tego zadania krok po kroku.

Pomagamy rozwiązywać zadania w 30 sekund

Pierwsze zadanie za darmo. Zarejestruj się i zobacz jak to działa.

Zarejestruj się