Nauka o danych - odchylenie standardowe statystyki
Odchylenie standardowe
Odchylenie standardowe to liczba opisująca rozłożenie obserwacji.
Funkcja matematyczna będzie miała trudności z przewidywaniem dokładnych wartości, jeśli obserwacje będą „rozłożone”. Odchylenie standardowe jest miarą niepewności.
Niskie odchylenie standardowe oznacza, że większość liczb jest zbliżona do wartości średniej (średniej).
Wysokie odchylenie standardowe oznacza, że wartości są rozłożone w szerszym zakresie.
Odchylenie standardowe jest często reprezentowane przez symbol Sigma: σ
Możemy użyć std()
funkcji z Numpy, aby znaleźć odchylenie standardowe zmiennej:
Przykład
import numpy as np
std = np.std(full_health_data)
print(std)
Wyjście:
Co oznaczają te liczby?
Współczynnik zmienności
Współczynnik zmienności służy do zorientowania się, jak duże jest odchylenie standardowe.
Matematycznie współczynnik zmienności definiuje się jako:
Coefficient of Variation = Standard Deviation / Mean
Możemy to zrobić w Pythonie, jeśli wykonamy następujący kod:
Przykład
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
Wyjście:
Widzimy, że zmienne Duration, Calorie_Burnage i Hours_Work mają wysokie odchylenie standardowe w porównaniu z parametrami Max_Pulse, Average_Pulse i Hours_Sleep.