Nauka o danych - odchylenie standardowe statystyki


Odchylenie standardowe

Odchylenie standardowe to liczba opisująca rozłożenie obserwacji.

Odchylenie standardowe

Funkcja matematyczna będzie miała trudności z przewidywaniem dokładnych wartości, jeśli obserwacje będą „rozłożone”. Odchylenie standardowe jest miarą niepewności.

Niskie odchylenie standardowe oznacza, że ​​większość liczb jest zbliżona do wartości średniej (średniej).

Wysokie odchylenie standardowe oznacza, że ​​wartości są rozłożone w szerszym zakresie.

Odchylenie standardowe jest często reprezentowane przez symbol Sigma: σ

Możemy użyć std()funkcji z Numpy, aby znaleźć odchylenie standardowe zmiennej:

Przykład

import numpy as np

std = np.std(full_health_data)
print(std)

Wyjście:

Odchylenie standardowe

Co oznaczają te liczby?


Współczynnik zmienności

Współczynnik zmienności służy do zorientowania się, jak duże jest odchylenie standardowe.

Matematycznie współczynnik zmienności definiuje się jako:

Coefficient of Variation = Standard Deviation / Mean

 Możemy to zrobić w Pythonie, jeśli wykonamy następujący kod:

Przykład

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

Wyjście:

Współczynnik zmienności

Widzimy, że zmienne Duration, Calorie_Burnage i Hours_Work mają wysokie odchylenie standardowe w porównaniu z parametrami Max_Pulse, Average_Pulse i Hours_Sleep.