Uczenie maszynowe — odchylenie standardowe
Co to jest odchylenie standardowe?
Odchylenie standardowe to liczba opisująca rozłożenie wartości.
Niskie odchylenie standardowe oznacza, że większość liczb jest zbliżona do wartości średniej (średniej).
Wysokie odchylenie standardowe oznacza, że wartości są rozłożone w szerszym zakresie.
Przykład: Tym razem zarejestrowaliśmy prędkość 7 samochodów:
speed = [86,87,88,86,87,85,86]
Odchylenie standardowe to:
0.9
Oznacza to, że większość wartości mieści się w przedziale 0,9 od średniej, która wynosi 86,4.
Zróbmy to samo z wyborem liczb o szerszym zakresie:
speed = [32,111,138,28,59,77,97]
Odchylenie standardowe to:
37.85
Oznacza to, że większość wartości mieści się w przedziale 37,85 od średniej, która wynosi 77,4.
Jak widać, wyższe odchylenie standardowe wskazuje, że wartości są rozłożone w szerszym zakresie.
Moduł NumPy posiada metodę obliczania odchylenia standardowego:
Przykład
Użyj std()
metody NumPy, aby znaleźć odchylenie standardowe:
import numpy
speed = [86,87,88,86,87,85,86]
x = numpy.std(speed)
print(x)
Przykład
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Zmienność
Wariancja to kolejna liczba, która wskazuje, jak rozłożone są wartości.
W rzeczywistości, jeśli wyciągniesz pierwiastek kwadratowy z wariancji, otrzymasz odchylenie standardowe!
Lub odwrotnie, jeśli pomnożysz odchylenie standardowe przez samo, otrzymasz wariancję!
Aby obliczyć wariancję, musisz wykonać następujące czynności:
1. Znajdź średnią:
(32+111+138+28+59+77+97) / 7 = 77.4
2. Dla każdej wartości: znajdź różnicę od średniej:
32 - 77.4 = -45.4
111 - 77.4 = 33.6
138
- 77.4 = 60.6
28 - 77.4 = -49.4
59 - 77.4 = -18.4
77
- 77.4 = - 0.4
97 - 77.4 = 19.6
3. Dla każdej różnicy: znajdź wartość kwadratową:
(-45.4)2 = 2061.16
(33.6)2 = 1128.96
(60.6)2 = 3672.36
(-49.4)2 = 2440.36
(-18.4)2 = 338.56
(- 0.4)2 = 0.16
(19.6)2 = 384.16
4. Wariancja to średnia liczba tych kwadratów różnic:
(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16)
/ 7 = 1432.2
Na szczęście NumPy ma metodę obliczania wariancji:
Przykład
Użyj var()
metody NumPy, aby znaleźć wariancję:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)
Odchylenie standardowe
Jak się dowiedzieliśmy, wzór na odchylenie standardowe to pierwiastek kwadratowy z wariancji:
√.1432.25 = 37.85
Lub, jak w poprzednim przykładzie, użyj NumPy do obliczenia odchylenia standardowego:
Przykład
Użyj std()
metody NumPy, aby znaleźć odchylenie standardowe:
import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)
Symbolika
Odchylenie standardowe jest często reprezentowane przez symbol Sigma: σ
Wariancja jest często reprezentowana przez symbol Sigma Square: σ 2
Podsumowanie rozdziału
Odchylenie standardowe i wariancja to terminy, które są często używane w uczeniu maszynowym, dlatego ważne jest, aby zrozumieć, jak je uzyskać i stojącą za nimi koncepcję.