Data Science — wprowadzenie do statystyki
Wprowadzenie do statystyki
Statystyka to nauka o analizowaniu danych.
Kiedy stworzyliśmy model do predykcji, musimy ocenić wiarygodność predykcji.
W końcu, jaka jest wartość przepowiedni, jeśli nie możemy na niej polegać?
Opisowe statystyki
Najpierw omówimy kilka podstawowych statystyk opisowych.
Statystyki opisowe podsumowują ważne cechy zbioru danych, takie jak:
- Liczyć
- Suma
- Odchylenie standardowe
- Percentyl
- Przeciętny
- Itp..
To dobry punkt wyjścia do zapoznania się z danymi.
Możemy użyć describe()
funkcji w Pythonie do podsumowania danych:
Przykład
print (full_health_data.describe())
Wyjście:
Czy widzisz tu coś ciekawego?