Data Science — wprowadzenie do statystyki


Wprowadzenie do statystyki

Statystyka to nauka o analizowaniu danych.

Kiedy stworzyliśmy model do predykcji, musimy ocenić wiarygodność predykcji.

W końcu, jaka jest wartość przepowiedni, jeśli nie możemy na niej polegać?


Opisowe statystyki

Najpierw omówimy kilka podstawowych statystyk opisowych.

Statystyki opisowe podsumowują ważne cechy zbioru danych, takie jak:

  • Liczyć
  • Suma
  • Odchylenie standardowe
  • Percentyl
  • Przeciętny
  • Itp..

To dobry punkt wyjścia do zapoznania się z danymi.

Możemy użyć describe()funkcji w Pythonie do podsumowania danych:

Przykład

print (full_health_data.describe())

Wyjście:

Statystyka Opis

Czy widzisz tu coś ciekawego?