Nauka o danych — percentyle statystyczne


25%, 50% i 75% - Percentyle

Percentyle są używane w statystykach, aby podać liczbę opisującą wartość, od której dany procent wartości jest niższy.

Centyle

Spróbujmy to wyjaśnić na kilku przykładach, używając wartości Average_Pulse.

  • 25% percentyl wartości Average_Pulse oznacza, że ​​25% wszystkich sesji treningowych ma średni puls 100 uderzeń na minutę lub mniej. Jeśli odwrócimy stwierdzenie, oznacza to, że 75% wszystkich sesji treningowych ma średni puls 100 uderzeń na minutę lub wyższy
  • 75% percentyla wartości Average_Pulse oznacza, że ​​75% wszystkich sesji treningowych ma średni puls równy 111 lub niższy. Jeśli odwrócimy stwierdzenie, oznacza to, że 25% wszystkich sesji treningowych ma średni puls 111 uderzeń na minutę lub więcej

Zadanie: Znajdź 10% percentyl dla Max_Pulse

Poniższy przykład pokazuje, jak to zrobić w Pythonie:

Przykład

import numpy as np

Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
  • Max_Pulse = full_health_data["Max_Pulse"] - Izoluje zmienną Max_Pulse z pełnego zestawu danych dotyczących zdrowia.
  • np.percentile() służy do określenia, że ​​chcemy mieć 10% percentyl z Max_Pulse.

10% percentyl Max_Pulse wynosi 120. Oznacza to, że 10% wszystkich sesji treningowych ma Max_Pulse 120 lub mniej.