Nauka o danych — percentyle statystyczne
25%, 50% i 75% - Percentyle
Percentyle są używane w statystykach, aby podać liczbę opisującą wartość, od której dany procent wartości jest niższy.
Spróbujmy to wyjaśnić na kilku przykładach, używając wartości Average_Pulse.
- 25% percentyl wartości Average_Pulse oznacza, że 25% wszystkich sesji treningowych ma średni puls 100 uderzeń na minutę lub mniej. Jeśli odwrócimy stwierdzenie, oznacza to, że 75% wszystkich sesji treningowych ma średni puls 100 uderzeń na minutę lub wyższy
- 75% percentyla wartości Average_Pulse oznacza, że 75% wszystkich sesji treningowych ma średni puls równy 111 lub niższy. Jeśli odwrócimy stwierdzenie, oznacza to, że 25% wszystkich sesji treningowych ma średni puls 111 uderzeń na minutę lub więcej
Zadanie: Znajdź 10% percentyl dla Max_Pulse
Poniższy przykład pokazuje, jak to zrobić w Pythonie:
Przykład
import numpy as np
Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
- Max_Pulse = full_health_data["Max_Pulse"] - Izoluje zmienną Max_Pulse z pełnego zestawu danych dotyczących zdrowia.
- np.percentile() służy do określenia, że chcemy mieć 10% percentyl z Max_Pulse.
10% percentyl Max_Pulse wynosi 120. Oznacza to, że 10% wszystkich sesji treningowych ma Max_Pulse 120 lub mniej.