Funkcje nauki o danych
W tym rozdziale przedstawiono trzy często używane funkcje podczas pracy z Data Science: max(), min() i mean().
Zestaw danych zegarków sportowych
Czas trwania | Średnia_impuls | Max_Puls | Kalorie_spalanie | Godziny_Praca | Godziny_Snu |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Powyższy zestaw danych składa się z 6 zmiennych, każda z 10 obserwacjami:
- Czas trwania - Jak długo trwał trening w minutach?
- Average_Pulse - Jaki był średni puls sesji treningowej? Jest to mierzone w uderzeniach na minutę
- Max_Pulse - Jaki był maksymalny puls sesji treningowej?
- Calorie_Burnage - Ile kalorii spalono podczas sesji treningowej?
- Hours_Work - Ile godzin przepracowaliśmy w naszej pracy przed sesją szkoleniową?
- Hours_Sleep - Ile spaliśmy w nocy przed sesją treningową?
Używamy podkreślenia (_) do oddzielania ciągów, ponieważ Python nie może odczytać spacji jako separatora.
Funkcja max()
Funkcja Python max()
służy do znajdowania najwyższej wartości w tablicy.
Przykład
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
Funkcja min()
Funkcja Python min()
służy do znajdowania najniższej wartości w tablicy.
Przykład
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
Funkcja mean()
Funkcja NumPy mean()
służy do znalezienia średniej wartości tablicy.
Przykład
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
Piszemy np. przed oznacza , aby poinformować Pythona, że chcemy aktywować funkcję mean z biblioteki Numpy .