Funkcje nauki o danych


W tym rozdziale przedstawiono trzy często używane funkcje podczas pracy z Data Science: max(), min() i mean().


Zestaw danych zegarków sportowych

Czas trwania Średnia_impuls Max_Puls Kalorie_spalanie Godziny_Praca Godziny_Snu
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Powyższy zestaw danych składa się z 6 zmiennych, każda z 10 obserwacjami:

  • Czas trwania - Jak długo trwał trening w minutach?
  • Average_Pulse - Jaki był średni puls sesji treningowej? Jest to mierzone w uderzeniach na minutę
  • Max_Pulse - Jaki był maksymalny puls sesji treningowej?
  • Calorie_Burnage - Ile kalorii spalono podczas sesji treningowej?
  • Hours_Work - Ile godzin przepracowaliśmy w naszej pracy przed sesją szkoleniową?
  • Hours_Sleep - Ile spaliśmy w nocy przed sesją treningową?

Używamy podkreślenia (_) do oddzielania ciągów, ponieważ Python nie może odczytać spacji jako separatora.



Funkcja max()

Funkcja Python max()służy do znajdowania najwyższej wartości w tablicy.

Przykład

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

Funkcja min()

Funkcja Python min()służy do znajdowania najniższej wartości w tablicy.

Przykład

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

Funkcja mean()

Funkcja NumPy mean()służy do znalezienia średniej wartości tablicy.

Przykład

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Piszemy np. przed oznacza , aby poinformować Pythona, że ​​chcemy aktywować funkcję mean z biblioteki Numpy .