Nauka o danych — wykreślanie funkcji liniowych
Zestaw danych zegarka sportowego
Spójrz na nasz zestaw danych dotyczących zdrowia:
Czas trwania | Średnia_impuls | Max_Puls | Kalorie_spalanie | Godziny_Praca | Godziny_Snu |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Wykreśl istniejące dane w Pythonie
Teraz możemy najpierw wykreślić wartości Average_Pulse względem Calorie_Burnage za pomocą biblioteki matplotlib.
Funkcja plot()
służy do wykonania heksagonalnego wykresu binningowego 2D punktów x,y:
Przykład
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Przykład wyjaśniony
- Zaimportuj moduł pyplot z biblioteki matplotlib
- Wykreśl dane z Average_Pulse względem Calorie_Burnage
kind='line'
mówi nam, jaki rodzaj fabuły chcemy. Tutaj chcemy mieć linię prostą- plt.ylim() i plt.xlim() mówią nam, od jakiej wartości chcemy, aby oś się zaczęła. Tutaj chcemy, aby oś zaczynała się od zera
- plt.show() pokazuje nam dane wyjściowe
Powyższy kod da następujący wynik:
Wynik w postaci wykresu
Jak widać, istnieje związek między Average_Pulse a Calorie_Burnage. Calorie_Burnage wzrasta proporcjonalnie do wartości Average_Pulse. Oznacza to, że możemy użyć wartości Average_Pulse do przewidzenia spalonych kalorii.
Dlaczego linia nie jest w pełni narysowana do osi y?
Powodem jest to, że nie mamy obserwacji, w których Average_Pulse lub Calorie_Burnage są równe zeru. 80 to pierwsza obserwacja Average_Pulse, a 240 to pierwsza obserwacja Calorie_Burnage.
Spójrz na linię. Co dzieje się ze spalaniem kalorii, jeśli średni puls wzrośnie z 80 do 90?
Możemy użyć linii ukośnej, aby znaleźć matematyczną funkcję do przewidywania spalania kalorii.
Jak się okazuje:
- Jeśli średni puls wynosi 80, spalanie kalorii wynosi 240
- Jeśli średni puls wynosi 90, spalanie kalorii wynosi 260
- Jeśli średni puls wynosi 100, spalanie kalorii wynosi 280
Jest wzór. Jeśli średni puls wzrośnie o 10, spalanie kalorii wzrośnie o 20.