Pandy - kreślenie



Konspiratorstwo

Pandy używa plot()metody do tworzenia diagramów.

Możemy użyć Pyplot, podmodułu biblioteki Matplotlib do wizualizacji diagramu na ekranie.

Przeczytaj więcej o Matplotlib w naszym samouczku Matplotlib .

Przykład

Importuj pyplot z Matplotlib i wizualizuj naszą DataFrame:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

W przykładach na tej stronie wykorzystano plik CSV o nazwie: „data.csv”.

Pobierz data.csv lub Otwórz data.csv


Wykres punktowy

Określ, że chcesz uzyskać wykres punktowy za pomocą kindargumentu:

kind = 'scatter'

Wykres punktowy wymaga osi X i Y.

W poniższym przykładzie użyjemy „Czas trwania” dla osi X i „Kalorii” dla osi Y.

Dołącz argumenty x i y w ten sposób:

x = 'Duration', y = 'Calories'

Przykład

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

Wynik

Pamiętaj: W poprzednim przykładzie dowiedzieliśmy się, że korelacja między „Czasem trwania” a „Kalorią” wynosi 0.922721, i doszliśmy do wniosku, że dłuższy czas trwania oznacza więcej spalonych kalorii.

Patrząc na wykres rozrzutu, zgadzam się.

Utwórzmy kolejny wykres rozrzutu, w którym występuje zła relacja między kolumnami, np. „Duration” i „Maxpulse”, z korelacją 0.009403:

Przykład

Wykres rozrzutu, w którym nie ma związku między kolumnami:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

Wynik


w3schools CERTIFIED . 2021

Zostać certyfikowanym!

Wypełnij moduły Pandy, wykonaj ćwiczenia, podejdź do egzaminu, a uzyskasz certyfikat w3schools!

ZAPISZ 10 USD

Histogram

Użyj kindargumentu, aby określić, że chcesz uzyskać histogram:

kind = 'hist'

Histogram wymaga tylko jednej kolumny.

Histogram pokazuje nam częstotliwość każdego interwału, np. ile treningów trwało od 50 do 60 minut?

W poniższym przykładzie użyjemy kolumny „Czas trwania” do utworzenia histogramu:

Przykład

df["Duration"].plot(kind = 'hist')

Wynik

Uwaga: histogram mówi nam, że było ponad 100 treningów, które trwały od 50 do 60 minut.


Sprawdź się za pomocą ćwiczeń

Ćwiczenie:

Wstaw poprawną składnię do wizualizacji danych w DataFrame jako diagramu (wykreślanie).

df.()