Ramki danych Pandy
Co to jest ramka danych?
Pandas DataFrame to dwuwymiarowa struktura danych, taka jak dwuwymiarowa tablica lub tabela z wierszami i kolumnami.
Przykład
Utwórz prostą ramkę danych Pandas:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
Wynik
calories duration 0 420 50 1 380 40 2 390 45
Zlokalizuj wiersz
Jak widać z powyższego wyniku, DataFrame jest jak tabela z wierszami i kolumnami.
Pandy używają tego loc
atrybutu, aby zwrócić jeden lub więcej określonych wierszy
Przykład
Zwróć wiersz 0:
#refer to the row index:
print(df.loc[0])
Wynik
calories 420 duration 50 Name: 0, dtype: int64
Uwaga: ten przykład zwraca serię Pandas .
Przykład
Zwróć wiersz 0 i 1:
#use a list of indexes:
print(df.loc[[0, 1]])
Wynik
calories duration 0 420 50 1 380 40
Uwaga: w przypadku użycia []
, wynikiem jest Pandas DataFrame .
Zostać certyfikowanym!
ZAPISZ 10 USD
Nazwane indeksy
Za pomocą index
argumentu możesz nazwać własne indeksy.
Przykład
Dodaj listę nazw, aby nadać każdemu wierszowi nazwę:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
Wynik
calories duration day1 420 50 day2 380 40 day3 390 45
Znajdź nazwane indeksy
Użyj nazwanego indeksu w loc
atrybucie, aby zwrócić określone wiersze.
Przykład
Zwróć "dzień2":
#refer to the named index:
print(df.loc["day2"])
Wynik
calories 380 duration 40 Name: 0, dtype: int64
Załaduj pliki do DataFrame
Jeśli twoje zestawy danych są przechowywane w pliku, Pandy mogą je załadować do DataFrame.
Przykład
Załaduj plik rozdzielany przecinkami (plik CSV) do ramki DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Więcej o importowaniu plików dowiesz się w kolejnych rozdziałach.