Nauka o danych — co to są dane?
Co to są dane?
Dane to zbiór informacji.
Jednym z celów Data Science jest uporządkowanie danych, dzięki czemu można je interpretować i łatwo z nimi pracować.
Dane można podzielić na dwie grupy:
- Dane strukturalne
- Dane nieustrukturyzowane
Dane nieustrukturyzowane
Nieuporządkowane dane nie są zorganizowane. Musimy uporządkować dane do celów analizy.
Dane strukturalne
Dane strukturalne są uporządkowane i łatwiejsze w obsłudze.
Jak uporządkować dane?
Do strukturyzowania lub prezentacji danych możemy użyć tablicy lub tabeli bazy danych.
Przykład tablicy:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
Poniższy przykład pokazuje, jak utworzyć tablicę w Pythonie:
Przykład
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
W Data Science często pracuje się z bardzo dużymi zestawami danych.
W tym samouczku postaramy się maksymalnie ułatwić zrozumienie koncepcji Data Science. Dlatego będziemy pracować z małym zestawem danych, który jest łatwy do interpretacji.