Nauka o danych — co to są dane?


Co to są dane?

Dane to zbiór informacji.

Jednym z celów Data Science jest uporządkowanie danych, dzięki czemu można je interpretować i łatwo z nimi pracować.

Dane można podzielić na dwie grupy:

  • Dane strukturalne
  • Dane nieustrukturyzowane

Dane nieustrukturyzowane

Nieuporządkowane dane nie są zorganizowane. Musimy uporządkować dane do celów analizy.

Dane nieustrukturyzowane

Dane nieustrukturyzowane


Dane strukturalne

Dane strukturalne są uporządkowane i łatwiejsze w obsłudze.

Dane strukturalne


Jak uporządkować dane?

Do strukturyzowania lub prezentacji danych możemy użyć tablicy lub tabeli bazy danych.

Przykład tablicy:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

Poniższy przykład pokazuje, jak utworzyć tablicę w Pythonie:

Przykład

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

W Data Science często pracuje się z bardzo dużymi zestawami danych.

W tym samouczku postaramy się maksymalnie ułatwić zrozumienie koncepcji Data Science. Dlatego będziemy pracować z małym zestawem danych, który jest łatwy do interpretacji.