Nauczanie maszynowe
Uczenie maszynowe sprawia, że komputer uczy się na podstawie analizy danych i statystyk.
Machine Learning to krok w kierunku sztucznej inteligencji (AI).
Uczenie maszynowe to program, który analizuje dane i uczy się przewidywać wynik.
Gdzie zacząć?
W tym samouczku wrócimy do matematyki i nauki statystyki oraz do tego, jak obliczać ważne liczby na podstawie zbiorów danych.
Dowiemy się również, jak korzystać z różnych modułów Pythona, aby uzyskać potrzebne nam odpowiedzi.
I dowiemy się, jak tworzyć funkcje, które są w stanie przewidzieć wynik na podstawie tego, czego się nauczyliśmy.
Zbiór danych
W umyśle komputera zbiór danych to dowolny zbiór danych. Może to być wszystko, od tablicy do kompletnej bazy danych.
Przykład tablicy:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Przykład bazy danych:
Nazwa samochodu | Kolor | Wiek | Prędkość | AutoPass |
BMW | czerwony | 5 | 99 | Y |
Volvo | czarny | 7 | 86 | Y |
VW | szary | 8 | 87 | n |
VW | biały | 7 | 88 | Y |
Bród | biały | 2 | 111 | Y |
VW | biały | 17 | 86 | Y |
Tesla | czerwony | 2 | 103 | Y |
BMW | czarny | 9 | 87 | Y |
Volvo | szary | 4 | 94 | n |
Bród | biały | 11 | 78 | n |
Toyota | szary | 12 | 77 | n |
VW | biały | 9 | 85 | n |
Toyota | niebieski | 6 | 86 | Y |
Patrząc na tablicę możemy się domyślić, że średnia wartość to prawdopodobnie około 80 lub 90, a także jesteśmy w stanie określić wartość najwyższą i wartość najniższą, ale co jeszcze możemy zrobić?
A patrząc na bazę danych widzimy, że najpopularniejszym kolorem jest biały, a najstarszy samochód ma 17 lat, ale co by było, gdybyśmy mogli przewidzieć, czy samochód ma AutoPass, po prostu patrząc na inne wartości?
Do tego służy uczenie maszynowe! Analizowanie danych i przewidywanie wyniku!
W uczeniu maszynowym często pracuje się z bardzo dużymi zestawami danych. W tym samouczku postaramy się jak najłatwiej zrozumieć różne koncepcje uczenia maszynowego i będziemy pracować z małymi, łatwymi do zrozumienia zestawami danych.
Typy danych
Aby analizować dane, ważne jest, aby wiedzieć, z jakim typem danych mamy do czynienia.
Możemy podzielić typy danych na trzy główne kategorie:
- Liczbowy
- Kategoryczny
- Porządkowy
Dane liczbowe są liczbami i można je podzielić na dwie kategorie liczbowe:
- Dane dyskretne
— liczby ograniczone do liczb całkowitych. Przykład: liczba przejeżdżających samochodów. - Dane ciągłe
- liczby o nieskończonej wartości. Przykład: cena przedmiotu lub rozmiar przedmiotu
Dane kategoryczne to wartości, których nie można ze sobą zmierzyć. Przykład: wartość koloru lub dowolne wartości tak/nie.
Dane porządkowe są jak dane kategoryczne, ale można je ze sobą porównywać. Przykład: oceny szkolne, w których A jest lepsze niż B i tak dalej.
Znając typ danych swojego źródła danych, będziesz mógł wiedzieć, jakiej techniki użyć podczas ich analizy.
Więcej o statystykach i analizie danych dowiesz się w kolejnych rozdziałach.