Metryki sukcesu, walidacja modelu, wizualizacja i modele drzewiaste
Poznasz
✅ dlaczego wizualizacja jest Twoim przyjacielem i poznasz proste wskazówki, jak to robić i jakie pakiety są najczęściej stosowane (matplotlib, seaborn)
✅ dlaczego metryka sukcesu jest "latarnią morską" w uczeniu maszynowym
✅ jakie metryki sukcesu są najczęściej stosowane i dla jakich typów modeli (klasyfikacja i regresja)
✅ dlaczego walidacja modeli jest tak ważna, poznasz je rodzaje w tym walidacja krzyżowa (ang. cross validation)
✅ co to jest underfitting vs. overfitting, i jak zdiagnozować przeuczenie się przy pomocy krzywej uczenia się (ang. learning curve)
✅ poznasz kolejne modele ML wykorzystując bibliotekę sklearn tym razem skupimy się na algorytmach drzewiastych w tym bagging: (DecisionTreeClassifier, RandomForestClassifier, ExtraTreesClassifier)
✅ przyjazny dla użytkownika dynamiczny sposób zmiany zawartości wykresów za pomocą ipywidgets, bez konieczności tworzenia dużej liczby tego samego typu linii kodu
🎁 bonus (recenzja jednego z przydatnych pakietów Pythona - plotly)
Zadania
1️⃣ klasyfikacja binarna: prognozowanie zarobków (ponad 50 tys. lub mniej)
2️⃣ klasyfikacja multi-label: prognozowanie rodzaju ziemie
Wynik
Po przejściu przez ten moduł nauczysz się poprawnie interpretować metryki oceny modeli w celu podejmowania właściwych decyzji. A wiedzę na temat wizualizacji możesz natychmiast zastosować do dowolnych swoich danych, bez konieczności kupowania i instalowania innych programów.