thon
Hack outside the box
Kiedy: 19 - 23 kwietnia
Co w środku DWthon?
Dzień 1
Cel: Wczytujesz i wstępnie analizujesz dane
Zaczynamy od szybkiej rozgrzewki i wstępnej analizy tego, co mamy w naszych danych oraz zapoznania się z problemem, który chcemy rozwiązać.

Technologie:  jupyter, python, pandas
Dzień 2
Cel: Poznasz zasadę Pareto w praktyce i wyłaniasz grupę klientów i produktów, która generuje 80% wartości
W tej lekcji uświadamiasz sobie, że taka reguła istnieje i możesz się o tym przekonać na konkretnych przykładach - doświadczając tego analizując dane! Wystarczy tylko wiedzieć, jak do tego podejść - właśnie tego cię nauczymy.

Technologie: jupyter, python, pandas
Dzień 3
Cel: Szukasz cech, które wyróżniają grupę top klientów i top produktów
Opisujesz obiekty (produkty, klientów, zamówienia itd.) przy pomocy cech, które wyróżniają tę najważniejszą grupę. Dzięki temu możesz szybciej, łatwiej i efektywniej ustalić priorytety i zarządzać swoją pracą. Właśnie na tym nam zależy!

Technologie: jupyter, python, pandas, matplotlib
Dzień 4
Cel: Trenujesz modele - używasz machine learning w praktyce
Najpierw poznasz drzewa decyzyjne, a następnie zastosujemy gradient boosting.
Najważniejsze w tej lekcji jest to, aby udało Ci się wytrenować modele, nawet jeśli jest to dla Ciebie "black-box", czyli nie wiesz, co się dzieje w środku, ale wiesz, że udało się wytrenować i jaki jest tego efekt!

Technologie: jupyter, python, pandas, DecisionTreeClassifier, sklearn.model_selection (walidacja modelu), gc do sprzątania w pamięci RAM
Dzień 5
Cel: Doświadczasz tak zwanego "aha momentu" dzięki swojej pracy!
Podglądamy model ML ;) Dzięki temu dowiadujesz się, które cechy są kluczowe wśród top klientów i produktów - możesz podejmować właściwe decyzje na podstawie danych.

Technologie: jupyter, python, pandas, DecisionTreeClassifier, sklearn.model_selection, gc, xgboost, biblioteka eli5