thon
Hack outside the box
Kiedy: 19 - 23 kwietnia
Co w środku DWthon?
  • Dzień 1
    Cel: Wczytujesz i wstępnie analizujesz dane
    Zaczynamy od szybkiej rozgrzewki i wstępnej analizy tego, co mamy w naszych danych oraz zapoznania się z problemem, który chcemy rozwiązać.

    Technologie:  jupyter, python, pandas
  • Dzień 2
    Cel: Poznasz zasadę Pareto w praktyce i wyłaniasz grupę klientów i produktów, która generuje 80% wartości
    W tej lekcji uświadamiasz sobie, że taka reguła istnieje i możesz się o tym przekonać na konkretnych przykładach - doświadczając tego analizując dane! Wystarczy tylko wiedzieć, jak do tego podejść - właśnie tego cię nauczymy.

    Technologie: jupyter, python, pandas
  • Dzień 3
    Cel: Szukasz cech, które wyróżniają grupę top klientów i top produktów
    Opisujesz obiekty (produkty, klientów, zamówienia itd.) przy pomocy cech, które wyróżniają tę najważniejszą grupę. Dzięki temu możesz szybciej, łatwiej i efektywniej ustalić priorytety i zarządzać swoją pracą. Właśnie na tym nam zależy!

    Technologie: jupyter, python, pandas, matplotlib
  • Dzień 4
    Cel: Trenujesz modele - używasz machine learning w praktyce
    Najpierw poznasz drzewa decyzyjne, a następnie zastosujemy gradient boosting.
    Najważniejsze w tej lekcji jest to, aby udało Ci się wytrenować modele, nawet jeśli jest to dla Ciebie "black-box", czyli nie wiesz, co się dzieje w środku, ale wiesz, że udało się wytrenować i jaki jest tego efekt!

    Technologie: jupyter, python, pandas, DecisionTreeClassifier, sklearn.model_selection (walidacja modelu), gc do sprzątania w pamięci RAM
  • Dzień 5
    Cel: Doświadczasz tak zwanego "aha momentu" dzięki swojej pracy!
    Podglądamy model ML ;) Dzięki temu dowiadujesz się, które cechy są kluczowe wśród top klientów i produktów - możesz podejmować właściwe decyzje na podstawie danych.

    Technologie: jupyter, python, pandas, DecisionTreeClassifier, sklearn.model_selection, gc, xgboost, biblioteka eli5