NLP

PRZETWARZANIE
JĘZYKA NATURALNEGO

START - luty 2024

KURS NLP | ONLINE | 6 tygodni

NLP

•6 tygodni

•prawdziwe dane

•100% praktyki

•najnowsza wiedza z NLP

•eksperementujesz na naszych serwerach

Poznaj najnowsze techniki pracy z tekstem i zostań specjalistą NLP. Najważniejsze biblioteki i architektury według aktualnych standardów w jednym miejscu.

Jeśli przynajmniej jedna z poniższych potrzeb jest Twoja,
to ten kurs jest dla Ciebie

  • Chcę zacząć korzystać z modeli do analizy tekstu, które dają lepsze wyniki niż klasyczne podejście.

  • Chcę ustrukturyzować dotychczasową wiedzę.

  • Chcę zrozumieć proces projektów NLP od początku do końca i wiedzieć, co i jak mogę optymalizować.

  • Chcę poznać nowoczesny proces i narzędzia NLP, które dostarczają dużą wartość przy minimalnym nakładzie pracy.

  • Interesuje mnie przede wszystkim praktyka, a nie sucha teoria.

  • Zbliża się projekt z NLP i potrzebuję wsparcia i praktycznych umiejętności.

  • Znam już podstawy ML & DS, chcę podnieść znacząco swoje komeptencje w branży.

  • Znam już podstawy ML & DS, chcę podnieść znacząco swoje komeptencje w branży.

Przetwarzanie Języka Naturalnego (NLP) od DataWorkshop to kurs, dzięki któremu zdobywasz nową specjalizację z branży Data Science i Machine Learning. To kurs, który przyśpiesza Twoją karierę zawodową i daje Ci nowe umiejętności, za które firmy chcą płacić.

W trakcie kursu poznasz...

  • Pojęcia ze świata NLP
    word, token, morpheme, lemma, stem, tag, chunk, corpus oraz podstawowe operacje (transformacje) dot. przygotowywania tekstu: tokenization, normalization, stemming, lemitization, part-of-speech tagging itd.
  • 7 najważniejszych bibliotek NLP w 2021
    Gensim, SpaCy, Flair, HuggingFace (Transformers, Tokenizer), Keras, Tensorflow, PyTorch.
  • Najważniejsze architektury w NLP
    BERT, RoBERTo, ELMO oraz word2vec, fasttext, glove.
  • Architektury do pracy z językiem polskim
    HerBERT, PolBERTa, Polish RoBERTa, Slavic BERT
  • Reprezentację wektorową (embeddings)
    co to jest, dlaczego jest bardzo pomocne i jak to rozwinęło się od pojawienia się pierwszego word2vec
  • Tokenizer
    Co to jest i jakie są najlepsze opcje zarówno jeśli chodzi o jakość, jak i wydajność.
  • Zbiory danych
    Dowiesz się, jakie są zbiory danych dla zadań NLP, na których są sprawdzane nowe modele.
  • Interpretowanie modeli
    Jakie są podejścia w obszarze interpretowania modeli w szczególności takich modeli, które są w 100% black-box.
  • Transfer wiedzy w NLP
    Czym jest, jakie otwiera możliwości i jak do tego można efektywnie podejść.
  • 6 bonusów
    to dodatkowe biblioteki, mniej oczywiste, ale wartościowe rozwiązania oraz dodatkowe obszary np. jak NLU (także przykłady użycia)
  • 100 zadań...
    do samodzielnego wykonania przez Ciebie - to praktyczny kurs ;)

  • Ponad 15 problemów biznesowych
    m.in. Twitter sentiment analysis, spam classifier, products review, hate speech, consumer complaint, language modeling, NER (rozpoznawanie jednostek nazywanych), Text summarization

Na tym kursie oszczędzasz czas

Nie musisz trenować dziesiątki czy nawet setki modeli, aby przeprowadzić szereg eksperymentów - już będziesz mieć dostęp do wytrenowanych modeli, a tak będzie - szybko sprawdzasz i uczysz się co działa, a co nie.
Nie musisz nic pobierać (zbiory danych w NLP zwykle to zawsze gigabajty, dziesiątki gigabajtów lub więcej x 100). Działasz online na naszych zasobach.

Nie musisz nic instalować - logujesz i działasz

NLP

i praca z tekstem

"Mimo tego, że są znane i dobre architektury, które fajnie działają, to nie jest tak, że zawsze architektura X jest najlepsza we wszystkim. To zależy od zadania i jeszcze innych czyników (np. procesu tokenizacji i innych parametrów). I to jest ważne! Chciałbym, aby dla Ciebie kurs był miejscem, gdzie wnikasz w szczególiki i przeprowadzasz fachowo szereg eksperymentów, a ja Ci w tym pomogę."

Vladimir Alekseichanko - autor kursu


Zaczniemy od samego początku.

Ten kurs to także miejsca na eksperymentowanie

Dla kogo jest ten kurs?

Naukowcy, PhD
Znasz już podstawy ML & DS lub nawet NLP, ale zależy Ci na praktycznych umiejętnościach? Dołącz.
Programiści
Znasz już podstawy ML & DS i interesuje Cię kierunek NLP, bo wiesz, prędzej czy później ten temat Cię dotknie zawodowo?
Dołącz.
ML / DS Specialist
Jesteś już w branży i chcesz wyspecjalizować się w kierunku NLP i pracy z tekstem lub masz takie wyzwania zawodowe przed sobą?
Dołącz koniecznie :)
Menadżerowie, CTO, CEO
Masz zaplecze techniczne, ale w tej chwili już nie zajmujesz się technologią wprost, ale zarządzasz zespołami, firmą, produktem?
Dołącz i przekonaj się, co możesz osiągnąć Twoja organizacja dzięki NLP
Ten kurs może bardzo Cię rozwinąć.

Jak to działa?

Startujemy 13 września!
Dołącz do kursu!
Kupić kurs możesz tutaj. Jeśli potrzebujesz faktury najpierw napisz na hello@dataworkshop.eu
Nie musisz niczego instalować
Logujesz się i działasz!
W dniu startu kursu otrzymujesz dane do logowania. Potrzebujesz jedynie przeglądarki, logujesz się, działasz, nie martwisz o zasoby.
6 modułów, 6 tygodni wsparcia
Działasz, kiedy chcesz!
Możesz uczyć się rano, wieczorem, w tygodniu lub w weekend, kiedy chcesz, ile chcesz, skąd chcesz. Przez aż 6 tygodni nasze środowisko jest dla Ciebie dostępne, po kursie otrzymujesz komplet materiałów. Autor kursu wspiera na żywo przez 6 tygodni.

Przebieg kursu

Teoria

Poza praktycznymi zadaniami i pracą z kodem poznasz niezbędne podstawy teoretyczne, które wzbogacą Twoją wiedzę z NLP.

Praktyka

Najpierw przyswajasz wiedzę, a potem sprawdzasz ją w praktyce. Każdy moduł zawiera praktyczne przykłady i zadania do rozwiązania. Mierzysz się z prawdziwymi danymi i wyzwaniami, które znajdziesz w projektach NLP.

Środowisko

Nie musisz niczego instalować. Przygotowaliśmy dla Ciebie środowisko Jupyter. Wraz ze startem kursu logujesz się na swoje konto i działasz bez zmartwień o zasoby i narzędzia.

Webinary

Po każdym module rozwiewamy wątpliwości. Dostaniesz odpowiedzi na swoje pytania, aby poznać popularne błędy i optymalne rozwiązania.

Wsparcie

Możesz na nas liczyć, wspieramy na każdym kroku. Poznajesz także innych uczestników - początkujących i specjalistów ML, którzy uczą się NLP razem z Tobą.

Konsultacje

Cotygodniowe, indywidualne konsultacje zapewnią Ci dodatkowe mocne wsparcie, jak również pomogą zrealizować własny projekt (pakiet Premium).

Agenda

  • Moduł 1

    • Pierwsze kroki w NLP;
    • Macierz cech w kontekście uczenia maszynowego i NLP;
    • Podstawowe pojęcia w NLP i zamiana tekstu w liczby;
    • Preprocessing - przygotowanie i normalizacja tekstu;
    • Analiza sentymentu i klasyfikacja dokumentów.
    1
  • Moduł 2

    • word2vec, doc2vec;
    • Implementacją przez word2vec z gensim;
    • Glove oraz fastext;
    • Keras i sieci neuronowe;
    • Będziemy trenować model oraz próbować re-użyć już gotowego.
    2
  • Moduł 3

    • Różnica pomiędzy zwykłymi sieciami (np. jednokierunkowe czy konwolucyjne) a sieciami rekurencyjnymi;
    • Szczególny przypadek sieci rekurencyjnej - LSTM;
    • Dowiesz się, jak te sieci mogą łączyć się pomiędzy sobą;
    • Reprezentacji wektorowej słów jak i zdań (modele ELMO i inne);
    • Biblioteka Keras.
    3
  • Moduł 4

    • Wprowadzenie do transformerów;
    • BERT - przygotowanie danych i prognozowanie;
    • Transfer wiedzy w NLP, jakie otwiera możliwości i jak do tego można efektywnie podejść;
    • Przydatne tokenizery w praktyce oraz zgłębienie konceptu BPE.
    4
  • Moduł 5

    • Dowiesz się, czym jest NER;
    • Wykorzystując już zdobytą wiedzę możesz rozwiązywać zadania typu NER;
    • Standardowe zbiory danych dla NER;
    • Metryki sukcesu dla NER;
    • Wprowadzenie do spaCy;
    Konkurs - twoja samodzielna praca do portfolio*
    Podczas każdej edycji dane i temat konkursu są inne. Dowiesz się, jaki będzie problem do rozwiązania podczas startu konkursu w trakcie kursu.
    5
  • Moduł 6

    • Poznasz nowe metody reprezentowania dużej ilości tekstu - modelowania tematów (ang. topic modeling);
    • Modelowanie tematów z wykorzystaniem reprezentacji wektorowej.
    • "Destylacja wiedzy" (ang. knowledge distillation) - czyli odchudzanie BERTa przy zachowaniu jakości ;)
    • Strategie wzbogacenia danych (ang. data augmentation);
    • Klasyfikacja z flair;
    • Trwa konkurs, czyli Twoja samodzielna praca nad portfolio i utrwalanie wiedzy w praktyce.
    6

Technologie, które będziemy wykorzystywać to...

Python

Jupyter

Spacy

Flair

Gensim

Keras

FastText

i inne...

nagrań wideo klarownie wyjaśniających zagadnienia NLP
notebooków z kodem i zagadnieniami z NLP w praktyce
Aż 1008 godzin eksperymentów na serwerze DataWorkshop = zero zmartwień o zasoby ;)
36
36
1008
Nasz kurs NLP to...

Co zyskujesz dzięki nauce NLP w DataWorkshop?

  • oszczędzasz czas = przefiltrowaliśmy już to, co musisz umieć w pracy z tekstem, jeśli chcesz zajmować się tym zawodowo

  • Twoja wiedza na temat Machine Learning wskoczy na kolejny poziom = wchodzisz na nowy zawodowy poziom

  • uczysz się według najnowszych trendów i standardów NLP = po kursie masz większą wiedzę na temat tego, co aktualnie działa najlepiej, niż wiele osób działających już w branży

  • nie będziesz powielać schematów działania, które działają słabo w NLP, ale wciąż są stosowane = zaczniesz świadomie stosować to, co daje dobre efekty

  • umiesz pracować z tekstem za pomocą technik NLP skutecznie i mądrze (działa bardzo dobrze przy minimalnym nakładzie pracy)

  • wytrenujesz kilkadziesiąt modeli i zrozumiesz, które z nich opłaca się stosować w konkretnych use case’ach

  • dowiesz się, jak możesz usprawnić swoją aktualną pracę

Dołącz i bądź na bieżąco z tym kursem i NLP

Dołączając do listy mailingowej osób zainteresowanych tym kursem otrzymasz w pierwszym mailu link do webinarium "5 standardów NLP w 2021 roku", a także będziesz otrzymywać regularnie informacje na temat tego kursu i zagadnień NLP.

5 standardów NLP,
które pomogą Ci efektywniej pracować z tekstem

Podziel się tym kursem ze znajomymi
Być może Twój kolega lub koleżanka już marzy o drodze ML.
Na co dzień współpracujemy z firmami pomagając im wdrożyć uczenie maszynowe, które sprawdza się w biznesie.
Podczas kursów dzielimy się z tobą tym, co sprawdza się w praktyce, a nie tylko w książkach.
Każdy nasz absolwent potwierdzi, że...
Mówimy wprost o trudnych rzeczach.
Wiedza od praktyka
Doświadczenie ma znaczenie...
-----
Jestem prezesem oraz założycielem spółki DataWorkshop, gdzie pomagamy firmom zacząć używać Machine Learning we właściwy sposób.
--------- ---- -----
500+ modeli wdrożonych na produkcję, które zarabiają na siebie
1000+ uczestników moich kursów
10000+ przeszkolonych osób w ramach innych inicjatyw online i offline .
--- --- -- -- --
Prowadzę podcast "Biznes Myśli" o sztucznej inteligencji w biznesie.

Wygłosiłem ponad 70 prezentacji.

Zacząłem programować w 2006 roku, a używać uczenia maszynowego w 2013. Jestem perfekcjonistą w sercu i pragmatykiem w umyśle.

Jestem ojcem i marzycielem, jak również podróżnikiem - dotychczas odwiedziłem 29 krajów.

Uwielbiam pomagać innym, analizować dane i stawiać czoła wszelkim wyzwaniom.
-- -- - - - ------
Przed prowadzeniem własnej działalności pracowałem przez 3 lata jako Architekt do projektowania systemu wyszukiwania milionów niestrukturyzowanych dokumentów rozproszonych po całym świecie (TB danych). Jeszcze przed tym pracowałem w startupie, gdzie używając uczenia maszynowego pomagałem usprawnić proces sprzedażowy. Projektowałem i implementowałem architekturę Big Data.
---- ---- --- --- - - -
Jestem aktywnym trenerem uczenia maszynowego. Przeprowadziłem ponad 30 szkoleń dla ponad 1000 uczestników. Moi absolwenci pracują w Google, IBM, Microsoft, Nokia, Intel, Oracle, Ryanair, Orange, Allegro, Sabre, ING Bank, Santander Bank, UBS Bank, AGH, Politechnika Krakowska, Uniwersytet Zielonogórski, Uniwersytet Lubelski i w wielu innych miejscach.
---- -- - - -------

Zapraszam na mój LinkedIn.
Opracowaliśmy dla Ciebie notebooki z kodem, gdzie masz krok po kroku wyjaśnione zagadnienia w teorii i praktyce - czytasz i odpalasz nasz kod, aby potem tę wiedzę przekuć we własne doświadczenie i samodzielnie zmierzyć się z podobnymi problemami na nowych zbiorach danych.
Zależy nam na Twoim doświadczeniu, a nie jedynie przejrzeniu materiałów wideo lub audio i przerobieniu kilku zadań domowych… To trochę za mało, aby zacząć wdrażać modele NLP w swoich projektach, prawda?
Na co dzień współpracujemy z firmami pomagając im wdrożyć uczenie maszynowe, które sprawdza się w biznesie.
Podczas kursów dzielimy się z tobą tym, co sprawdza się w praktyce, a nie tylko w książkach.
Każdy nasz absolwent potwierdzi, że...
Mówimy wprost o trudnych rzeczach.
Wiedza od praktyka
Doświadczenie ma znaczenie...
Udostępniamy Ci wszystkie materiały po kursie, a więc możesz z nich korzystać kiedy chcesz.
Aż 6 tygodni korzystasz z naszego środowiska, wsparcia grupy i trenujesz modele na naszych serwerach.

Wybierz pakiet kursu NLP

Kup również dla swojej Firmy. Wystawiamy Faktury VAT
GOLD
1 osoba

4420 PLN*

Co zawiera Pakiet
  • PAKIET BASIC +
  • Wskazanie optymalnych rozwiązań zadań domowych (1h webinar tygodniowo)
  • Dodatkowe wideo z tłumaczenie kodu (linijka po linijce) w zadaniach domowych
  • Dostęp do materiału z zadaniem bonusowym
  • Możliwość uczestnictwa w konkursie z nagrodami
  • Dostęp do materiałów kursu przez rok
  • Archiwum webinarów dostępne przez rok
  • Certyfikat po ukończeniu kursu
PREMIUM
1 osoba

10 701 PLN *

Co zawiera Pakiet
  • PAKIET GOLD +
  • Trening indywidualny przez cały czas trwania kursu - 6 godzin konsultacji (jedna godzina tygodniowo)
  • Indywidualne wsparcie i pomóc w usuwaniu blokad
  • Pomoc w rozwoju ścieżki kariery (przygotowanie się do rozmowy rekrutacyjnej)
  • Pomóc i inspiracja do realizowania własnych projektów
  • Możliwość wystawienia (uczciwej) opinii dla przyszłych pracodawców (ale trzeba się postarać, żeby była pozytywna, tylko zapłacić to za mało :)
NIEDOSTĘPNE
Kupujesz dla więcej niż jednej osoby?
Napisz do nas wiadomość, jeśli kupujesz kurs dla Zespołu lub potrzebujesz najpierw faktury, aby opłacić kurs w firmie.
cena brutto
cena brutto
6 tygodni
*Najniższa ceny w ciągu ostatnich 30 dni: 4420 zł.
*Najniższa ceny w ciągu ostatnich 30 dni: 10701 zł.
Co mówią o DataWorkshop?

Najczęściej zadawane pytania

Po ukończeniu kursu otrzymasz certyfikat*

* dotyczy pakietów Gold i Premium

Satysfakcja gwarantowana

lub zwrot pieniędzy (do 14 dni od rozpoczęcia kursu)!
Bardzo zależy mi na tym, żeby Ci pomóc, ale mam wystarczająco pokory i świadomości, że również jestem człowiekiem :). Zdaje sobie sprawę, że mogę pomóc tylko części ludzi, którym odpowiada moje podejście do nauki.

Jeżeli okażę się, że to podejście jest mało skuteczne dla Ciebie, to gwarantuję, że w takiej sytuacji, zwrócę Ci pieniędze. Masz 14 dni od rozpoczęcia kursu, żeby zdecydować się, czy Ci to odpowiada i będę wdzięczny za informację zwrotną.

Posłuchaj opinii absolwentów

Tyle edycji kursów zrealizowaliśmy w DataWorkshop
Tyle osób zaufało kursom DataWorkshop
Osób dają ★★★★★ (maks) za kurs DataWorkshop
20
>1000
9/10

Kursy DataWorkshop w liczbach

Darmowa konsultacja DataWorkshop

Pozwól nam Ci pomóc odnaleźć się w świecie ML.
Napisz swoją historię, aby można było lepiej wyczuć Twój kontekst. Wspólnie znajdziemy Twoją prywatną ścieżkę rozwoju.

Masz pytanie?

również możesz pisać na:
hello (małpa) dataworkshop.eu
ul. Mogilska 43
31-545 Kraków, Polska