Start 21 kwietnia | 3 dni | działasz swoim tempem

W 3 dni zbudujesz Mapę Wiedzy z kontrolą jakości - zabierz wyniki ze sobą. 7 spółek z GPW. 1400+ tabel finansowych. Bielik. Graf. GitHub + Obsidian.

RAG pod lupą

największy stress test w Polsce

Vladimir
Alekseichenko

10 000+

alumni DataWorkshop
uczymy AI od 2016 r.

Dołącz teraz

Poznaj co w środku

DWthon | Software 3.0

Zero Instalacji. 100% praktyki

Start: 21 kwietnia | 3 dni | Działasz w swoim rytmie

Po 3 dniach otworzysz Obsidian i
zobaczysz swoją bazę wiedzy.

❌ Nie slajdy.
❌ Nie notatki z wykładu.
✅ Graf wiedzy z realnych sprawozdań finansowych - z metadanymi, powiązaniami i źródłami.
✅ Na Twoim GitHubie. Pod Twoją kontrolą.

Rozwijasz go dalej na własnych danych. To zostaje z Tobą długo po tym, jak DWthon się skończy.

Co otrzymujesz od nas na start?

1M tokenów w pakiecie

Potężna pula na Twoje eksperymenty (bez dopłat).

DataWorkshop Lab

Zero instalacji. Gotowe środowisko chmurowe. Wchodzisz i działasz.

Realna wiedza

1400+ tabel finansowych z GPW.
7 spółek. Realne sprawozdania za 2023. PDF, Markdown, JSON - gotowe do pracy.

Realny wpływ

Po 3 dniach otworzysz Obsidian i
zobaczysz swoją bazę wiedzy.

Cel DWthon: Zmierzyć się z najtrudniejszym zadaniem w RAG - tym, które wszyscy omijają

Budowanie reprezentacji wiedzy jest trudne. Model się myli. Tabele mają niuanse. Struktura się psuje.

Właśnie dlatego większość szła na skróty: chunking, baza wektorowa i szukanie narzędzia, które "zrobi to za mnie" - LangChain, kolejny framework, cokolwiek modnego w tym tygodniu.

Na DWthonie podejdziesz do tego świadomie. W 3 dni nie staniesz się ekspertem - ale zobaczysz, gdzie naprawdę leży różnica między demo a produkcją.

Twoja Mapa Wiedzy - zabierasz ze sobą

Pobierz z GitHuba. Otwórz w Obsidianie.

Zobacz graf wiedzy z metadanymi, powiązaniami i źródłami.

Rozwijaj dalej - na własnych danych, kiedy chcesz, ile chcesz.

Dlatego post Karpathy'ego zebrał 18 milionów wyświetleń: ludzie zobaczyli, że to jest namacalne.

U nas też - ale z kontrolą jakości.

Dobry moment, aby dołączyć do wyzwania! Start za...

Dni

Godzin

Minut

Sekond

Dołącz teraz

"Problem → Struktura → Moc"

DZIEŃ 1:
Problem + Koncept + Setup

→ Eksperyment: chunking tabeli finansowej - zobacz, co model dostaje (i dlaczego odpowiada bzdury)
→ Software 3.0: 7 poziomów autonomii AI - czym jest Poziom 3 i dlaczego naiwny RAG to za mało
→ Czym jest Mapa Wiedzy - i czym nie jest (nie prompt, nie baza wektorowa - system sterowania)
→ Setup: GitHub (prywatne repo) + Obsidian + DataWorkshop Lab
→ Pierwszy test: Bielik + Structured Output → kontrolowany opis tabeli → plik Markdown → Obsidian

Po dniu 1: widzisz problem na własne oczy. Masz skonfigurowane narzędzia. Wiesz, co i po co budujesz.

Dzień 1 zaczyna się od bólu (naiwny RAG psuje dane).

Dzień 2 rozwiązuje problem (Structured Output + organizacja).

Dzień 3 pokazuje moc (retrieval + chat z pełnym zbiorem).

→ Źródła → artykuły: jak zamienić surowe sprawozdanie w ustrukturyzowane artykuły z powiązaniami
→ Structured Output: Ty definiujesz schemat → model go wypełnia → Ty walidujesz wynik
→ Masz wpływ na strukturę: co trafia do artykułu, jakie metadane, jakie powiązania
→ Audytowalność: źródło, confidence, data - każdy artykuł da się prześledzić do oryginału
→ Jakość żyje: mechanizmy lint i walidacji - bo Mapa Wiedzy musi być aktualna i spójna
→ Uruchamiasz pipeline. Vladimir odpala na pełnym zbiorze na noc.

Po dniu 2: Twoja Mapa Wiedzy rośnie. Rozumiesz każdy element. Kontrolujesz jakość. Pełny zbiór się przetwarza.

DZIEŃ 2:
Organizacja wiedzy - od źródeł do audytowalnej Mapy

DZIEŃ 3:
Retrieval + Chat - moc Mapy Wiedzy

→ Pełna Mapa gotowa: 7 spółek, 1400+ tabel, artykuły z powiązaniami
→ Retrieval: wyszukujesz informację w Mapie - nie w losowych chunkach
→ Kontekst + prompt → odpowiedź z odniesieniem do źródła
→ Chat z danymi: budujesz własne rozwiązanie zamiast polegać na narzędziach, które nie radzą sobie z dużymi plikami
→ Stress-test: 2000+ ludzi porównuje wyniki i podejścia
→ Mapa na GitHubie: pobierasz, otwierasz w Obsidianie, edytujesz, rozwijasz na własnych danych
→ Most do Praktycznego LLM: masz Mapę → teraz potrzebujesz systemu

Po dniu 3: pełna Mapa Wiedzy - Twoja, na GitHubie, w Obsidianie. Rozmawiasz z nią. Rozwijasz ją. Kontrolujesz.

Mapa Wiedzy - fundament,
którego brakuje w 90% systemów RAG

Gdy większość rynku sprzedawała naiwny RAG oparty o przypadkowe chunki i bazy wektorowe, my w DataWorkshop Lab pracowaliśmy nad czymś ważniejszym:

✅ Dlaczego naiwny chunking niszczy dane - tabela finansowa rozerwana na 3 fragmenty traci sens. Nagłówki znikają, wiersze się rwą, model dostaje śmieciowy kontekst. I odpowiada bzdury.

✅ Jak reprezentować dane, zanim trafią do retrievalu - LLM opisuje, klasyfikuje i strukturyzuje dane NA WEJŚCIU, nie na etapie pytania. To zmienia wszystko.

✅ Czym jest Mapa Wiedzy - tekstowa, audytowalna, hierarchiczna instrukcja, która mówi modelowi JAK nawigować po złożonej rzeczywistości. Nie prompt. Nie baza wektorowa. System sterowania.

✅ Jak zbudować retrieval, który naprawdę działa - pytanie rozbite na etapy, kontekst budowany z referencjami do źródeł, audytowalna odpowiedź. Firmy jak Mastercard mówią wprost: knowledge drift, retrieval decay, irrelevant chunks i brak ewaluacji to cztery jeźdźcy apokalipsy RAG na produkcji. Mapa Wiedzy adresuje każdy z nich u fundamentu.

Karpathy'ego wiki w Obsidianie? To jeden wariant Mapy Wiedzy.

PageIndex tree index? To inny wariant Mapy Wiedzy.

Claude Code CLAUDE.md? To jeszcze inny wariant Mapy Wiedzy.

Różne formy. Ten sam rdzeń.

My uczymy fundamentów. Konkretne realizacje przychodzą i odchodzą. Na DWthon #3 zbudujesz swoją Mapę Wiedzy na realnych danych finansowych. I zobaczysz różnicę na własne oczy.

"Czy dam radę?"
Plan jest taki...

Każdego dnia będzie nowe zadanie. Ale..

Masz całą dobę, aby je wykonać – to od Ciebie zależy, kiedy działasz (rano, w ciągu dnia czy wieczorem).

Warto założyć co najmniej 1 godzinę dziennie, aby wyrobić się z materiałem.

Dla kogo jest DWthon? Czy to Ty?

TAK, jeśli:

→ Budujesz lub planujesz system RAG i chcesz uniknąć błędów, które popełnia 90% rynku

→ Podejmujesz decyzje o AI w firmie i musisz wiedzieć, co jest realne, a co marketing

→ Jesteś w IT (dev, PM, architekt, team lead) i chcesz zrozumieć RAG od fundamentów

→ Jesteś praktykiem spoza IT (finansista, analityk, prawnik) i pracujesz z dokumentami

→ Masz wewnętrzną motywację, żeby się zanurzyć

→ Szukasz kolejnego kursu, który "obejrzysz i zapomnisz"

→ Oczekujesz, że AI zrobi wszystko za Ciebie

→ Chcesz kolejny tutorial o LangChain + Pinecone - tego tu nie ma

→ Chcesz tylko "posmakować hype" - tu działamy na pełnych obrotach

NIE, jeśli:

Większość szkoleń uczy narzędzi, które za chwilę się zmienią. Problem nie jest w Tobie.
Problem jest w tym, czego Cię uczą. My uczymy paradygmatu, który zostanie.

W DataWorkshop nie bawimy się w AI.

Zobaczysz, jak to działa od kuchni. I podejmiesz decyzję samodzielnie.

Zajmujemy się machine learningiem od ponad 10 lat.

Pokazujemy to, o czym inni milczą: jak zbudować AI na solidnym fundamencie i mieć nad nim własną kontrolę.

Dołącz teraz

Poznaj swojego mentora

Praktyczne doświadczenie w uczeniu maszynowym – 10 lat, w programowaniu – 15 lat;

Potrafi tłumaczyć skomplikowane pojęcia z matematyki, statystyki i programowania w prosty sposób, używając przykładów z życia i funkcjonowania biznesu;

Wiele modele uczenia maszynowego wdrożonych do produkcji;

CEO i założyciel DataWorkshop;

Konsultuje i wspiera przy wdrażaniu duże i małe firmy (Fortune 500 i inne) w praktycznym podejściu do uczenia maszynowego;

Autor 7 praktycznych kursów: LLM, Python, ML/DS od podstaw, statystyka SQL, NLP, szeregi czasowe;

Regularny prelegent i twórca międzynarodowej konferencji DWCC poświęconej uczeniu maszynowemu i sztucznej inteligencji.;

Twórca wiele inicjatyw i warsztatów z uczenia maszynowego dla dziesiątki tysięcy ludzi: "Korona wyzwań", "Matryca", "DWgym", "DWthon", "DWTools", "DWChampions".

Prowadzi podcast Biznes Myśli (> 500 000 odsłuchań).

Twórca autorskich kursów ML/AI
CEO DataWorkshop

Vladimir Alekseichenko

Mocne strony:

Kreatywne podejście,
Krytyczne myślenie,
Zdolność inspirowania uczniów i wzmacniania ich wiary we własne siły,
Umiejętność skierowania na właściwą drogę w celu rozwiązania postawionych zadań.

Chcę dołączyć do nauki teraz!

⏳ Liczba miejsc ograniczona pojemnością infrastruktury!

190 PLN

Chcesz najpierw spróbować?

Dostęp na 3 dni (21-23 kwietnia).
DataWorkshop Lab.
Tokeny. Materiały + Slack.

Dostęp do DWthon (podstawowy)

Dołącz

490 PLN

Dostęp na 30 dni - nie 3, trzydzieści dni!

Pracujesz we własnym tempie.
~200 modeli LLM w tym najnowsze.
Więcej tokenów na eksperymenty.

🎁 DODATKOWO - Nagrania szkolenia R w RAG

🎁 DODATKOWO - Cenę odliczasz od kursu Praktyczny LLM lub Agentic AI - to nie koszt, to zaliczka na rozwój

PREMIUM dostęp do DWthon

Wybieram Premium

Zero Instalacji. 100% praktyki

Start: 21 kwietnia | 3 dni | Działasz w swoim rytmie

Na koniec warsztatu dostaniesz certyfikat

Dla uczestników, którzy ukończyli co najmniej 80% zadań

Zapisz się

SOFTWARE 3.0 TAXONOMY - 7 LEVELS

Mamy plan Twojego rozwoju...

PHASE 1: FOUNDATION

PHASE 2: CONNECTED AI

by DATAWORKSHOP ^(R)

Conversational AI
Podstawowy prompting, interfejs UI - człowiek prowadzi dialog ręcznie

ChatGPT

Prompt design

Zero-code

Programmable AI
API, Structured output, inteligentny RPA - kod steruje modelem AI

REST API

Pydantic

JSON output

Contextual AI
Pamięć, narzędzia, działania kontekstowe - Stateful Agent z długoterminową pamięcią

Warstwy pamięci

MCP tools

Stateful

Integrated AI
RAG, systemy hybrydowe - AI podłączony do danych organizacji

RAG

Vector DB

Hybrid search

PHASE 3: AUTONOMOUS AI

Meta-Autonomous AI
Samomodyfikacja, meta-rozumowanie - AI udoskonala własne strategie

Self-improve

Meta-learning

Frontier

Full Autonomous AI - AGI
"Human Independent AI" - pełna autonomia bez udziału człowieka-operatora

Human-free

AGI

Frontier

Strategic AI
Adaptacyjne planowanie, ustrukturyzowane rozumowanie - agent sam tworzy plan

ReAct loop

Schema reasoning

Deep research

1

2

2+3

3

4

5

6

7

Kurs LLM (poziomy 2 i 3)

5 tygodni praktycznej wiedzy
gotowe środowisko
spotkania LIVE
sesje Q&A

Kurs LLM (poziomy 2 i 3)
5 tygodni / gotowe środowisko / spotkania LIVE

WIĘCEJ NA STRONIE KURSU

Kurs Agentic AI (poziomy 4 i 5)
5 tygodni / gotowe środowisko / sesje Q&A

Kurs Agentic AI (poziomy 4 i 5)

5 tygodni praktycznej wiedzy
gotowe środowisko
spotkania LIVE
sesje Q&A

WIĘCEJ NA STRONIE KURSU

4+5

FAQ

Szczere odpowiedzi na trudne pytania

Nie. Naiwny RAG umarł (ale on nigdy nie miał szansy na przeżycie).
Retrieval + generation jako koncept nigdzie się nie wybiera.

Zmienia się forma retrievalu. Domyślny wzorzec (chunking + vector DB) jest coraz częściej kwestionowany. Idea, że model potrzebuje zewnętrznej wiedzy - ta zostaje.

Dlaczego nam zaufało już ponad 10 000 ludzi?

1. Doświadczenie, które przynosi rezultaty
Szkolimy od 2016 roku, a nasz autor programów edukacyjnych to praktyk z ponad 10-letnim doświadczeniem w branży.

2. Praktyczne podejście do nauki
Nasze szkolenia oparte są na danych i naciskają na praktykę, co oznacza, że możesz od razu wdrażać zdobytą wiedzę w swoich projektach zawodowych.

3. Gotowe środowisko do nauki
Zapewniamy kompletną infrastrukturę do nauki – nie musisz martwić się o konfigurację ani instalację.

4. Wiedza z pierwszej ręki
Uczymy tego, co sami stosujemy w naszych projektach, dzięki czemu otrzymujesz aktualne i sprawdzone informacje.

5. Zaufanie dużych firm
Nasze szkolenia wybierają również czołowe organizacje, takie jak Orange, mBank, Santander, Leroy Merlin i inne, aby wspierać transformację swoich firm.

6. Społeczność zadowolonych uczestników
Ponad 10000 zadowolonych uczestników potwierdza jakość naszych programów. Dołącz do nich i przekonaj się, jak nasze szkolenia mogą wpłynąć na Twoją karierę!

7. Opinie naszych absolwentów
Nie wierz nam na słowo – zapoznaj się z opiniami naszych absolwentów, którzy dzielą się swoimi sukcesami po ukończeniu naszych kursów.

Dołączam się

OPINIE o DWTHON

Nie chwalimy się logotypami ani stanowiskami, ponieważ za każdą współpracą stoją przede wszystkim ludzie, którzy obdarzyli nas zaufaniem i powierzyli nam swój rozwój oraz edukację.

Zamiast iść spać, przebiegłam #DWthon -"RAG pod kontrolą" mini DataWorkshop maraton od Vladimir Alekseichenko. I teraz siedze po nocy, patrze na tą rosnącą mapę wiedzy, którą wzieliśmy na warsztat (super spójną sieć znaczeń, model informacji zamiast pociętych kawałków) — i myślę sobie: „u nas też by się taka przydała 😄”.
Dzięki Tomasz Uss za podesłanie tych warsztatów i Twojego entuzjazmu, który mnie zmotywował by ukończyć całość. Brawa Vladimir za ogrom wiedzy i za super knowledge transfer 👏

Marzena Rolik
Biorę udział w kolejnym DWthonie od DataWorkshop 👉
Co mnie zaskoczyło? W końcu ktoś w prosty sposób tłumaczy, czym jest RAG. RAG to klasa systemów, która żyje na czterech poziomach: narzędzie, wariant, wzorzec, klasa. Karpathy pokazał wariant. Mapa Wiedzy to wzorzec. Baza wektorowa to narzędzie.
To dobry kierunek w prostowaniu pojęć. Dzięki, Vladimir Alekseichenko!

Paweł Świerblewski
3x DWthon = AI Stack na nowym poziomie.🚀
Zamiast „AI-magii” wybieram inżynierską kontrolę.
✅ LLM Engineering: Bielik LLM, structured outputs i deterministyczność w produkcji.
✅ Agentic AI: Architektura OpenClaw, przepływ kontekstu i custom skills.
✅ RAG: Metadata extraction i multi-stage retrieval.
To był bardzo praktyczny cykl który uporządkował moje podejście do rozwiązań AI.
Dziękuję DataWorkshop, Vladimir Alekseichenko, Anna Kamila Sarz za tą możliwość.

Łukasz Mitruk
Kolejny DWthon dzięki DataWorkshop, i Vladimir Alekseichenko zrealizowany.
Tym razem na warsztat, a w zasadzie pod lupę RAG, czyli poziom 3 z 7 poziomów autonomii AI w koncepcji Software 3.0.
Ogrom wiedzy, którą w części już rozumiem i utrwalam, oraz wiele nowych dla mnie zagadnień: Mapa Wiedzy, integracja z Obsidianie, a w nim: widoczne wyspy firm,na których danych pracowaliśmy, koncepty, mosty cross-company.
3 intensywne dni, po których moja optyka, jak okiełznać modele LLM, przy wykorzystaniu Pythona i innych narzędzi jak wspomniany Obisidian, by zwracały nam dane, których potrzebujemy i były wiarygodne, cały czas ulega ewolucji.
Tylko utwierdzam się w przekonaniu, że warto poświęcić, czas na edukację z DataWorkshop. To nie jest nauka, programowania, czy pisania promptów. To przemyślana i zaprojektowana metodologia, podejścia do wyzwań biznesowych.

Grzegorz Malicki
Co udało się zrobić w ramach #dwthon_RAG - świetnej inicjatywie od DataWorkshop i Vladimir Alekseichenko?
- Mapa Wiedzy z ponad 1400 tabel pobranych z raportów finansowych spółek z GPW
- Graf w Obsidianie, na którym widać powiązania między firmami
- System, który znajduje odpowiedzi w danych i pokazuje, skąd je wziął
Prawdziwy RAG zaczyna się od tego, jak uporządkujesz dane - i to jest kluczowe. W dalszym ciągu poszerzam swoją wiedzę o AI i konsekwentnie rozwijam swoje kompetencje w tym obszarze.
Dziękuję @Vladimir Alekseichenko, @Anna Sarz i całej ekipie @DataWorkshop za świetnie poprowadzony kurs.
Arek Kozak
Wspominałem już w zeszłym tygodniu o tym dlaczego warto brać udział we wszelkiego rodzaju hackathonach i dlaczego cenię szkolenia DataWorkshop i jaki to ma wpływ na rozwój.
Konsekwentnie po raz kolejny nie zawiodłem się.
Buduję RAG-i od pewnego czasu, więc temat nie jest mi obcy. Ale dzięki warsztatowi z Vladimir Alekseichenko uporządkowałem i rozszerzyłem wiedzę o kolejne elementy.
Kiedy np. szukasz na Allegro jakiegoś produktu, używasz tylko tekstowej wyszukiwarki?
Zapewne tylko w pierwszym kroku. A potem po lewej stronie masz dziesiątki filtrów, którymi możesz doszczegółowić wyszukiwanie i znaleźć precyzyjnie produkt którego szukasz.
I to samo możemy zrobić w RAG-u
- przygotujemy dane. LLM wyciąga informacje do filtrów. Zapisujemy zarówno oryginalny chunk + wyciągnięte metadane
- przy wyszukiwaniu: rozbijamy intencję usera NA TE SAME FILTRY
- dzięki temu baza precyzyjnie znajduje to czego model szuka
Zastosowałem ten pomysł już w moim projekcie (razem z moim własnym pomysłem rozszerzania listy wyszukiwania przez tezaurus). Efekty są obiecujące!
Dlatego już wiem że zapisuję się do kolejnych hackathonów u Vladimira – i zachęcam do tego każdego, kto chce się rozwijać w zakresie ML i LLM - budowanie i warsztaty to najlepszy sposób na rozwój.
Łukasz Poźniak
Ukończyłam DWthon: RAG pod lupą — 3 intensywne dni nauki, praktyki i porządkowania myślenia o tym, czym naprawdę jest RAG.
Najbardziej wartościowe było dla mnie to, że zamiast samego „używania narzędzi” można było zrozumieć fundamenty: Structured Output, reprezentację wiedzy, parser intencji i to, jak z tych elementów składa się sensowny system.
Dziękuję organizatorom i prowadzącym za świetnie przygotowane materiały, dużo praktyki i bardzo dobrze poprowadzony proces krok po kroku. Dzięki także całej społeczności uczestników za energię, pytania i wzajemne wsparcie.
Wracam z nową wiedzą i jeszcze większą ochotą, żeby iść dalej w stronę LLM, RAG i pracy z wiedzą w praktyce.

Dorota Wojcicka
3 dni intensywnej pracy z LLM-ami zakończone certyfikatem ✔️

Kilka rzeczy, które szczególnie ze mną zostaną:
- RAG to faktycznie system, nie mechanizm - samo chunking + vector DB rzadko wystarcza
- Structured Output dobrze pokazuje, jak ważna jest kontrola kontraktu z modelem
- Retrieval bez bazy wektorowej? Da się - i w wielu przypadkach jest wystarczająco skuteczny
- Mapa wiedzy w Obsidianie robi wrażenie (zwłaszcza przy eksploracji powiązań)

Dla mnie to przede wszystkim solidna baza do dalszych eksperymentów.

Dzięki DataWorkshop, Vladimir Alekseichenko i Anna Kamila Sarz za solidne, merytoryczne wydarzenie 🙌

Adriana Michalik
Ukończyłam DWthon: RAG pod lupą - 3 intensywne dni nauki, praktyki i porządkowania myślenia o tym, czym naprawdę jest RAG.
Najbardziej wartościowe było dla mnie to, że zamiast samego „używania narzędzi” można było zrozumieć fundamenty: Structured Output, reprezentację wiedzy, parser intencji i to, jak z tych elementów składa się sensowny system.
Dziękuję organizatorom i prowadzącym za świetnie przygotowane materiały, dużo praktyki i bardzo dobrze poprowadzony proces krok po kroku. Dzięki także całej społeczności uczestników za energię, pytania i wzajemne wsparcie.
Wracam z nową wiedzą i jeszcze większą ochotą, żeby iść dalej w stronę LLM, RAG i pracy z wiedzą w praktyce.

Dorota Wojcicka
Przez 3 dni w pocie czoła 😅 budowałem własną bazę wiedzy od zera — 1400+ tabel finansowych, graf połączeń w Obsidianie, retrieval bez bazy wektorowej.
Największe odkrycie?
Przetworzone dane to zupełnie inna jakość dla modelu niż surowe.
Nie chodzi o to, żeby "wrzucić dane do AI".
Chodzi o to, żeby dane miały strukturę, z której model może korzystać wiarygodnie a ja jestem w stanie jakoś zapanować nad efektem tego procesu poprzez kontrolę wejścia.
Nie zrobiłbym tego sam bez prowadzenia krok po kroku.
Ale teraz widzę co się stało — i widzę, jak to mogę powoli odtworzyć na własnych danych.
To jest różnica między rozumieniem AI a używaniem AI.

Marcin P.
Po 3 dniach widzę RAG dużo szerzej niż na starcie.👀
Structured Output, Mapa Wiedzy i parser intencji świetnie pokazują, że tu nie chodzi o hype, tylko o fundamenty pracy z wiedzą.

Dziękuję Vladimir Alekseichenko i DataWorkshop za 3 dni konkretnej nauki. 🔥🙏

Wiktor Tarnowski
DWthon | Software 3.0 (RAG) - 3-dniowy, intensywny kurs od DataWorkshop.
Od projektowania reprezentacji danych, przez ekstrakcję ustrukturyzowanych metadanych (Bielik, OpenAI), budowę Knowledge Map w Obsidian, po wieloetapowy retrieval i generowanie odpowiedzi z cytowaniami na realnych raportach spółek GPW.
Dużo praktyki i konkretów w budowie wiarygodnych, kontrolowalnych 🦾 🚀 rozwiązań opartych o LLM.

Magdalena Lipka
Jestem po 3-dniowym szkoleniu DWthon "RAG pod lupą" 🔎 zorganizowanym przez Vladimir Alekseichenko i DataWorkshop. To było super doświadczenie, bardzo dobrze spędzony czas.

Dlaczego warto było wziąć w tym udział, czego się nauczyłem, doświadczyłem?
- To było bardzo ciekawe zobaczyć, jak Vladimir rozkłada na czynniki pierwsze hype związany z RAGiem, pokazując, co jest nadmuchanym balonikiem 🎈, a co realną inżynierią ⚙️.
- Zrozumiałem, że RAG zaczyna się od reprezentacji danych 📈 i zobaczyłem, jak należy to projektować.
- Zbudowałem solidny Retrieval dla danych 7 spółek GPW.
- AI, LLM to nadal część IT i świata inżynierii 🧑‍💻, a nie magii 🧙 - nie ma tu miejsca na naiwne i życzeniowe myślenie - kluczowe pytanie, czy Ty masz kontrolę nad rozwiązaniem, które stworzyłeś dotyczy szeroko pojętego Harness Engineering 🐴.
- Rozwój, rozwój i jeszcze raz rozwój, dużo wiedzy i przemyśleń, które zabieram z sobą i które zaprocentują w przyszłości 🚀.

Ah i oczywiście możliwość pochwalenia się nowo zdobytym certyfikatem 🎉 jest również miłym dodatkiem 👍

Za ten wartościowo spędzony czas i niezwykłe doświadczenie dziękuję jeszcze raz Vladimir Alekseichenko, Anna Kamila Sarz 😀❤️

Rafał Lachowicz
Co udało się zrobić w ramach #dwthon_RAG - świetnej inicjatywie od DataWorkshop i Vladimir Alekseichenko?

- Mapa Wiedzy z ponad 1400 tabel pobranych z raportów finansowych spółek z GPW
- Graf w Obsidianie, na którym widać powiązania między firmami
- System, który znajduje odpowiedzi w danych i pokazuje, skąd je wziął

Prawdziwy RAG zaczyna się od tego, jak uporządkujesz dane - i to jest kluczowe. W dalszym ciagu poszerzam swoją wiedzę o AI i konsekwentnie rozwijam swoje kompetencje w tym obszarze.

Dziękuję @Vladimir Alekseichenko, @Anna Sarz i całej ekipie @DataWorkshop za świetnie poprowadzony kurs.

Arek Kozak
Sporo frajdy i kilka wniosków po 3 dniach:
- Naiwny RAG (chunking + vector DB) często zawodzi, bo pomija etap projektowania reprezentacji danych - bez tego retrieval jest mało precyzyjny.
- Structured Output (np. z użyciem Pydantic) pozwala utrzymać kontrolę nad formatem i znaczeniem odpowiedzi, co znacząco zwiększa użyteczność LLM-ów.
- Mapa Wiedzy (np. w Obsidianie) pokazuje relacje między danymi - grafowa struktura ułatwia analizę powiązań i kontekstów.
- W wielu przypadkach pandas wystarcza do budowy skutecznego retrievalu, jeśli dane są dobrze przygotowane i zrozumiane.
- „RAG to system, nie mechanizm” - efektywność wynika z połączenia kilku elementów: danych, logiki i kontroli outputu.
- Harness Engineering to podejście, w którym LLM jest tylko jednym z komponentów - kluczowe jest zaprojektowanie całego procesu wokół niego.
Efekt: działający prototyp + konkretne obserwacje do dalszej pracy.

Anna D.
Chyba macie już dość scrollowania 😄
Więcej opinii i doświadczeń uczestników znajdziecie na moim LinkedIn oraz na profilu DataWorkshop

Vladimir Alekseichenko CEO DataWorkshop LinkedIn

STRONY

ML dla Ciebie
ML dla Biznesu

Kurs LLM
Kurs Agentic AI

Znajdziesz nas

Kontakt

Facebook
LinkedIn
Youtube