Start 21 kwietnia | 3 dni | działasz swoim tempem

W 3 dni zbudujesz Mapę Wiedzy z kontrolą jakości - zabierz wyniki ze sobą. 7 spółek z GPW. 1400+ tabel finansowych. Bielik. Graf. GitHub + Obsidian.

RAG pod lupą

największy stress test w Polsce

Vladimir
Alekseichenko
10 000+
alumni DataWorkshop
uczymy AI od 2016 r.

DWthon | Software 3.0

Zero Instalacji. 100% praktyki
Start: 21 kwietnia | 3 dni | Działasz w swoim rytmie
Po 3 dniach otworzysz Obsidian i
zobaczysz swoją bazę wiedzy.
  • ❌ Nie slajdy.
  • ❌ Nie notatki z wykładu.
  • ✅ Graf wiedzy z realnych sprawozdań finansowych - z metadanymi, powiązaniami i źródłami.
  • ✅ Na Twoim GitHubie. Pod Twoją kontrolą.

Rozwijasz go dalej na własnych danych. To zostaje z Tobą długo po tym, jak DWthon się skończy.

Co otrzymujesz od nas na start?
1M tokenów w pakiecie
Potężna pula na Twoje eksperymenty (bez dopłat).
DataWorkshop Lab
Zero instalacji. Gotowe środowisko chmurowe. Wchodzisz i działasz.
Realna wiedza
1400+ tabel finansowych z GPW.
7 spółek. Realne sprawozdania za 2023. PDF, Markdown, JSON - gotowe do pracy.
Realny wpływ
Po 3 dniach otworzysz Obsidian i
zobaczysz swoją bazę wiedzy.
Cel DWthon: Zmierzyć się z najtrudniejszym zadaniem w RAG - tym, które wszyscy omijają

Budowanie reprezentacji wiedzy jest trudne. Model się myli. Tabele mają niuanse. Struktura się psuje.

Właśnie dlatego większość szła na skróty: chunking, baza wektorowa i szukanie narzędzia, które "zrobi to za mnie" - LangChain, kolejny framework, cokolwiek modnego w tym tygodniu.


Na DWthonie podejdziesz do tego świadomie. W 3 dni nie staniesz się ekspertem - ale zobaczysz, gdzie naprawdę leży różnica między demo a produkcją.

Twoja Mapa Wiedzy - zabierasz ze sobą
Pobierz z GitHuba. Otwórz w Obsidianie.

Zobacz graf wiedzy z metadanymi, powiązaniami i źródłami.

Rozwijaj dalej - na własnych danych, kiedy chcesz, ile chcesz.

Dlatego post Karpathy'ego zebrał 18 milionów wyświetleń: ludzie zobaczyli, że to jest namacalne.

U nas też - ale z kontrolą jakości.

Dobry moment, aby dołączyć do wyzwania! Start za...
Dni
Godzin
Minut
Sekond
"Problem → Struktura → Moc"
DZIEŃ 1:
Problem + Koncept + Setup
Eksperyment: chunking tabeli finansowej - zobacz, co model dostaje (i dlaczego odpowiada bzdury)
Software 3.0: 7 poziomów autonomii AI - czym jest Poziom 3 i dlaczego naiwny RAG to za mało
Czym jest Mapa Wiedzy - i czym nie jest (nie prompt, nie baza wektorowa - system sterowania)
Setup: GitHub (prywatne repo) + Obsidian + DataWorkshop Lab
Pierwszy test: Bielik + Structured Output → kontrolowany opis tabeli → plik Markdown → Obsidian

Po dniu 1: widzisz problem na własne oczy. Masz skonfigurowane narzędzia. Wiesz, co i po co budujesz.

Dzień 1 zaczyna się od bólu (naiwny RAG psuje dane).

Dzień 2 rozwiązuje problem (Structured Output + organizacja).

Dzień 3 pokazuje moc (retrieval + chat z pełnym zbiorem).

Źródła → artykuły: jak zamienić surowe sprawozdanie w ustrukturyzowane artykuły z powiązaniami
Structured Output: Ty definiujesz schemat → model go wypełnia → Ty walidujesz wynik
Masz wpływ na strukturę: co trafia do artykułu, jakie metadane, jakie powiązania
Audytowalność: źródło, confidence, data - każdy artykuł da się prześledzić do oryginału
Jakość żyje: mechanizmy lint i walidacji - bo Mapa Wiedzy musi być aktualna i spójna
Uruchamiasz pipeline. Vladimir odpala na pełnym zbiorze na noc.

Po dniu 2: Twoja Mapa Wiedzy rośnie. Rozumiesz każdy element. Kontrolujesz jakość. Pełny zbiór się przetwarza.
DZIEŃ 2:
Organizacja wiedzy - od źródeł do audytowalnej Mapy
DZIEŃ 3:
Retrieval + Chat - moc Mapy Wiedzy
Pełna Mapa gotowa: 7 spółek, 1400+ tabel, artykuły z powiązaniami
Retrieval: wyszukujesz informację w Mapie - nie w losowych chunkach
Kontekst + prompt → odpowiedź z odniesieniem do źródła
Chat z danymi: budujesz własne rozwiązanie zamiast polegać na narzędziach, które nie radzą sobie z dużymi plikami
Stress-test: 2000+ ludzi porównuje wyniki i podejścia
Mapa na GitHubie: pobierasz, otwierasz w Obsidianie, edytujesz, rozwijasz na własnych danych
Most do Praktycznego LLM: masz Mapę → teraz potrzebujesz systemu

Po dniu 3: pełna Mapa Wiedzy - Twoja, na GitHubie, w Obsidianie. Rozmawiasz z nią. Rozwijasz ją. Kontrolujesz.
Mapa Wiedzy - fundament,
którego brakuje w 90% systemów RAG

Gdy większość rynku sprzedawała naiwny RAG oparty o przypadkowe chunki i bazy wektorowe, my w DataWorkshop Lab pracowaliśmy nad czymś ważniejszym:


✅ Dlaczego naiwny chunking niszczy dane - tabela finansowa rozerwana na 3 fragmenty traci sens. Nagłówki znikają, wiersze się rwą, model dostaje śmieciowy kontekst. I odpowiada bzdury.


✅ Jak reprezentować dane, zanim trafią do retrievalu - LLM opisuje, klasyfikuje i strukturyzuje dane NA WEJŚCIU, nie na etapie pytania. To zmienia wszystko.


✅ Czym jest Mapa Wiedzy - tekstowa, audytowalna, hierarchiczna instrukcja, która mówi modelowi JAK nawigować po złożonej rzeczywistości. Nie prompt. Nie baza wektorowa. System sterowania.


✅ Jak zbudować retrieval, który naprawdę działa - pytanie rozbite na etapy, kontekst budowany z referencjami do źródeł, audytowalna odpowiedź. Firmy jak Mastercard mówią wprost: knowledge drift, retrieval decay, irrelevant chunks i brak ewaluacji to cztery jeźdźcy apokalipsy RAG na produkcji. Mapa Wiedzy adresuje każdy z nich u fundamentu.


Karpathy'ego wiki w Obsidianie? To jeden wariant Mapy Wiedzy.

PageIndex tree index? To inny wariant Mapy Wiedzy.

Claude Code CLAUDE.md? To jeszcze inny wariant Mapy Wiedzy.


Różne formy. Ten sam rdzeń.

My uczymy fundamentów. Konkretne realizacje przychodzą i odchodzą. Na DWthon #3 zbudujesz swoją Mapę Wiedzy na realnych danych finansowych. I zobaczysz różnicę na własne oczy.

"Czy dam radę?"
Plan jest taki...
Każdego dnia będzie nowe zadanie. Ale..

Masz całą dobę, aby je wykonać – to od Ciebie zależy, kiedy działasz (rano, w ciągu dnia czy wieczorem).

Warto założyć co najmniej 1 godzinę dziennie, aby wyrobić się z materiałem.
Dla kogo jest DWthon? Czy to Ty?
TAK, jeśli:
Budujesz lub planujesz system RAG i chcesz uniknąć błędów, które popełnia 90% rynku

Podejmujesz decyzje o AI w firmie i musisz wiedzieć, co jest realne, a co marketing

Jesteś w IT (dev, PM, architekt, team lead) i chcesz zrozumieć RAG od fundamentów

Jesteś praktykiem spoza IT (finansista, analityk, prawnik) i pracujesz z dokumentami

Masz wewnętrzną motywację, żeby się zanurzyć

Szukasz kolejnego kursu, który "obejrzysz i zapomnisz"

Oczekujesz, że AI zrobi wszystko za Ciebie

Chcesz kolejny tutorial o LangChain + Pinecone - tego tu nie ma

Chcesz tylko "posmakować hype" - tu działamy na pełnych obrotach

NIE, jeśli:
Większość szkoleń uczy narzędzi, które za chwilę się zmienią. Problem nie jest w Tobie.
Problem jest w tym, czego Cię uczą. My uczymy paradygmatu, który zostanie.
W DataWorkshop nie bawimy się w AI.
Zobaczysz, jak to działa od kuchni. I podejmiesz decyzję samodzielnie.
Zajmujemy się machine learningiem od ponad 10 lat.

Pokazujemy to, o czym inni milczą: jak zbudować AI na solidnym fundamencie i mieć nad nim własną kontrolę.

Poznaj swojego mentora
Praktyczne doświadczenie w uczeniu maszynowym – 10 lat, w programowaniu – 15 lat;

Potrafi tłumaczyć skomplikowane pojęcia z matematyki, statystyki i programowania w prosty sposób, używając przykładów z życia i funkcjonowania biznesu;

Wiele modele uczenia maszynowego wdrożonych do produkcji;

CEO i założyciel DataWorkshop;

Konsultuje i wspiera przy wdrażaniu duże i małe firmy (Fortune 500 i inne) w praktycznym podejściu do uczenia maszynowego;

Autor 7 praktycznych kursów: LLM, Python, ML/DS od podstaw, statystyka SQL, NLP, szeregi czasowe;

Regularny prelegent i twórca międzynarodowej konferencji DWCC poświęconej uczeniu maszynowemu i sztucznej inteligencji.;

Twórca wiele inicjatyw i warsztatów z uczenia maszynowego dla dziesiątki tysięcy ludzi: "Korona wyzwań", "Matryca", "DWgym", "DWthon", "DWTools", "DWChampions".

Prowadzi podcast Biznes Myśli (> 500 000 odsłuchań).
Twórca autorskich kursów ML/AI
CEO DataWorkshop
Vladimir Alekseichenko
Mocne strony:

Kreatywne podejście,
Krytyczne myślenie,
Zdolność inspirowania uczniów i wzmacniania ich wiary we własne siły,
Umiejętność skierowania na właściwą drogę w celu rozwiązania postawionych zadań.
⏳ Liczba miejsc ograniczona pojemnością infrastruktury!

190 PLN

Chcesz najpierw spróbować?

Dostęp na 3 dni (21-23 kwietnia).
DataWorkshop Lab.
Tokeny. Materiały + Slack.

Dostęp do DWthon (podstawowy)
490 PLN
Dostęp na 30 dni - nie 3, trzydzieści dni!

Pracujesz we własnym tempie.
~200 modeli LLM w tym najnowsze.
Więcej tokenów na eksperymenty.

🎁 DODATKOWO - Nagrania szkolenia R w RAG

🎁 DODATKOWO - Cenę odliczasz od kursu Praktyczny LLM lub Agentic AI - to nie koszt, to zaliczka na rozwój
PREMIUM dostęp do DWthon
Zero Instalacji. 100% praktyki
Start: 21 kwietnia | 3 dni | Działasz w swoim rytmie
Na koniec warsztatu dostaniesz certyfikat
Dla uczestników, którzy ukończyli co najmniej 80% zadań
SOFTWARE 3.0 TAXONOMY - 7 LEVELS
Mamy plan Twojego rozwoju...
PHASE 1: FOUNDATION
PHASE 2: CONNECTED AI
by DATAWORKSHOP (R)
Conversational AI
Podstawowy prompting, interfejs UI - człowiek prowadzi dialog ręcznie
ChatGPT
Prompt design
Zero-code
Programmable AI
API, Structured output, inteligentny RPA - kod steruje modelem AI
REST API
Pydantic
JSON output
Contextual AI
Pamięć, narzędzia, działania kontekstowe - Stateful Agent z długoterminową pamięcią
Warstwy pamięci
MCP tools
Stateful
Integrated AI
RAG, systemy hybrydowe - AI podłączony do danych organizacji
RAG
Vector DB
Hybrid search
PHASE 3: AUTONOMOUS AI
Meta-Autonomous AI
Samomodyfikacja, meta-rozumowanie - AI udoskonala własne strategie
Self-improve
Meta-learning
Frontier
Full Autonomous AI - AGI
"Human Independent AI" - pełna autonomia bez udziału człowieka-operatora
Human-free
AGI
Frontier
Strategic AI
Adaptacyjne planowanie, ustrukturyzowane rozumowanie - agent sam tworzy plan
ReAct loop
Schema reasoning
Deep research
1
2
2+3
3
4
5
6
7
Kurs LLM (poziomy 2 i 3)
  • 5 tygodni praktycznej wiedzy
  • gotowe środowisko
  • spotkania LIVE
  • sesje Q&A
Kurs LLM (poziomy 2 i 3)
5 tygodni / gotowe środowisko / spotkania LIVE
Kurs Agentic AI (poziomy 4 i 5)
5 tygodni / gotowe środowisko / sesje Q&A
Kurs Agentic AI (poziomy 4 i 5)
  • 5 tygodni praktycznej wiedzy
  • gotowe środowisko
  • spotkania LIVE
  • sesje Q&A
4+5
FAQ
Szczere odpowiedzi na trudne pytania
Nie. Naiwny RAG umarł (ale on nigdy nie miał szansy na przeżycie).
Retrieval + generation jako koncept nigdzie się nie wybiera.

Zmienia się forma retrievalu. Domyślny wzorzec (chunking + vector DB) jest coraz częściej kwestionowany. Idea, że model potrzebuje zewnętrznej wiedzy - ta zostaje.

Dlaczego nam zaufało już ponad 10 000 ludzi?

1. Doświadczenie, które przynosi rezultaty
Szkolimy od 2016 roku, a nasz autor programów edukacyjnych to praktyk z ponad 10-letnim doświadczeniem w branży.

2. Praktyczne podejście do nauki
Nasze szkolenia oparte są na danych i naciskają na praktykę, co oznacza, że możesz od razu wdrażać zdobytą wiedzę w swoich projektach zawodowych.

3. Gotowe środowisko do nauki
Zapewniamy kompletną infrastrukturę do nauki – nie musisz martwić się o konfigurację ani instalację.

4. Wiedza z pierwszej ręki
Uczymy tego, co sami stosujemy w naszych projektach, dzięki czemu otrzymujesz aktualne i sprawdzone informacje.

5. Zaufanie dużych firm
Nasze szkolenia wybierają również czołowe organizacje, takie jak Orange, mBank, Santander, Leroy Merlin i inne, aby wspierać transformację swoich firm.

6. Społeczność zadowolonych uczestników
Ponad 10000 zadowolonych uczestników potwierdza jakość naszych programów. Dołącz do nich i przekonaj się, jak nasze szkolenia mogą wpłynąć na Twoją karierę!

7. Opinie naszych absolwentów
Nie wierz nam na słowo – zapoznaj się z opiniami naszych absolwentów, którzy dzielą się swoimi sukcesami po ukończeniu naszych kursów.

OPINIE o DWTHON
Nie chwalimy się logotypami ani stanowiskami, ponieważ za każdą współpracą stoją przede wszystkim ludzie, którzy obdarzyli nas zaufaniem i powierzyli nam swój rozwój oraz edukację.
  • Zamiast iść spać, przebiegłam #DWthon -"RAG pod kontrolą" mini DataWorkshop maraton od Vladimir Alekseichenko. I teraz siedze po nocy, patrze na tą rosnącą mapę wiedzy, którą wzieliśmy na warsztat (super spójną sieć znaczeń, model informacji zamiast pociętych kawałków) — i myślę sobie: „u nas też by się taka przydała 😄”.
    Dzięki Tomasz Uss za podesłanie tych warsztatów i Twojego entuzjazmu, który mnie zmotywował by ukończyć całość. Brawa Vladimir za ogrom wiedzy i za super knowledge transfer 👏
    Marzena Rolik
  • Biorę udział w kolejnym DWthonie od DataWorkshop 👉
    Co mnie zaskoczyło? W końcu ktoś w prosty sposób tłumaczy, czym jest RAG. RAG to klasa systemów, która żyje na czterech poziomach: narzędzie, wariant, wzorzec, klasa. Karpathy pokazał wariant. Mapa Wiedzy to wzorzec. Baza wektorowa to narzędzie.
    To dobry kierunek w prostowaniu pojęć. Dzięki, Vladimir Alekseichenko!
    Paweł Świerblewski
  • 3x DWthon = AI Stack na nowym poziomie.🚀
    Zamiast „AI-magii” wybieram inżynierską kontrolę.
    ✅ LLM Engineering: Bielik LLM, structured outputs i deterministyczność w produkcji.
    ✅ Agentic AI: Architektura OpenClaw, przepływ kontekstu i custom skills.
    ✅ RAG: Metadata extraction i multi-stage retrieval.
    To był bardzo praktyczny cykl który uporządkował moje podejście do rozwiązań AI.
    Dziękuję DataWorkshop, Vladimir Alekseichenko, Anna Kamila Sarz za tą możliwość.
    Łukasz Mitruk
  • Kolejny DWthon dzięki DataWorkshop, i Vladimir Alekseichenko zrealizowany.
    Tym razem na warsztat, a w zasadzie pod lupę RAG, czyli poziom 3 z 7 poziomów autonomii AI w koncepcji Software 3.0.
    Ogrom wiedzy, którą w części już rozumiem i utrwalam, oraz wiele nowych dla mnie zagadnień: Mapa Wiedzy, integracja z Obsidianie, a w nim: widoczne wyspy firm,na których danych pracowaliśmy, koncepty, mosty cross-company.
    3 intensywne dni, po których moja optyka, jak okiełznać modele LLM, przy wykorzystaniu Pythona i innych narzędzi jak wspomniany Obisidian, by zwracały nam dane, których potrzebujemy i były wiarygodne, cały czas ulega ewolucji.
    Tylko utwierdzam się w przekonaniu, że warto poświęcić, czas na edukację z DataWorkshop. To nie jest nauka, programowania, czy pisania promptów. To przemyślana i zaprojektowana metodologia, podejścia do wyzwań biznesowych.
    Grzegorz Malicki
  • Co udało się zrobić w ramach #dwthon_RAG - świetnej inicjatywie od DataWorkshop i Vladimir Alekseichenko?
    • Mapa Wiedzy z ponad 1400 tabel pobranych z raportów finansowych spółek z GPW
    • Graf w Obsidianie, na którym widać powiązania między firmami
    • System, który znajduje odpowiedzi w danych i pokazuje, skąd je wziął
    Prawdziwy RAG zaczyna się od tego, jak uporządkujesz dane - i to jest kluczowe. W dalszym ciągu poszerzam swoją wiedzę o AI i konsekwentnie rozwijam swoje kompetencje w tym obszarze.
    Dziękuję @Vladimir Alekseichenko, @Anna Sarz i całej ekipie @DataWorkshop za świetnie poprowadzony kurs.
    Arek Kozak
  • Wspominałem już w zeszłym tygodniu o tym dlaczego warto brać udział we wszelkiego rodzaju hackathonach i dlaczego cenię szkolenia DataWorkshop i jaki to ma wpływ na rozwój.
    Konsekwentnie po raz kolejny nie zawiodłem się.
    Buduję RAG-i od pewnego czasu, więc temat nie jest mi obcy. Ale dzięki warsztatowi z Vladimir Alekseichenko uporządkowałem i rozszerzyłem wiedzę o kolejne elementy.
    Kiedy np. szukasz na Allegro jakiegoś produktu, używasz tylko tekstowej wyszukiwarki?
    Zapewne tylko w pierwszym kroku. A potem po lewej stronie masz dziesiątki filtrów, którymi możesz doszczegółowić wyszukiwanie i znaleźć precyzyjnie produkt którego szukasz.
    I to samo możemy zrobić w RAG-u
    • przygotujemy dane. LLM wyciąga informacje do filtrów. Zapisujemy zarówno oryginalny chunk + wyciągnięte metadane
    • przy wyszukiwaniu: rozbijamy intencję usera NA TE SAME FILTRY
    • dzięki temu baza precyzyjnie znajduje to czego model szuka
    Zastosowałem ten pomysł już w moim projekcie (razem z moim własnym pomysłem rozszerzania listy wyszukiwania przez tezaurus). Efekty są obiecujące!
    Dlatego już wiem że zapisuję się do kolejnych hackathonów u Vladimira – i zachęcam do tego każdego, kto chce się rozwijać w zakresie ML i LLM - budowanie i warsztaty to najlepszy sposób na rozwój.
    Łukasz Poźniak
  • Ukończyłam DWthon: RAG pod lupą — 3 intensywne dni nauki, praktyki i porządkowania myślenia o tym, czym naprawdę jest RAG.
    Najbardziej wartościowe było dla mnie to, że zamiast samego „używania narzędzi” można było zrozumieć fundamenty: Structured Output, reprezentację wiedzy, parser intencji i to, jak z tych elementów składa się sensowny system.
    Dziękuję organizatorom i prowadzącym za świetnie przygotowane materiały, dużo praktyki i bardzo dobrze poprowadzony proces krok po kroku. Dzięki także całej społeczności uczestników za energię, pytania i wzajemne wsparcie.
    Wracam z nową wiedzą i jeszcze większą ochotą, żeby iść dalej w stronę LLM, RAG i pracy z wiedzą w praktyce.
    Dorota Wojcicka
  • 3 dni intensywnej pracy z LLM-ami zakończone certyfikatem ✔️

    Kilka rzeczy, które szczególnie ze mną zostaną:
    - RAG to faktycznie system, nie mechanizm - samo chunking + vector DB rzadko wystarcza
    - Structured Output dobrze pokazuje, jak ważna jest kontrola kontraktu z modelem
    - Retrieval bez bazy wektorowej? Da się - i w wielu przypadkach jest wystarczająco skuteczny
    - Mapa wiedzy w Obsidianie robi wrażenie (zwłaszcza przy eksploracji powiązań)

    Dla mnie to przede wszystkim solidna baza do dalszych eksperymentów.

    Dzięki DataWorkshop, Vladimir Alekseichenko i Anna Kamila Sarz za solidne, merytoryczne wydarzenie 🙌
    Adriana Michalik
  • Ukończyłam DWthon: RAG pod lupą - 3 intensywne dni nauki, praktyki i porządkowania myślenia o tym, czym naprawdę jest RAG.
    Najbardziej wartościowe było dla mnie to, że zamiast samego „używania narzędzi” można było zrozumieć fundamenty: Structured Output, reprezentację wiedzy, parser intencji i to, jak z tych elementów składa się sensowny system.
    Dziękuję organizatorom i prowadzącym za świetnie przygotowane materiały, dużo praktyki i bardzo dobrze poprowadzony proces krok po kroku. Dzięki także całej społeczności uczestników za energię, pytania i wzajemne wsparcie.
    Wracam z nową wiedzą i jeszcze większą ochotą, żeby iść dalej w stronę LLM, RAG i pracy z wiedzą w praktyce.
    Dorota Wojcicka
  • Przez 3 dni w pocie czoła 😅 budowałem własną bazę wiedzy od zera — 1400+ tabel finansowych, graf połączeń w Obsidianie, retrieval bez bazy wektorowej.
    Największe odkrycie?
    Przetworzone dane to zupełnie inna jakość dla modelu niż surowe.
    Nie chodzi o to, żeby "wrzucić dane do AI".
    Chodzi o to, żeby dane miały strukturę, z której model może korzystać wiarygodnie a ja jestem w stanie jakoś zapanować nad efektem tego procesu poprzez kontrolę wejścia.
    Nie zrobiłbym tego sam bez prowadzenia krok po kroku.
    Ale teraz widzę co się stało — i widzę, jak to mogę powoli odtworzyć na własnych danych.
    To jest różnica między rozumieniem AI a używaniem AI.
    Marcin P.
  • Po 3 dniach widzę RAG dużo szerzej niż na starcie.👀
    Structured Output, Mapa Wiedzy i parser intencji świetnie pokazują, że tu nie chodzi o hype, tylko o fundamenty pracy z wiedzą.

    Dziękuję Vladimir Alekseichenko i DataWorkshop za 3 dni konkretnej nauki. 🔥🙏
    Wiktor Tarnowski
  • DWthon | Software 3.0 (RAG) - 3-dniowy, intensywny kurs od DataWorkshop.
    Od projektowania reprezentacji danych, przez ekstrakcję ustrukturyzowanych metadanych (Bielik, OpenAI), budowę Knowledge Map w Obsidian, po wieloetapowy retrieval i generowanie odpowiedzi z cytowaniami na realnych raportach spółek GPW.
    Dużo praktyki i konkretów w budowie wiarygodnych, kontrolowalnych 🦾 🚀 rozwiązań opartych o LLM.
    Magdalena Lipka
  • Jestem po 3-dniowym szkoleniu DWthon "RAG pod lupą" 🔎 zorganizowanym przez Vladimir Alekseichenko i DataWorkshop. To było super doświadczenie, bardzo dobrze spędzony czas.

    Dlaczego warto było wziąć w tym udział, czego się nauczyłem, doświadczyłem?
    - To było bardzo ciekawe zobaczyć, jak Vladimir rozkłada na czynniki pierwsze hype związany z RAGiem, pokazując, co jest nadmuchanym balonikiem 🎈, a co realną inżynierią ⚙️.
    - Zrozumiałem, że RAG zaczyna się od reprezentacji danych 📈 i zobaczyłem, jak należy to projektować.
    - Zbudowałem solidny Retrieval dla danych 7 spółek GPW.
    - AI, LLM to nadal część IT i świata inżynierii 🧑‍💻, a nie magii 🧙 - nie ma tu miejsca na naiwne i życzeniowe myślenie - kluczowe pytanie, czy Ty masz kontrolę nad rozwiązaniem, które stworzyłeś dotyczy szeroko pojętego Harness Engineering 🐴.
    - Rozwój, rozwój i jeszcze raz rozwój, dużo wiedzy i przemyśleń, które zabieram z sobą i które zaprocentują w przyszłości 🚀.

    Ah i oczywiście możliwość pochwalenia się nowo zdobytym certyfikatem 🎉 jest również miłym dodatkiem 👍

    Za ten wartościowo spędzony czas i niezwykłe doświadczenie dziękuję jeszcze raz Vladimir Alekseichenko, Anna Kamila Sarz 😀❤️
    Rafał Lachowicz
  • Co udało się zrobić w ramach #dwthon_RAG - świetnej inicjatywie od DataWorkshop i Vladimir Alekseichenko?

    - Mapa Wiedzy z ponad 1400 tabel pobranych z raportów finansowych spółek z GPW
    - Graf w Obsidianie, na którym widać powiązania między firmami
    - System, który znajduje odpowiedzi w danych i pokazuje, skąd je wziął

    Prawdziwy RAG zaczyna się od tego, jak uporządkujesz dane - i to jest kluczowe. W dalszym ciagu poszerzam swoją wiedzę o AI i konsekwentnie rozwijam swoje kompetencje w tym obszarze.

    Dziękuję @Vladimir Alekseichenko, @Anna Sarz i całej ekipie @DataWorkshop za świetnie poprowadzony kurs.
    Arek Kozak
  • Sporo frajdy i kilka wniosków po 3 dniach:
    - Naiwny RAG (chunking + vector DB) często zawodzi, bo pomija etap projektowania reprezentacji danych - bez tego retrieval jest mało precyzyjny.
    - Structured Output (np. z użyciem Pydantic) pozwala utrzymać kontrolę nad formatem i znaczeniem odpowiedzi, co znacząco zwiększa użyteczność LLM-ów.
    - Mapa Wiedzy (np. w Obsidianie) pokazuje relacje między danymi - grafowa struktura ułatwia analizę powiązań i kontekstów.
    - W wielu przypadkach pandas wystarcza do budowy skutecznego retrievalu, jeśli dane są dobrze przygotowane i zrozumiane.
    - „RAG to system, nie mechanizm” - efektywność wynika z połączenia kilku elementów: danych, logiki i kontroli outputu.
    - Harness Engineering to podejście, w którym LLM jest tylko jednym z komponentów - kluczowe jest zaprojektowanie całego procesu wokół niego.
    Efekt: działający prototyp + konkretne obserwacje do dalszej pracy.
    Anna D.
  • Chyba macie już dość scrollowania 😄
    Więcej opinii i doświadczeń uczestników znajdziecie na moim LinkedIn oraz na profilu DataWorkshop
    Vladimir Alekseichenko CEO DataWorkshop LinkedIn
© All Rights Reserved.
DataWorkshop sp. z o.o.
ul. Mogilska 43
31-545 Kraków
KRS: 0000815135
NIP: 6762574286
REGON: 384914283