Wspominałem już w zeszłym tygodniu o tym dlaczego warto brać udział we wszelkiego rodzaju hackathonach i dlaczego cenię szkolenia DataWorkshop i jaki to ma wpływ na rozwój.
Konsekwentnie po raz kolejny nie zawiodłem się.
Buduję RAG-i od pewnego czasu, więc temat nie jest mi obcy. Ale dzięki warsztatowi z Vladimir Alekseichenko uporządkowałem i rozszerzyłem wiedzę o kolejne elementy.
Kiedy np. szukasz na Allegro jakiegoś produktu, używasz tylko tekstowej wyszukiwarki?
Zapewne tylko w pierwszym kroku. A potem po lewej stronie masz dziesiątki filtrów, którymi możesz doszczegółowić wyszukiwanie i znaleźć precyzyjnie produkt którego szukasz.
I to samo możemy zrobić w RAG-u
- przygotujemy dane. LLM wyciąga informacje do filtrów. Zapisujemy zarówno oryginalny chunk + wyciągnięte metadane
- przy wyszukiwaniu: rozbijamy intencję usera NA TE SAME FILTRY
- dzięki temu baza precyzyjnie znajduje to czego model szuka
Zastosowałem ten pomysł już w moim projekcie (razem z moim własnym pomysłem rozszerzania listy wyszukiwania przez tezaurus). Efekty są obiecujące!
Dlatego już wiem że zapisuję się do kolejnych hackathonów u Vladimira – i zachęcam do tego każdego, kto chce się rozwijać w zakresie ML i LLM - budowanie i warsztaty to najlepszy sposób na rozwój.