Herzlich Willkommen zum Workshop!
In den nächsten Stunden werden wir Schritt für Schritt eine eigene Retrieval-Augmented Generation-Anwendung (RAG) entwickeln. Dabei werden wir nicht nur die Anwendung gemeinsam aufbauen, sondern auch ihre Leistungsfähigkeit evaluieren. Ein besonderes Augenmerk legen wir auf die Integration eurer persönlichen Daten, um das System präzise auf eure spezifischen Fragestellungen anzupassen und individuelle Antworten zu generieren.
Alle im Workshop verwendeten Code-Beispiele findest du in diesem Repository. Es dient als Basis, um die erworbenen Kenntnisse auch nach dem Workshop anzuwenden und weiter zu vertiefen.
- Erstelle eine virtuelle Entwicklungsumgebung
python3 -m venv name_of_virtualenv
source name_of_virtualenv/bin/activate
- Installiere die benötigten Python-Pakete
pip install -r requirements.txt
Die benötigten Zugangsdaten zu unserer Azure Instanz findest du in XY.
In Sprint 1 werden wir eine grundlegende Chainlit App entwickeln, die als Grundlage für eine spätere RAG-Anwendung dient und die Interaktion mit einem Large Language Model (LLM) ermöglicht.
Im zweiten Sprint erweitern wir die Chainlit App mit RAG-Funktionalitäten, indem wir einen Vectorstore anlegen und die App modifizieren, sodass sie fähig ist, gezielt Wissen aus einer Datenbank zu extrahieren und fundierte Antworten auf Fragen mit spezifischem Kontext zu liefern.
Sprint 3 beschäftigt sich mit der Evaluierung der RAG-Funktionalitäten in unserer Chainlit App. Wir integrieren die Observability-Komponente Phoenix, erstellen einen Evaluationsdatensatz und führen eine umfassende Analyse mithilfe des Evaluationsframeworks ragas durch, um die Leistung der App zu messen und zu verstehen, wo sie gut funktioniert und wo Verbesserungen nötig sind.
In unserem letzten Sprint werden wir eure eigenen Daten an die App anbinden.