- ⏳️ Petit support avec le template du devfest : https://docs.google.com/presentation/d/1WIh_YAMMfUjPZAn5VcU8SX6IXH01jP025pKKcTBaxiI/edit#slide=id.g30ad9b2c75e_0_218
- Test la registry docker local et MAJ le step 1 modifier la plateform
- MAJ de la page sur le site publique TOCK avec les requirements
- Relecture des steps avant
- Test hors ligne avec routeur
- Prépa offline du dossier de modèle ollama, plusieurs variantes et tester. (voir step_1)
- Step 2_1 finire de bouger ce qui lié au RAG qui arrive dans le Gen Sentence
- Mettre tout les steps sur une même branch avec step1.md .. ça va vite devenir galère pour s'y retrouver pour les participant de devoir switch de branch à chaque fois et pour nous pour la rédaction et les fichiers annexes.
- --> j'ai mis à jours les branches et cleaner les dossiers inutiles(bot, .idea, pom.xml)
- Retrait de la dépendance mvn, plus besoin on utilise tout en dockerisé ?
- Make file plus besoin avec l'image de tooling python (et nécessite internet)
- Modification au retrait du make file car tout fait en 1 seules ligne de commande au step d'ingestion des données, plus besoin de build d'image car image de tooling
- Indiquer à chaque participant de bien créer un namespace tock avec son nom/prénom ou pseudo ? On pourrait lancer un PAD en début de codelab tout le monde y mets son nom / pseudo pour éviter les collision ça permettra de voir si on a des risques.
- Création d'un namespace passer par namespace, bien le cocher puis bouton de création de l'app.
- Récupérer le relative reste path et indiquer dans le step 2 de le coller sur page web.
Ok pour moi rien a voir.
Ce step n'est que sur la génération de phrase, j'ai commencé à décaler tout ce qui est lié au RAG arrive après néanmoins toutes les explication autour de LLM / prompt / config Ollama / Open AI doivent rester. J'ai entamé le taff mais pas eu le temps de finir.
- Lnagfuse + toc studio OK
- Screenshot à revoir voir les TODO
- @benjamin rédiger le step
- Héberger le dataset sur la machine GPU.
- Revoir IP dans extra host ...
- Image a reprendre d'un step avant
- Ajouter la config d'embedding + envoyer un message qui déclanche le RAG pour tester
- modification image pour matrix ok
- exemple de jealbreak
- explication Token + tokenisatioon
- Finaliser explication context
- Inviter les gens à jouer avec le prompt
- explication embedding vector
- Brancher le tock reactkit sur le bot avec explication
Tester avec ce dataset ? https://www.kaggle.com/datasets/asaniczka/tmdb-movies-dataset-2023-930k-movies