Baza wiedzy wykorzystuje RAG (Retrieval-Augmented Generation), aby dać Twojemu agentowi dostęp do treści biznesowych. Dokumenty są dzielone na fragmenty, konwertowane na osadzenia wektorowe i przechowywane do wyszukiwania semantycznego.Przejdź do zakładki Baza wiedzy w panelu agenta. Tutaj wybierasz, które dane agent będzie wykorzystywał w swoich odpowiedziach.
Otwórz ustawienia RAG przez ikonę koła zębatego (⚙) w panelu przechowywania bazy wiedzy. Wszystkie ustawienia są per firma i zapisują się automatycznie.
Wybierz model do konwersji tekstu na embeddingi wektorowe:
Model
Dostawca
Wymiary
Cena
Najlepszy do
text-embedding-3-small
OpenAI
1536
$0.02/1M tokenów
Ogólne użycie, treści angielskie
text-embedding-3-large
OpenAI
1536
$0.13/1M tokenów
Wyższa dokładność, treści angielskie
BGE-M3
DeepInfra
1024
$0.01/1M tokenów
Treści wielojęzyczne (100+ języków)
Zmiana modelu embeddingu usuwa wszystkie istniejące embeddingi firmy. Po zmianie musisz ponownie wytrenować wszystkich agentów. Przed zastosowaniem zmiany pojawi się okno potwierdzenia.
Ile fragmentów tekstu jest zwracanych na jedno wyszukiwanie RAG (1–20). Domyślnie: 5.Wyższe wartości dostarczają więcej kontekstu dla LLM, ale zwiększają zużycie tokenów.
Maksymalna liczba znaków na fragment przy dzieleniu dokumentów (500–10 000). Domyślnie: 1 500.Mniejsze fragmenty dają dokładniejsze wyszukiwanie. Większe zachowują więcej kontekstu w każdym wyniku.
Nakładanie między kolejnymi fragmentami (0–40%). Domyślnie: 15%.Nakładanie zapewnia, że ważny kontekst na granicach fragmentów nie zostanie utracony. Większe nakładanie tworzy więcej chunków i zużywa więcej miejsca.
Minimalne podobieństwo kosinusowe do uwzględnienia wyniku (0,1–1,0). Domyślnie: 0,35.Niższe wartości zwracają więcej wyników (lepszy recall). Wyższe wartości zwracają tylko wysoko trafne wyniki (lepsza precyzja). Dla treści wielojęzycznych używaj niższych progów (0,3–0,4).
Jeśli masz dokumentację projektu (strony internetowe, portal dokumentacji, pliki README, wiki) i chcesz przekształcić ją w strukturalną bazę wiedzy dla swojego agenta AI Revol, możesz użyć Claude Code do analizy dokumentacji i wygenerowania gotowych do przesłania plików TXT.
Prompt do generowania bazy wiedzy
# Instrukcja: Generowanie plików bazy wiedzy z dokumentacji## KontekstUżywam Revol — platformy do tworzenia agentów sprzedaży AIz RAG (Retrieval-Augmented Generation). Mój agent odpowiadana pytania korzystając z bazy wiedzy: przesłane pliki sądzielone na fragmenty (chunks, maks. 2000 znaków, 20%nakładania się), konwertowane na wektory przez OpenAItext-embedding-ada-002 (1536 wymiarów), przechowywane wPostgreSQL z pgvector i przeszukiwane za pomocą podobieństwakosinusowego podczas inferencji.Muszę przekształcić dokumentację mojego projektu w zestawplików .txt zoptymalizowanych pod ten pipeline RAG — abyagent mógł znajdować i cytować dokładne odpowiedzi.## Jak działa chunking RAG (ważne dla struktury plików)- Każdy plik jest dzielony na fragmenty po ~2000 znaków z 20% nakładaniem na granicach zdań- Nazwa pliku staje się częścią metadanych embeddingu — używaj opisowych nazw- Krótsze, skoncentrowane pliki działają lepiej niż jeden duży- Każdy chunk powinien być zrozumiały sam w sobie- Strukturyzowana treść (listy, tabele jako tekst, jasne nagłówki) dzieli się lepiej niż ciągły tekst## Twoje zadanie### Krok 1: Analiza całej dokumentacjiPrzeczytaj każdy plik dokumentacji projektu. Dla każdegopliku zidentyfikuj:1. Temat, który obejmuje2. Kluczowe fakty, ustawienia, konfiguracje i wartości3. Procedury krok po kroku4. Opisy funkcji ze szczegółami (limity, opcje, formaty)5. Ceny, plany i limity (jeśli dotyczy)6. Szczegóły techniczne (API, parametry, integracje)### Krok 2: Planowanie struktury plikówPogrupuj powiązaną treść w logiczne tematy. Każdy plikpowinien obejmować JEDEN spójny temat. Docelowe rozmiary:- Idealnie: 2 000–6 000 znaków na plik (1–3 chunki)- Maksymalnie: 10 000 znaków (5 chunków)- Jeśli temat jest większy, podziel na podtematyKonwencja nazewnictwa: {Nazwa-Tematu}.txt- Opisowe nazwy z myślnikami- Bez prefiksów numerycznych (kolejność nie ma znaczenia dla RAG)- Nazwa powinna wskazywać na zawartośćPrzykłady:- Platform-Overview.txt- Getting-Started.txt- Pricing-Plans.txt- API-Authentication.txt- Webhook-Integration.txt### Krok 3: Pisanie plikówDla każdego pliku przestrzegaj tych zasad:Zasady treści:- Zacznij od jasnego nagłówka tematu jako zwykły tekst- Pisz zwykłym tekstem — bez Markdown, bez HTML, bez komponentów JSX- Konwertuj tabele na czytelne listy lub pary klucz-wartość- Konwertuj instrukcje krok po kroku na listy numerowane- Podawaj konkretne wartości: liczby, limity, ceny, opcje, wartości domyślne, formaty, URL- Każdy akapit powinien być zrozumiały sam w sobie (samodzielne chunki)- Usuń elementy nawigacyjne i linki bez wartości informacyjnej- Zachowaj oryginalny język dokumentacjiOptymalizacja pod RAG:- Umieszczaj ważne informacje na początku — odpowiedź przed wyjaśnieniem- Używaj spójnej terminologii we wszystkich plikach- Naturalnie powtarzaj kluczowe terminy (poprawia wyszukiwanie)- Dla funkcji z ustawieniami: nazwa, typ, wartość domyślna, opcje i opis- Dla integracji: dostawca, metoda auth, kroki konfiguracji, dostępne narzędzia/funkcjeCo wykluczyć:- Zrzuty ekranu i odniesienia do obrazów- Markup komponentów UI (tabs, accordions, cards, frames)- Linki "Zobacz też" i nawigacja- Tekst dekoracyjny i treści marketingowe- Zduplikowana treść### Krok 4: Utworzenie wyniku1. Utwórz tymczasowy katalog (np. temp-knowledge-base/)2. Zapisz wszystkie pliki .txt3. Wylistuj pliki z rozmiarami i opisami tematów4. Podaj podsumowanie: łączna liczba plików i rozmiar## Opcjonalnie: Generowanie seedera agenta z workflowJeśli projekt używa Revol i potrzebujesz też stworzyćagenta AI z workflow, wygeneruj Laravel database seeder, który:1. Tworzy AiAgent z: - Odpowiednim system promptem do wsparcia dokumentacji - LLM: gpt-4o-mini, temperature: 0.3 (dokładność) - Osobowość: wysoka jasność (8-9), wysoka formalność (6-7), mało humoru (2-3), mało emoji (1-2)2. Buduje workflow Smart Router: - Node Start z keyword-edges do node'ów ekspertów - 3-6 custom node'ów "ekspertów", każdy dla grupy tematycznej - Każdy ekspert ma conversation_goal opisujący domenę - Każdy ekspert ma narzędzia search_documents + get_company_info - Jeden fallback-edge do node'a General Assistant - Wszyscy eksperci połączeni z node'em Formatter - Node'y głosowe (STT/TTS) domyślnie nieaktywne3. Słowa kluczowe na edges powinny odpowiadać naturalnemu słownictwu użytkowników## Dane wejścioweMoja dokumentacja znajduje się tu: [ŚCIEŻKA LUB URL]Nazwa projektu: [NAZWA]Opis projektu: [KRÓTKI OPIS]company_id dla seedera: [ID lub pomiń seeder]
Ten prompt działa najlepiej z kompleksowymi portalami dokumentacji, dokumentacją produktów, referencjami API i bazami wiedzy. Wygenerowane pliki .txt są gotowe do przesłania bezpośrednio do File Managera Revol — wystarczy przeciągnąć i upuścić, a następnie kliknąć Train.