База знань використовує RAG (Retrieval-Augmented Generation), щоб надати вашому агенту доступ до бізнес-контенту. Документи розбиваються на частини (chunks), перетворюються на векторні embeddings та зберігаються для семантичного пошуку.Перейдіть на вкладку Knowledge Base в панелі агента. Тут ви обираєте, які саме дані агент використовуватиме для відповідей.
Оберіть модель для перетворення тексту у векторні ембедінги:
Модель
Провайдер
Розмірність
Ціна
Найкраще для
text-embedding-3-small
OpenAI
1536
$0.02/1M токенів
Загальне використання, англійський контент
text-embedding-3-large
OpenAI
1536
$0.13/1M токенів
Вища точність, англійський контент
BGE-M3
DeepInfra
1024
$0.01/1M токенів
Мультимовний контент (100+ мов)
Зміна моделі ембедінгу видаляє всі існуючі ембедінги компанії. Після перемикання потрібно перенавчити всіх агентів. Перед застосуванням зміни з’явиться діалог підтвердження.
Скільки текстових фрагментів повертається за один RAG-пошук (1–20). За замовчуванням: 5.Більше значення дає більше контексту для LLM, але збільшує використання токенів.
Максимум символів на фрагмент при розбитті документів (500–10,000). За замовчуванням: 1,500.Менші фрагменти дають точніший пошук. Більші — зберігають більше контексту в кожному результаті.
Перекриття між послідовними фрагментами (0–40%). За замовчуванням: 15%.Перекриття гарантує, що важливий контекст на межах фрагментів не буде втрачено. Більше перекриття створює більше чанків та використовує більше сховища.
Мінімальна косинусна подібність для включення результату (0.1–1.0). За замовчуванням: 0.35.Нижчі значення повертають більше результатів (краща повнота). Вищі — лише високорелевантні результати (краща точність). Для мультимовного контенту використовуйте нижчі пороги (0.3–0.4).
Якщо у вас є документація проекту (сторінки сайту, портал документації, README файли, wiki) і ви хочете перетворити її на структуровану базу знань для вашого AI-агента Revol, ви можете використати Claude Code для аналізу документації та генерації готових до завантаження TXT файлів.
Промпт для генерації бази знань
# Інструкція: Генерація файлів бази знань із документації## КонтекстЯ використовую Revol — платформу для створення AI-агентівпродажів з RAG (Retrieval-Augmented Generation). Мій агентвідповідає на питання, використовуючи базу знань: завантаженіфайли розбиваються на частини (chunks, макс. 2000 символів,20% перекриття), перетворюються на вектори через OpenAItext-embedding-ada-002 (1536 вимірів), зберігаються вPostgreSQL з pgvector і шукаються за косинусною подібністюпід час інференсу.Мені потрібно перетворити документацію мого проекту на набір.txt файлів, оптимізованих для цього RAG-пайплайну — щобагент міг знаходити й цитувати точні відповіді.## Як працює RAG-розбиття (важливо для структури файлів)- Кожен файл розбивається на частини по ~2000 символів з 20% перекриттям на межах речень- Назва файлу стає частиною метаданих embedding — використовуйте описові назви, щоб система могла ідентифікувати джерело- Короткі, сфокусовані файли працюють краще, ніж один великий- Кожна частина (chunk) має бути самодостатньою — читач повинен розуміти частину без оточуючого тексту- Структурований контент (списки, таблиці як текст, чіткі заголовки) розбивається краще, ніж суцільні абзаци## Твоє завдання### Крок 1: Аналіз усієї документаціїПрочитай кожен файл документації проекту. Для кожного файлувизнач:1. Тему, яку він охоплює2. Ключові факти, налаштування, конфігурації та значення3. Покрокові процедури4. Описи функцій з конкретикою (ліміти, опції, формати)5. Тарифи, плани та квоти (якщо є)6. Технічні деталі (API, параметри, інтеграції)### Крок 2: Планування структури файлівЗгрупуй пов'язаний контент за логічними темами. Кожен файлмає охоплювати ОДНУ цілісну тему. Цільові розміри файлів:- Ідеально: 2 000–6 000 символів на файл (1–3 chunks)- Максимум: 10 000 символів (5 chunks)- Якщо тема більша — розбий на підтемиКонвенція іменування: {Назва-Теми}.txt- Описові назви з дефісами- Без числових префіксів (порядок не важливий для RAG)- Назва має натякати на вміст для метаданихПриклади:- Platform-Overview.txt- Getting-Started.txt- Pricing-Plans.txt- API-Authentication.txt- Webhook-Integration.txt### Крок 3: Написання файлівДля кожного файлу дотримуйся цих правил:Правила контенту:- Починай з чіткого заголовка теми як звичайний текст- Пиши звичайним текстом — без Markdown, без HTML, без JSX-компонентів- Перетворюй таблиці на читабельні списки або пари ключ-значення- Перетворюй покрокові інструкції на нумеровані списки- Включай конкретні значення: числа, ліміти, ціни, опції, значення за замовчуванням, формати, URL- Кожен абзац або розділ має бути зрозумілим окремо (самодостатні chunks)- Видаляй навігаційні елементи, посилання "Далі" та перехресні посилання без інформаційної цінності- Зберігай мову оригіналу документаціїОптимізація для RAG:- Виноси важливу інформацію на початок — спочатку відповідь, потім пояснення- Використовуй єдину термінологію в усіх файлах- Природно повторюй ключові терміни, щоб вони з'являлися в декількох chunks (покращує пошук)- Для функцій з налаштуваннями: вказуй назву, тип, значення за замовчуванням, опції та опис- Для інтеграцій: вказуй провайдера, метод авторизації, кроки налаштування, доступні інструменти/функціїЩо виключати:- Скріншоти та посилання на зображення- Розмітку UI-компонентів (tabs, accordions, cards, frames)- Посилання "Див. також" та навігаційні блоки- Декоративний текст та маркетинговий вміст- Дублікат контенту (не повторюй одну інформацію в різних файлах)### Крок 4: Створення результату1. Створи тимчасову директорію (напр., temp-knowledge-base/)2. Запиши всі .txt файли в неї3. Перелічи всі файли з розмірами та описами тем4. Надай підсумок: загальна кількість файлів і розмір## Опціонально: Генерація сідера Workflow-агентаЯкщо проект використовує Revol і тобі також потрібно створитиAI-агента з workflow для відповідей на запитання щодо цієїдокументації, згенеруй Laravel database seeder, який:1. Створює AiAgent з: - Відповідним system prompt для підтримки документації - LLM: gpt-4o-mini, temperature: 0.3 (точність) - Personality: висока ясність (8-9), висока формальність (6-7), низький гумор (2-3), мало емодзі (1-2)2. Будує Smart Router workflow: - Start-нода з keyword-edges до нод-експертів - 3-6 кастомних нод "експертів", кожна для групи тем - Кожен експерт має свій conversation_goal з описом домену - Кожен експерт має інструменти search_documents + get_company_info - Один fallback-edge до ноди General Assistant - Всі експерти з'єднані з Formatter-нодою - Voice-ноди (STT/TTS) неактивні за замовчуванням3. Ключові слова на edges мають відповідати природній лексиці, яку використовують користувачі при запитаннях з кожної теми## Вхідні даніМоя документація знаходиться тут: [ШЛЯХ АБО URL]Назва проекту: [НАЗВА]Опис проекту: [КОРОТКИЙ ОПИС]Target company_id для сідера: [ID або пропустити сідер]
Цей промпт найкраще працює з комплексними порталами документації, документацією продуктів, довідниками API та базами знань. Згенеровані .txt файли готові для завантаження безпосередньо у File Manager Revol — просто перетягніть та натисніть Train.