Техническое задание: Интеллектуальная база знаний (RAG) с API и интеграцией в Bitrix24 1. Этапы реализации проекта Этап 1: Инфраструктура и локальное хранение (РФ)
Развертывание системы на сервере заказчика (локация: РФ). Настройка защищенного хранилища для документов (PDF, сканы, текст, таблицы). Все файлы и векторная база должны физически находиться на сервере в РФ. Обеспечение стабильного доступа к LLM (GPT-4o / Claude / Llama) с учетом региональных ограничений (проксирование или локальный запуск). Этап 2: Индексация данных и настройка RAG
Загрузка и автоматическая обработка массива данных (50–200+ файлов). Настройка качественного парсинга (OCR для сканов, разбивка текста на оптимальные смысловые блоки — чанки). Настройка логики ответов: система должна отвечать строго на основе загруженных документов, цитируя источники и минимизируя «галлюцинации». Этап 3: Тестирование и подготовка API
Проверка точности ответов на контрольной группе вопросов. Настройка системного промпта (роль ассистента, стиль общения). Генерация рабочего API Endpoint для внешних интеграций. Этап 4: Интеграция (Опционально)
Установка чат-виджета на корпоративный сайт. Интеграция с чатами и открытыми линиями Bitrix24. Примечание: Данный этап мы можем реализовать своими силами при наличии документированного API от системы, однако готовы рассмотреть реализацию «под ключ» силами подрядчика при условии разумного ценообразования. 2. Предполагаемый стек решений (Self-hosted) Для реализации задачи требуется стек, исключающий блокировки и обеспечивающий контроль над данными:
Платформа: Dify.ai, AnythingLLM или аналогичные Open-source RAG системы. Модели (LLM): GPT-4o / Claude 3.5 (через устойчивые прокси-шлюзы) или полностью локальные модели Llama 3 / Qwen 2 (через Ollama). Векторная БД: ChromaDB, Qdrant или PGVector. Среда: Linux (Ubuntu) с поддержкой Docker, размещение в РФ. 3. Требования к подрядчику и условия выбора Мы ищем специалистов/команду с практическим опытом внедрения LLM в бизнес-процессы.
Критерии выбора:
Демонстрация портфолио: Обязательное наличие аналогичных настроенных баз знаний (RAG-систем). Будьте готовы показать интерфейс админки и примеры того, как система находит ответы в сложных PDF-документах. Опыт с РФ-инфраструктурой: Понимание специфики работы с зарубежными API из РФ и опыт настройки Self-hosted решений. Гибкость: Готовность передать работающее ядро системы с API нашей внутренней команде разработки или взять на себя полную интеграцию (сайт + Битрикс24) при согласовании сметы.