CASE / OPENEDAI-SUPPORT-RAG
← все кейсыAI · поддержкагод · 2025длительность · 10 недель

AI-ассистент поддержки

RAG-ассистент учится на базе знаний компании, отвечает в чате и Telegram, эскалирует сложное оператору.

AI
Ассистент поддержки
на линии · RAG
Telegram
Не приходит код подтверждения, что делать?
Проверьте папку «Спам» и доступность номера. Если кода нет 5 минут — запросите повторно. Помогло?
FAQ · входРегламент 2.4
Уже повторял, не приходит
↑ эскалация оператору
Передаю оператору с историей диалога — ответит в течение 2 минут.
Введите сообщение…
дефлекция · 24 ч
72%
без оператора
3 сек
время ответа
−48%
нагрузка
24/7
первая линия
тикеты сегодня1 284
● закрыто ботом 72%● оператор 28%
источники · совпадение
FAQ · вход и коды
0.94
Регламент 2.4 · SMS
0.88
Возвраты · сроки
0.41
порог 0.60 · ниже → эскалация
01 / CONTEXTКонтекст

Контекст

Клиент под NDA: сервисная компания с большой базой знаний и поддержкой, которая тонула в однотипных вопросах. 70% обращений — это «где счёт», «как вернуть», «не приходит код» — ответы давно лежат в регламентах, но люди ищут их вручную.

Готовые чат-боты на скриптах не подходили: база знаний меняется каждую неделю, а на жёстких сценариях бот быстро врёт. Нужен был ассистент, который отвечает по актуальным документам и честно отдаёт оператору то, чего не знает.

02 / BRIEFЗадача

Задача

  1. 01Отвечать по реальной базе знаний клиента, а не «из головы» модели
  2. 02Один ассистент в трёх каналах: сайт-виджет, Telegram, чат поддержки
  3. 03Бесшовная эскалация на оператора с полным контекстом диалога
  4. 04Аналитика дефлекции: что закрыто ботом, что ушло людям и почему
  5. 05Никаких выдуманных ответов: нет источника — нет ответа
03 / SOLUTIONРешение

Решение

/ step 01

Индексация базы знаний

Регламенты, FAQ и статьи режем на смысловые чанки, считаем эмбеддинги и кладём в векторную БД. Переиндексация по вебхуку при правке документа — ответы всегда на свежей версии.

/ step 02

RAG-пайплайн с цитатами

На вопрос достаём релевантные фрагменты, LLM формулирует ответ строго по ним и прикладывает ссылки на источники. Низкая уверенность или пустой контекст — сразу эскалация, без догадок.

/ step 03

Каналы и эскалация

Один движок, три фронта: виджет на сайте, Telegram-бот и встройка в чат поддержки. При передаче оператор получает весь диалог и найденные источники — не нужно переспрашивать клиента.

/ step 04

Дашборд дефлекции

Видно процент тикетов, закрытых без человека, темы с низкой уверенностью и пробелы в базе знаний. Раз в неделю отдаём отчёт «что дописать», и дефлекция растёт сама.

04 / STACKАрхитектура

Архитектура

LLMRAGpgvectorQdrantNext.jsTelegram Bot APIPostgres

Ядро — retrieval-сервис поверх векторной БД (pgvector на старте, Qdrant под рост). На запрос он отдаёт top-k фрагментов с порогом схожести; LLM работает только с этим контекстом, а каждый ответ хранит, какие источники использованы — для аудита и аналитики.

Каналы — тонкие адаптеры к одному API: виджет, Telegram-бот и встройка в чат поддержки. Диалоги, метрики дефлекции и логи эскалаций лежат в Postgres; дашборд читает их напрямую, без отдельного хранилища событий.

05 / RESULTSРезультаты

Результаты

0%
тикетов без оператора
0сек
среднее время ответа
−48%
нагрузка на поддержку
0/7
первая линия
06 / HONESTЧто не получилось с первого раза

Что не получилось с первого раза

  • На старте бот отвечал уверенно даже при слабом совпадении с базой — пара ответов оказалась выдумкой. Добавили порог уверенности и правило «нет источника — нет ответа»: при низком совпадении ассистент честно зовёт оператора вместо догадок.
  • Переиндексацию сначала гоняли по ночному расписанию, и свежие правки регламентов попадали в ответы только на следующий день. Перевели на вебхук по событию правки — теперь база и ответы синхронны в минутах.
07 / VOICEСлово клиента
Главное — он не выдумывает. Если ответа нет в базе, передаёт оператору с контекстом, а не врёт уверенным тоном. Поэтому мы спокойно поставили его на первую линию.
HS
Head of Support
Руководитель поддержки · NDA
08 / TEAMКоманда

Команда

DK
Product lead
ML
ML-инженер
SY
Backend
AS
Дизайнер
09 / ROADMAPЧто дальше

Что дальше

  • Голосовая линия: тот же RAG для входящих звонков
  • Авто-черновики ответов оператору на эскалациях
  • Проактивные подсказки по пробелам в базе знаний
10 / RELATEDСвязанные кейсы