Встроенные ИИ возможности

ИИ‑агент в Omnigram — управляемая система с RAG‑архитектурой: ответы опираются на ваши документы, а вмешательство настраивается по триггерам и правилам.

Архитектура ИИ‑агентов (RAG и векторные базы)

Omnigram использует RAG (Retrieval‑Augmented Generation), превращая статические документы в активных консультантов. Система не просто «генерализует» текст — она извлекает релевантные фрагменты из вашей базы знаний и строит ответ на конкретных данных компании.

Организация базы знаний

В векторное хранилище можно загрузить до 3 ключевых документов (инструкции, прайс‑листы, FAQ) объёмом до 10 МБ каждый. Для точности используется многоступенчатый конвейер обработки запроса (pipeline):

Документ‑роутинг. «Младшая» (быстрая и дешёвая) модель анализирует вопрос и определяет, к какому документу обращаться.
Векторный поиск + Cohere Rerank. Система находит кандидатов‑чанки, затем rerank‑модель семантически переранжирует фрагменты, отделяя полезное от шума — это критически повышает точность и снижает риск галлюцинаций.
Саммаризация контекста. Если диалог затягивается (например, > 20 сообщений), «младшая» модель в фоне сжимает историю переписки, сохраняя суть. Это помогает основной модели помнить контекст без раздувания стоимости и без выхода за лимиты контекстного окна.

Экономика и выбор моделей

Благодаря оркестрации «младших» моделей для рутины и «старших» для генерации ответа стоимость одного сообщения для клиента начинается от $0.005. Вы выбираете финальную модель: Gemini (включая быстрые Flash‑версии), OpenAI, Anthropic, DeepSeek или Grok.

Сценарии работы и гибридный режим

ИИ‑агент интегрируется в процесс не как замена сотрудникам, а как страховка/фильтр первой линии. Гибкие триггеры позволяют задать точные правила вмешательства.

Режимы активности

Всегда. Агент отвечает 24/7.
Только в рабочее время. Помогает разгрузить менеджеров в пиковые часы.
Только в нерабочее время. Подхватывает ночные и выходные заявки, удерживая клиента до прихода смены.

Функция «Ожидание человека»

Агента можно настроить на отложенный ответ: бот вмешивается только если тишина в треде длится более, например, 30 минут (значение настраивается в секундах). Это даёт менеджерам шанс ответить самостоятельно, используя ИИ как страховку от долгого молчания. Правило можно сделать гибридным: задержка в рабочее время, но мгновенный ответ ночью.

Приоритет человека (Human Takeover)

Ключевое правило: как только живой сотрудник отправляет в тред любое сообщение, ИИ‑агент автоматически деактивируется (замолкает) в этом диалоге. Это предотвращает ситуации, когда бот перебивает сотрудника или вступает в спор перед клиентом.

Языковой барьер и автоперевод

Опционально доступен двусторонний машинный перевод в реальном времени — язык собеседника определяется автоматически.

Входящий поток (Клиент → Команда)

Сообщения клиента переводятся на рабочий язык команды. Режим отображения:

Только перевод. Максимально «чистый» чат.
Оригинал + перевод. Для контроля точности или обучения сотрудников.

Исходящий поток (Команда → Клиент)

Менеджер пишет ответ на своём языке, система переводит его на язык клиента и отправляет только результат перевода. Оригинал сообщения клиенту не показывается — это позволяет нанимать сотрудников без знания иностранных языков для работы на глобальных рынках.