Искусственный интеллект для голосовых ассистентов

Взаимодействие человека с машинами на естественном языке гораздо удобнее, чем через команды. Но как обеспечить одновременно простоту общения и точное выполнение заданий роботом? Григорий Шершуков, директор по продуктам «Наносемантики», объясняет решение этой проблемы с помощью диалоговой платформы DialogOS.

Долгое время компьютеры не могли понимать человеческий язык со всеми его нюансами. Однако, развитие больших языковых моделей (LLM) позволило создать роботов с ИИ, способных к общению.

Но LLM пока не гарантируют точности выполнения команд. Для этого нужны четкие инструкции. DialogOS объединяет возможности LLM и строгих правил, обеспечивая автоматизированное голосовое и текстовое взаимодействие для бесперебойной работы роботов.

DialogOS – российская диалоговая платформа с ИИ

Компания «Наносемантика» с 2005 года работает в сфере ИИ, разрабатывая голосовых и текстовых виртуальных ассистентов, нейронные сети и системы анализа больших данных. Флагманский продукт компании – диалоговая платформа DialogOS

DialogOS предназначена для разработки и поддержки разговорных систем на основе ИИ. Ее главной особенностью является модульная архитектура, которая позволяет гибко настраивать и масштабировать систему. Это делает платформу идеальной для создания решений любой сложности – от виртуальных ассистентов до сложного ИИ для робототехники. Возможности интеграции через API предоставляют компаниям полную свободу в настройке системы под свои нужды и существующие бизнес-процессы. Например, «Энергосбыт Плюс» с помощью голосового бота консультирует пользователей, принимает показания счетчиков, заявки на установку приборов учета и др. Так за первый год работы он снизил нагрузку на операторов более чем в 7 раз.

Одно из ключевых преимуществ DialogOS – способность использовать контекст на всех этапах диалога. Это значительно улучшает взаимодействие с пользователями, поскольку система понимает не только текущее сообщение, но и весь ход предыдущего общения. Это позволяет избежать повторяющихся вопросов и сделать общение с ИИ более естественным и плавным. Кроме того, платформа поддерживает многозадачность, что особенно важно для крупных проектов, где нужно одновременно обрабатывать большое количество диалогов.

Платформа работает на 40 языках и включает в себя огромную базу знаний, которая насчитывает 3611 диалоговых сценариев, 5230 специализированных словарей и более 3 миллионов адаптивных вопросов. Это гарантирует высокую гибкость при создании и настройке ассистентов для различных отраслей и сфер применения.

Искусственный интеллект для голосовых ассистентов

Интерфейс платформы DialogOS

Для повышения точности работы с данными система использует предобученные нейронные сети, которые обеспечивают эффективное определение именованных сущностей (например, имена, даты, адреса) и классификацию интентов (целей поисковых запросов). Это важно для корректной интерпретации запросов пользователей, что делает взаимодействие с ассистентами ещё более точным и понятным.

Одним из главных преимуществ DialogOS является сочетание нейросетевых алгоритмов и ручных правил. В зависимости от задач платформа может использовать нейросети для решения сложных вопросов, требующих глубокого анализа контекста и интерпретации, а ручные правила – для обработки более простых и предсказуемых сценариев. Это позволяет добиться высокой точности при выполнении задач, сохраняя при этом гибкость и возможность адаптации. Так в КАПИТАЛ LIFE роботизированное голосовое меню с применением ИИ от «Наносемантики» способно свободно понимать и обрабатывать человеческий язык, классифицировать полученную информацию и адресовать абонента по наиболее подходящему направлению обслуживания согласно заранее запланированной логике или переводить на оператора.

Сложности и вызовы

Многие клиенты интересуются интеграцией ChatGPT и других больших языковых моделей для улучшения обработки запросов и генерации ответов. Однако использование LLM в корпоративной среде сопряжено с трудностями: большой объем данных, необходимость учета специфики бизнеса и тонкостей обработки естественного языка, а также риск "галлюцинаций" (выдача некорректной информации).

DialogOS решает эти проблемы, эффективно распределяя задачи между компонентами системы и управляя взаимодействием диалоговых сценариев и LLM, таких как GPT. Это обеспечивает баланс между удобством пользователя, скоростью и качеством ответов.

Для предотвращения "галлюцинаций", DialogOS использует два подхода: специальные промпты (инструкции) для контроля ответов ИИ и обучение модели на данных компании для повышения релевантности. Кроме того, для обеспечения безопасности данных, DialogOS позволяет обучать собственную LLM внутри корпоративной сети.

В итоге, DialogOS с гибкой интеграцией различных LLM помогает компаниям внедрить ИИ в свои процессы, улучшив взаимодействие с клиентами и обеспечив контроль над коммуникацией.

Решаемые задачи и кейсы

Цифровые аватары

Одним из наиболее интересных направлений использования платформы DialogOS является создание цифровых аватаров. Они сочетают в себе обширную базу знаний, интегрированную с возможностями GPT-модели, что позволяет им эффективно взаимодействовать с пользователями в режиме реального времени.

Один из примеров – разработанный МФТИ мультимедийный стенд «Снежинка» для арктической станции. Он использует интерактивную панель, дисплей и говорящий 3D-аватар с функциями распознавания речи и видеоаналитики для презентации научных достижений. Аватар общается на естественном языке, поддерживая визуальный контакт.

Другой пример – аватар известного политика Владимира Жириновского. Цифровой образ распознает речь, генерирует ответ согласно логике мышления прототипа и говорит синтезированным голосом с интонациями, присущими Владимиру Вольфовичу. При создании цифрового аватара «Наносемантика» проанализировала 18 000 часов аудио- и видеозаписей, а также книги и печатные интервью – в общем более 90 Тб данных. Для обучения модели использовался датасет из 150 000 инструкций.

Цифровой помощник юриста Юстина распознает разговорную речь и может проконсультировать по юридическим вопросам. В ее базе знаний федеральные законы, НПА и полная информация с сайта Министерства. 3D-аватар в образе молодой деловой женщины обладает полной синхронизацией речи, эмоций, мимики и жестов.

Цифровой аватар Лили на стенде Минпромторга на ВЭФ-2024

Цифровой аватар Лили стала одной из интерактивных «изюминок» стенда Министерства промышленности и торговли РФ на ВЭФ-2024. Аватар приветствовала посетителей, свободно общалась на разные темы и приняла участие в дискуссионной сессии на площадке «Гостиная губернаторов» в рамках Восточного экономического форума 2024.

Программные комплексы для управления робототехникой на естественном языке

Улучшение нейросетей позволяет роботам понимать естественный язык, упрощая взаимодействие. В отличие от прежних методов, требующих точных команд, теперь роботы воспринимают свободные формулировки, распознают речь и эмоции. Платформа DialogOS (совместный проект с МФТИ) предоставляет архитектуру с голосовым интерфейсом и API для управления роботами в различных областях, от промышленности до быта.

Текстовые или голосовые роботы

Использование текстовых и голосовых роботов становится уже традиционным способом автоматизации взаимодействия с клиентами. Виртуальные консультанты от «Наносемантики» позволяют значительно оптимизировать обслуживание клиентов через различные каналы, снижая нагрузку на сотрудников и сокращая операционные затраты.

В «Беларусбанк» виртуальный консультант от «Наносемантики» обслуживает до 30 тыс. клиентов в месяц. Он распознает свыше 90% запросов пользователей, что на 25% снижает количество обращений к online-консультанту.

В одном крупном ритейлере косметики и парфюмерии виртуальный консультант от «Наносемантики» ежемесячно общается с 22 тыс. пользователями. Он консультирует их по ассортименту, ближайшим магазинам и дисконтным программам, при этом 83% клиентов за консультацией повторно обращаются к боту, а не оператору.

Будущее платформы DialogOS

«Наносемантика» имеет в своем портфеле 12 основных продуктов и успела реализовать более 180 проектом. Компания постоянно совершенствует DialogOS, делая работу с платформой ещё более гибкой и эффективной для различных сценариев использования.

Новые нейросетевые модули DialogOS

Новые нейросетевые модули – «Оценка сентимента», «Опечаточник», «Кластеризация тем» – дают возможность оценить, насколько запрос клиента является негативным или позитивным, идентифицировать слова с ошибками, а также собирать и классифицировать информацию по разговорам с учетом тем.

Кастомные отчеты позволяют пользователю самому выбирать критерии и условия для анализа, оперативно получать специфичные данные для глубокой аналитики

DialogOS теперь позволяет создавать кастомные отчеты, дополняющие стандартные. Эта функция обеспечивает сбор и анализ данных, специфичных для каждого сценария, с возможностью разметки для углубленного анализа. Улучшенные ассистенты предоставляют релевантную информацию без лишних вопросов, а быстрый просмотр диалогов и разметка реплик пользователей способствуют дополнительному обучению нейросетей.

Диалоговая платформа DialogOS играет значительную роль в развитии разговорного ИИ, предлагая гибкие и масштабируемые решения для бизнеса. Она помогает компаниям автоматизировать взаимодействие с клиентами, улучшать качество обслуживания и снижать затраты. Благодаря использованию современных нейросетевых технологий и модульной архитектуры, DialogOS адаптируется под любые задачи, делая общение с ИИ более естественным и эффективным.

Заинтересовались?

Листая дальше, вы перейдёте на nanosemantics.ai

Добавить в корзину Позвонить