Искусственный интеллект для голосовых ассистентов | Наносемантика | ПромоСтраницы
Добавить в корзинуПозвонить
Добавить в корзинуПозвонить
Искусственный интеллект для голосовых ассистентов

Взаимодействие человека с машинами на естественном языке гораздо удобнее, чем через команды. Но как обеспечить одновременно простоту общения и точное выполнение заданий роботом? Григорий Шершуков, директор по продуктам «Наносемантики», объясняет решение этой проблемы с помощью диалоговой платформы DialogOS.

Долгое время компьютеры не могли понимать человеческий язык со всеми его нюансами. Однако, развитие больших языковых моделей (LLM) позволило создать роботов с ИИ, способных к общению.

Но LLM пока не гарантируют точности выполнения команд. Для этого нужны четкие инструкции. DialogOS объединяет возможности LLM и строгих правил, обеспечивая автоматизированное голосовое и текстовое взаимодействие для бесперебойной работы роботов.

DialogOS – российская диалоговая платформа с ИИ

Компания «Наносемантика» с 2005 года работает в сфере ИИ, разрабатывая голосовых и текстовых виртуальных ассистентов, нейронные сети и системы анализа больших данных. Флагманский продукт компании – диалоговая платформа DialogOS

DialogOS предназначена для разработки и поддержки разговорных систем на основе ИИ. Ее главной особенностью является модульная архитектура, которая позволяет гибко настраивать и масштабировать систему. Это делает платформу идеальной для создания решений любой сложности – от виртуальных ассистентов до сложного ИИ для робототехники. Возможности интеграции через API предоставляют компаниям полную свободу в настройке системы под свои нужды и существующие бизнес-процессы. Например, «Энергосбыт Плюс» с помощью голосового бота консультирует пользователей, принимает показания счетчиков, заявки на установку приборов учета и др. Так за первый год работы он снизил нагрузку на операторов более чем в 7 раз.

Одно из ключевых преимуществ DialogOS – способность использовать контекст на всех этапах диалога. Это значительно улучшает взаимодействие с пользователями, поскольку система понимает не только текущее сообщение, но и весь ход предыдущего общения. Это позволяет избежать повторяющихся вопросов и сделать общение с ИИ более естественным и плавным. Кроме того, платформа поддерживает многозадачность, что особенно важно для крупных проектов, где нужно одновременно обрабатывать большое количество диалогов.

Платформа работает на 40 языках и включает в себя огромную базу знаний, которая насчитывает 3611 диалоговых сценариев, 5230 специализированных словарей и более 3 миллионов адаптивных вопросов. Это гарантирует высокую гибкость при создании и настройке ассистентов для различных отраслей и сфер применения.

Искусственный интеллект для голосовых ассистентов
Искусственный интеллект для голосовых ассистентов

Интерфейс платформы DialogOS

Для повышения точности работы с данными система использует предобученные нейронные сети, которые обеспечивают эффективное определение именованных сущностей (например, имена, даты, адреса) и классификацию интентов (целей поисковых запросов). Это важно для корректной интерпретации запросов пользователей, что делает взаимодействие с ассистентами ещё более точным и понятным.

Одним из главных преимуществ DialogOS является сочетание нейросетевых алгоритмов и ручных правил. В зависимости от задач платформа может использовать нейросети для решения сложных вопросов, требующих глубокого анализа контекста и интерпретации, а ручные правила – для обработки более простых и предсказуемых сценариев. Это позволяет добиться высокой точности при выполнении задач, сохраняя при этом гибкость и возможность адаптации. Так в КАПИТАЛ LIFE роботизированное голосовое меню с применением ИИ от «Наносемантики» способно свободно понимать и обрабатывать человеческий язык, классифицировать полученную информацию и адресовать абонента по наиболее подходящему направлению обслуживания согласно заранее запланированной логике или переводить на оператора.

Сложности и вызовы

Многие клиенты интересуются интеграцией ChatGPT и других больших языковых моделей для улучшения обработки запросов и генерации ответов. Однако использование LLM в корпоративной среде сопряжено с трудностями: большой объем данных, необходимость учета специфики бизнеса и тонкостей обработки естественного языка, а также риск "галлюцинаций" (выдача некорректной информации).

DialogOS решает эти проблемы, эффективно распределяя задачи между компонентами системы и управляя взаимодействием диалоговых сценариев и LLM, таких как GPT. Это обеспечивает баланс между удобством пользователя, скоростью и качеством ответов.

Для предотвращения "галлюцинаций", DialogOS использует два подхода: специальные промпты (инструкции) для контроля ответов ИИ и обучение модели на данных компании для повышения релевантности. Кроме того, для обеспечения безопасности данных, DialogOS позволяет обучать собственную LLM внутри корпоративной сети.

В итоге, DialogOS с гибкой интеграцией различных LLM помогает компаниям внедрить ИИ в свои процессы, улучшив взаимодействие с клиентами и обеспечив контроль над коммуникацией.

Решаемые задачи и кейсы

Цифровые аватары

Одним из наиболее интересных направлений использования платформы DialogOS является создание цифровых аватаров. Они сочетают в себе обширную базу знаний, интегрированную с возможностями GPT-модели, что позволяет им эффективно взаимодействовать с пользователями в режиме реального времени.

Искусственный интеллект для голосовых ассистентов
Искусственный интеллект для голосовых ассистентов

Один из примеров – разработанный МФТИ мультимедийный стенд «Снежинка» для арктической станции. Он использует интерактивную панель, дисплей и говорящий 3D-аватар с функциями распознавания речи и видеоаналитики для презентации научных достижений. Аватар общается на естественном языке, поддерживая визуальный контакт.

Другой пример – аватар известного политика Владимира Жириновского. Цифровой образ распознает речь, генерирует ответ согласно логике мышления прототипа и говорит синтезированным голосом с интонациями, присущими Владимиру Вольфовичу. При создании цифрового аватара «Наносемантика» проанализировала 18 000 часов аудио- и видеозаписей, а также книги и печатные интервью – в общем более 90 Тб данных. Для обучения модели использовался датасет из 150 000 инструкций.

Искусственный интеллект для голосовых ассистентов
Искусственный интеллект для голосовых ассистентов

Цифровой помощник юриста Юстина распознает разговорную речь и может проконсультировать по юридическим вопросам. В ее базе знаний федеральные законы, НПА и полная информация с сайта Министерства. 3D-аватар в образе молодой деловой женщины обладает полной синхронизацией речи, эмоций, мимики и жестов.

Цифровой аватар Лили на стенде Минпромторга на ВЭФ-2024

Цифровой аватар Лили стала одной из интерактивных «изюминок» стенда Министерства промышленности и торговли РФ на ВЭФ-2024. Аватар приветствовала посетителей, свободно общалась на разные темы и приняла участие в дискуссионной сессии на площадке «Гостиная губернаторов» в рамках Восточного экономического форума 2024.

Программные комплексы для управления робототехникой на естественном языке

Улучшение нейросетей позволяет роботам понимать естественный язык, упрощая взаимодействие. В отличие от прежних методов, требующих точных команд, теперь роботы воспринимают свободные формулировки, распознают речь и эмоции. Платформа DialogOS (совместный проект с МФТИ) предоставляет архитектуру с голосовым интерфейсом и API для управления роботами в различных областях, от промышленности до быта.

Текстовые или голосовые роботы

Использование текстовых и голосовых роботов становится уже традиционным способом автоматизации взаимодействия с клиентами. Виртуальные консультанты от «Наносемантики» позволяют значительно оптимизировать обслуживание клиентов через различные каналы, снижая нагрузку на сотрудников и сокращая операционные затраты.

В «Беларусбанк» виртуальный консультант от «Наносемантики» обслуживает до 30 тыс. клиентов в месяц. Он распознает свыше 90% запросов пользователей, что на 25% снижает количество обращений к online-консультанту.

В одном крупном ритейлере косметики и парфюмерии виртуальный консультант от «Наносемантики» ежемесячно общается с 22 тыс. пользователями. Он консультирует их по ассортименту, ближайшим магазинам и дисконтным программам, при этом 83% клиентов за консультацией повторно обращаются к боту, а не оператору.

Будущее платформы DialogOS

«Наносемантика» имеет в своем портфеле 12 основных продуктов и успела реализовать более 180 проектом. Компания постоянно совершенствует DialogOS, делая работу с платформой ещё более гибкой и эффективной для различных сценариев использования.

Искусственный интеллект для голосовых ассистентов
Искусственный интеллект для голосовых ассистентов

Новые нейросетевые модули DialogOS

Новые нейросетевые модули – «Оценка сентимента», «Опечаточник», «Кластеризация тем» – дают возможность оценить, насколько запрос клиента является негативным или позитивным, идентифицировать слова с ошибками, а также собирать и классифицировать информацию по разговорам с учетом тем.

Искусственный интеллект для голосовых ассистентов
Искусственный интеллект для голосовых ассистентов

Кастомные отчеты позволяют пользователю самому выбирать критерии и условия для анализа, оперативно получать специфичные данные для глубокой аналитики

DialogOS теперь позволяет создавать кастомные отчеты, дополняющие стандартные. Эта функция обеспечивает сбор и анализ данных, специфичных для каждого сценария, с возможностью разметки для углубленного анализа. Улучшенные ассистенты предоставляют релевантную информацию без лишних вопросов, а быстрый просмотр диалогов и разметка реплик пользователей способствуют дополнительному обучению нейросетей.

Искусственный интеллект для голосовых ассистентов
Искусственный интеллект для голосовых ассистентов

Диалоговая платформа DialogOS играет значительную роль в развитии разговорного ИИ, предлагая гибкие и масштабируемые решения для бизнеса. Она помогает компаниям автоматизировать взаимодействие с клиентами, улучшать качество обслуживания и снижать затраты. Благодаря использованию современных нейросетевых технологий и модульной архитектуры, DialogOS адаптируется под любые задачи, делая общение с ИИ более естественным и эффективным.

Листая дальше, вы перейдёте на nanosemantics.ai