В 2017 году появился голосовой помощник AliGenie от Alibaba, «живущий» в смарт-колонке Tmall Genie. Выбираем самого умного голосового помощника в 2023 году.
Call-центры вымрут как динозавры: что ждет рынок голосовых помощников
10 главных умных помощников в 2022 году: голосовые помощники на русском языке и не только | Новости и аналитика Новости Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника. |
Что умеет голосовой помощник Алиса | В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. |
29 регионов России используют голосовых помощников в сфере здравоохранения | Новости и аналитика Новости Некоторыми госуслугами стало возможно пользоваться с помощью голосового помощника. |
Голосовой помощник
База знаний голосового помощника единой справочной службы Правительства Москвы регулярно обновляется. Сегодня она содержит 132 тематики, из них 26 добавили в прошлом году. В 2021 году на линии единой справочной службы внедрили гибридный классификатор, который сочетает технологии, позволяющие нейросети распознавать намерения абонентов и в зависимости от этого определять сценарий беседы. Благодаря этому обеспечен высокий уровень успешного определения тематики обращений. Если раньше голосовой помощник мог распознавать только отдельные слова, то сейчас не только распознает фразы целиком, но и понимает их смысл. Уровень восприятия человеческой речи роботом вырос с 92 до 96 процентов — это значит, что он с большой вероятностью правильно поймет сказанные слова, даже если человек находится в шумном месте. Также в прошлом году у виртуального ассистента появился новый навык — создание заявки на поиск документа в центре госуслуг. Если он не был готов, пользователь может подать повторный запрос, а также попросить робота перезвонить и сообщить его статус. С момента введения нового навыка жители столицы создали более 50 тысяч таких заявок. Всего голосовой помощник обработал уже свыше 31,3 миллиона обращений — почти половину от общего числа звонков в единую справочную службу. Среднее время обслуживания жителей роботом составляет две минуты.
Робот в едином диспетчерском центре Одним из лидеров по объему входящего трафика также является единый диспетчерский центр, который был создан более пяти лет назад. За это время он принял свыше 36 миллионов звонков. Чаще всего туда обращаются по вопросам водоснабжения, неисправности лифтов, освещения в подъезде.
Выходит, это матричная система генерации случайных событий в рамках заданного аргумента. Для примера рассмотрим такую модель графа с возможными физическими состояния человека: По картинке мы можем определить, что человек может находиться в четырех состояниях, причем не в каждое может перейти сразу. Например, если человек лежит, то он не может просто взять и пойти, для этого ему нужно пройти цепочку последовательности — сесть, встать и только потом уже пойти. Алгоритмы марковской модели в распознавании речи работают примерно по тому же принципу матричного графа. А благодаря наличию нейросетей, любой желающий при должных знаниях может «научить» свой сервис обучаться, то есть чем больше люди будут пользоваться теми или иными функциями, тем лучше будут оптимизированы алгоритмы работы распознавания речи, благодаря улучшению генерирующей работы Марковской модели, расширением словарного запаса и пополнением библиотеки голосовых паттернов. Так, например, в 1990 году увидела свет одна из первых коммерческих программ по распознаванию речи — Dragon Dictate, ориентированная на массовый рынок потребителей. За эту космическую сумму денег пользователь получал возможность писать текст, просто проговаривая его в микрофон. К сожалению, программа не всегда работала корректно, и допускала даже по тем меркам достаточно серьезные ошибки. Представляла она из себя портал VAL, призванный помочь покупателям в поиске нужной информации о интересующих товарах. Сферой использования этой системы были торговые центры, информационные стенды и прочие коммерчески ориентированные области деятельности. В 1997 году, вышла обновленная версия вышеупомянутой Dragon Dictate, в ней разработчики потрудились над скоростью и качеством распознавания речи. Google уже в 2002 году предприняла решение по развитию голосового поиска и интеграцией его в свою экосистему. Voice Search не имел особого успеха, но послужил отправной точкой для будущего приложения Voice Search для iPhone и Android, ставшим впоследствии интерактивным помощником Google Now, а с недавних пор Google Assistant. Система распознавания речи 2002 года от Google как и аналоги конкурентов работала при помощи телефонного звонка на специальный номер, пользователи не оценили такой способ поиска, так как он оказался попросту неудобен. Но разработчики компании засучив рукава продолжили движение в этой сфере, и судя по нынешним продуктам, время в стенах офиса на Mountain View было потрачено не зря. В систему была введена фирменная система распознавания и синтезирования речи VoiceOver. Её главным отличием была независимость от «спикера», то есть пользоваться ей мог кто угодно — систему не нужно было обучать к определенному голосу. Возможность синтеза речи нашла применение для людей с плохим зрением, система могла читать любой текст на экране, от статей в интернете, электронных писем до элементов системы, например пунктов в меню настроек и названия файлов на рабочем столе. Позже Microsoft решили не отставать от Apple и интегрировали голосовое управление в свою новую Windows Vista. Google Voice Search Наконец, мы переходим к становлению нынешних голосовых помощников. Как я говорил, Google уже в 2002 году попробовали себя в создании поиска по телефону. Спустя 7 лет компания представила приложение голосового поиска на смартфонах iPhone. Приложение функционировало с помощью облачных вычислений на серверах Google. Благодаря огромному числу голосовых запросов пользователей, словесная и фонетическая база данных на серверах к 2011 году насчитывала уже около 230 миллиардов слов на разных языках мира. Благодаря колоссальному успеху, приложение Voice Search по сей день закрепляет за собой славу самого популярного сервиса Google. Позже появилась версия и под собственную операционную систему Android. В связи с этим корпорацией была развернута масштабная рекламная кампания смартфонов на фирменной платформе, акцентируя внимание клиентов на уникальной для того времени фишке — голосовом поиске. В 2011 году функцию голосового поиска получил и фирменный браузер Google Chrome. В 2012 году вместе с презентацией Android 4.
Такой рост в АБК связывают с совпадением нескольких факторов: лояльность аудитории Доступность голосовых ассистентов в потребительском сегменте и роботов-операторов в бизнесе формируют у аудитории привычку общаться с цифровым голосом. Это связано с ростом эффективности технологии: робот лучше понимает собеседника и быстрее оказывает ему необходимую услугу. В то же время происходит закономерное увеличение пользовательской базы , обрабатываемой роботами-операторами: в первом полугодии 2021 года роботы АБК обзвонили в 800 раз больше клиентов, чем в аналогичный период 2019; в среднем звонок от робота получают более 1 млн человек в день. Для нас это идеальный пример доверия между человеком и роботом в телефонной трубке: вы звоните ему с конкретным запросом и получаете четкий ответ. Стоит отметить, что спектр сегментов бизнеса, в которых эти технологии востребованы, становится шире. Чаще всего роботы-операторы используются в рамках теле маркетинга , информирования, коллекшена и банкинга; среди дополнительных сфер — проведение опросов, обучение и HR.
Третье достоинство Алисы — ее отличное взаимодействие с многочисленными сервисами Яндекса заказ еды, такси и прочие полезности , а не только поиском. Станция позволяет даже управлять телевизором при помощи голоса, предлагая подписчикам Яндекс. Плюс доступ к обширнейшей видеотеке если фильм Алиса в ней не находит, то выдает ссылки на YouTube и другие сервисы. Наконец, Алиса прекрасно интегрируется с многочисленными экосистемами умного дома, которые поддерживаются Яндексом список их велик и постоянно расширяется , настолько, что может управлять устройствами, которые расположены и в городской квартире, и на даче, за многие километры от города. При этом разработчики постоянно учат Алису новому. Сервис использует технологии SpeechKit для распознавания голоса и Turing, чтобы подобрать подходящий по смыслу ответ. Алиса обучена поддерживать живой диалог с помощью суперкомпьютеров «Яндекса», современных технологий машинного обучения и систем искусственного интеллекта на базе нейронных сетей. Не так давно к ней прикрутили, к примеру, пока в режиме бета-тестирования, возможность доступа к собственной яндексовской нейросетке YaGPT. На фоне всех этих достижений, которые помноженные на широчайшую аудиторию самого Яндекса и агрессивный маркетинг, доминирование Алисы в России совсем не удивляет. А амбиции подталкивают «Яндекс» адаптировать Алису под работу в других странах. Компания активно нанимает специалистов по обучению «Алисы» другим языкам помимо русского о чем писал Хабр в мае. Маруся Вторая русская голосистая девушка родилась в Mail. Ru нынешнем VK немногим позже Алисы. С самого начала Маруся умела включать музыку из плейлиста пользователей «ВКонтакте», подсказывала цены на железнодорожные и авиабилеты, а также искала информацию в интернете. Преимуществом помощника была команда «Маруся, запомни», которая позволяет ассистенту сохранить нужную информацию в памяти устройства. Озвучивает Марусю актриса театра и кино Елена Соловьева. Поначалу из-за разницы в возрасте Маруся Алисе проигрывала. В Сети есть несколько веселых роликов с «параллельным» тестированием Алисы и Маруси, в которых вторая явно тупит не успевает за интеллектом и остроумием первой. Но время шло, и Маруся стала наверстывать упущенное. Сегодня Маруся уверенно ведет поиск в Сети по голосовым запросам, позволяет пользоваться сервисами из экосистемы VK включая те же такси или каршеринг , дает возможность управлять устройствами умного дома, их список не так широк, как у Алисы, но все равно обширен. Недавно, например, научилась управлять Smart TV. По сути, различия между Марусей и Алисой сегодня состоят только в том, что они ориентированы на разные группы пользователей, поклонников яндексовских сервисов и сторонников VK. Иными словами, для тех, кто пользуется Яндекс. Есть у Маруси несколько собственных фишек. Разработчики тут можно почитать о процессе этой помощницы сделали упор на ее использование детьми. Она может занять их развлечениями, обучать их основам английского и математики, читать сказки. Молодым родителям вполне может быть что и маленьким детям тоже такая функциональность явно понравится. Живет Маруся в почте и социальной сети VK с «ВКонтакте» она, к слову, отлично интегрирована и позволяет пользоваться соцсеткой не через экран, а на слух , для мобильных устройств есть отдельные приложения. А основным устройством для Маруси являются умные колонки VK. Наконец, доступ к Марусе можно получить и через детские умные часы от разных производителей.
Приятно познакомиться, Ева, Олег, Маша, Салют, Алиса! Протестировали голосовых помощников
Начиналось все в 1952 году, когда было анонсировано появление первого голосового распознавателя чисел, разработанного компанией Bell. Позже, мир увидел инструмент под названием Shoebox, который был представлен IBM на Всемирной выставке в Сиэтле в 1962 году. Разработка была способна выполнять математические функции, а также распознавать 16 произнесенных слов и цифры от 1 до 9. Следующим этапом стало решение Harpy, созданное учёными университета Карнеги — Меллон в 1970-х годах, распознающее уже 1011 слов, что соответствовало словарному запасу трёхлетнего ребёнка. Как только были созданы технологии, способные распознавать последовательности слов, компании начали создавать для них приложения. В течение 1990-х годов такие компании, как IBM, Apple и другие, занимались разработкой решений, использующих распознавание голоса: в 1993 году Apple выпустила Macintosh с технологией PlainTalk, а в апреле 1997 года Dragon представила решение, позволяющее превращать в текст до 100 слов в минуту. Далее развитие шло в направлении решений для умного дома: в ноябре 2014 года Amazon представила смарт-динамик Alexa, через два года, в ноябре 2016-го, компания Google выпустила Google Home, а в феврале 2018 года на этот рынок вошла и компания Apple, представив Apple HomePod. А что происходит на рынке голосовых помощников в России сегодня? Голосовые помощники чаще всего используются в промо-целях.
VoiceTech уже сегодня снимает с людей множество задач не только в крупных, но в средних и малых компаниях. Голосовые роботы под голосовыми технологиями и роботами мы понимаем инструменты для автоматических звонков в бизнесе нанимают сотрудников, обзванивают клиентов, продают, рекламируют и приглашают на мероприятия. И порой делают это так, что собеседники даже не подозревают: они говорят не с человеком. Наибольший спрос на голосовые решения аналитики отмечают в банковской сфере и e-commerce — их использование помогает компаниям не отставать от потребительского спроса. При этом в ближайшее время количество голосовых решений увеличится и в сфере здравоохранения — в период COVID-19 голосовые чат-боты уже помогали проводить скрининги и сортировку пациентов.
Чтобы помощница перестала реагировать на вопросы, можно изъять значок из панели внизу. Схожий механизм запуска через смартфон: нажать на бело-фиолетовый значок поисковика Яндекса или сказать кодовую фразу. Если ничего не происходит, то нажать в Яндекс. Голосовые помощники «Сири» Siri в свое время стала новаторским продуктом от Apple. Она была презентована пользователям еще в 2011 году. Но Apple сама позволила конкурентам вывести на рынок аналоги, отвоевавшие у Сири множество позиций. Все потому, что Siri долгое время не занимались в том объеме, которого требовал ассистент. А конкуренты в кратчайшие сроки смогли предложить пользователям больше вариантов. Возможности Siri Siri, если можно так выразиться о виртуальном ассистенте, не хватило «своего лица». Ее ответы очень лаконичны, она не готова рассуждать с пользователями о том, о чем бот пока не имеет представления. Одни и те же шутки и анекдоты быстро наскучили пользователям. Даже на вопрос о собственном имени Siri не способна рассказать какую-нибудь историю, которая бы эмоционально вовлекала пользователей. Изначально возможности Сири были восприняты пользователями с восторгом: помощь при поиске, обеспечение работы некоторых функций смартфона вроде установки будильника на определенное время и напоминаний. Но очень скоро прочие помощники смогли предложить более широкий список выполняемых социальных задач, пока Сири в переносном смысле топталась на месте. Поэтому конкуренты успели обойти изобретение Apple по следующим параметрам: лучшая обучаемость на основе нейронных сетей лучшее распознавание речи благодаря улучшенным встроенным электронным технологиям не нужно произносить команду несколько раз, в то время как Сири на iOS часто промахивается даже с четко произнесенными запросами практически не готова имитировать беседу об абстрактных и отвлеченных понятиях юмор Сири достаточно однообразен, его не хватает у Сири нет аналога человеческого характера и нет своей истории, что заставляло бы эмоционально сопереживать ей и возвращаться к ней снова Руководство по эксплуатации Впрочем, не все владельцы IPhone ждут от ассистента комического стенд-апа, так что Сири по-прежнему помогает пользователям в решении задач. Например, она знает, как совершать покупки на Amazon и работать с Alexa. Siri — коренная обитательница систем IPhone и IPad. Ее вызывают следующие команды: Настройки — Основные — Siri.
Помимо универсальности, важна и корректная работа сервисов. Обеспечить ее помогают следующие технологии. Автоматическое распознавание речи ASR. Процесс, позволяющий услышать и понять запрос пользователя. Для этого необходим микрофон и интернет-соединение, по которому аудиосигнал передается на серверы для последующего анализа и конвертации в текст. Понимание естественного языка NLU. Когда голос преобразован в текст, искусственному интеллекту необходимо понять его смысл и определить ключевые детали запроса. Выполнение задачи через интерфейсы программирования приложений API. Сюда входит умение найти информацию в Сети, передать команду сопряженным устройствам экосистемы, набрать номер из списка контактов и другие действия. Взаимодействие с пользователем. К нему относятся ответы через динамик устройства, текстом или с помощью световых индикаторов. Самообучение и обновление. Чтобы взаимодействие с голосовым помощником было продуктивным, он должен постоянно совершенствоваться.
К 2023 году число голосовых помощников в мире достигнет восемь млрд
Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». Этого голосового ассистента создали, когда Siri ещё не была адаптирована для русскоязычных пользователей. Теперь — с нейросетью YandexGPT. Она позволила улучшить мои сценарии работы, а это значит, что я умею ещё больше, чем раньше. Я доступна в умных устройствах, сервисах и приложениях Яндекса, а ещё в новом Чате. Придумываю идеи, пишу и редактирую тексты.
Обновлён рейтинг голосовых помощников
ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями | Голосовой помощник знает, когда ребенок зашел в школу и во сколько вышел из нее. |
Категория:Виртуальные ассистенты — Википедия | Перспективы монетизации голосовых помощников Согласно прогнозам Juniper Research, к 2023 году в мире будут использовать 8 миллиардов голосовых помощников — на одного человека будет приходиться дватри ассистента. |
Голосовой помощник для социальных служб
Выбор имени голосового помощника проходил в несколько этапов. Перспективы монетизации голосовых помощников Согласно прогнозам Juniper Research, к 2023 году в мире будут использовать 8 миллиардов голосовых помощников — на одного человека будет приходиться дватри ассистента. Мне, как и любому другому владельцу смартфона, важна не столько функциональность голосового помощника, сколько удобство его использования. Запускать каждый раз приложение, чтобы Маруся зачитала новости или позвонила кому-то из телефонной книги. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. Чат с Алисой, работающей на нейросети YandexGPT — широкие возможности искусственного интеллекта. В новом Чате с виртуальным ассистентом Алисой можно придумывать креативные идеи для работы и учебы, писать и редактировать тексты, создавать новые кулинарные. Если мысль о том, что голосовые помощники захватывают мир, пугает вас, сейчас самое время отвести взгляд от экрана.
«Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России
По словам Раихина, чат-бот ВТБ может решить более половины клиентских вопросов, при этом в банке достаточно сложные и разнообразные бизнес-направления. В этом плане все индивидуально у каждой компании, зависит от масштабов бизнеса, объема и специфики задач, решаемых с помощью ботов", - рассказывает об опыте работы с чат-ботом управляющий директор Абсолют Банка Иван Любименко. В конечном итоге правильно организованная поддержка с использованием продвинутых решений может помочь бизнесу нарастить NPS и снизить отток. При этом, по его словам, чат-боты могут быть использованы не только для поддержки.
От умных колонок и умных часов до умных телевизоров и умных термостатов - эти устройства с голосовым помощником используются практически во всех сферах нашей жизни. Используя систему Медиалогия, проанализировали, какие голосовые помощники упоминались чаще всего пользователями соцсетей в период с января 2021 года по июнь 2022 года. С большим отрывом самой обсуждаемой стала Алиса от Яндекса 420,1 тыс. Ее разработка началась в 2016 году, а уже в 2018 году она начала покорять пользователей. Изначально Алиса могла находить информацию лишь в поисковике Яндекса, но теперь благодаря нейронным сетям она распознает речь, анализирует её, определяет тематику диалога, выделяют полезную для поиска информацию, синтезируют ответы помощника.
На второй позиции Сбер Салют 157,4 тыс. Пользователь может сам выбрать своего персонажа: Джой, Афину и Сбер. Любой из них поможет перевести деньги, разобраться с платежами, сообщит о состоянии счета и даже закажет еду домой и запишет на стрижку. Третье место заняла Маруся 156,8 тыс.
Помощники на базе ИИ могут не выходя за рамки бюджета обзвонить значительно большую целевую аудиторию, чем операторы контакт-центра», — отмечает эксперт. В настоящий момент решения на базе ИИ доступны не только корпоративным клиентам, но также малому и среднему бизнесу. По словам эксперта, стоимость создания голосового помощника не сильно изменилась за последние годы. При этом нельзя игнорировать факт увеличения затрат на инфраструктуру и содержания собственного штата специалистов, занимающихся продакшеном, исследованием и разработкой, со стороны вендоров.
Для их интеграции не требуется менять оборудование, но это не означает, что ассистента на основе искусственного интеллекта можно подсадить в любое устройство, подключенное к интернету. В частности, в обозримом будущем меньше половины пользователей телевизоров со встроенными голосовыми помощниками будут их использовать. Доминирующую долю в структуре устройств с голосовыми помощниками будут занимать смартфоны. Это неудивительно, ведь в каждом смартфоне на операционной системе Android или iOS предустановлены голосовые помощники Assistant и Siri. При этом другие устройства с голосовыми помощниками не очень-то востребованы.
Forbes Экспертиза
Лучший голосовой ассистент: сравниваем 6 помощников. К озвучке данных голосовых помощников были привлечены российские актеры: Даниил Щебланов, Татьяна Ермилова, Анастасия Чернобровина. Невидимый, но полезный ассистент: что умеют делать Алиса, Маруся и другие российские голосовые помощники.
Лучшие голосовые помощники: 4 ассистента с поддержкой русского языка
В 2017 году появился голосовой помощник AliGenie от Alibaba, «живущий» в смарт-колонке Tmall Genie. Голосовые помощники появились уже несколько лет назад, но я, как и большинство людей, до сих пор не научилась их применять для упрощения своих жизненных задач. Теперь — с нейросетью YandexGPT. Она позволила улучшить мои сценарии работы, а это значит, что я умею ещё больше, чем раньше. Я доступна в умных устройствах, сервисах и приложениях Яндекса, а ещё в новом Чате. Придумываю идеи, пишу и редактирую тексты. Независимая подборка лучших голосовых помощников с учетом всех плюсов и минусов. Наш список голосовых ассистентов поможет вам выбрать наиболее подходящего, чтобы он стал вашим надежным помощником в повседневных задачах.