Статья Голосовые ассистенты (Роботы-операторы), 80% опрошенных россиян постоянно общаются с голосовыми помощниками, В первом полугодии количество звонков с помощью голосового робота составило 360 млн, Смотрите также Голосовые помощники. Голосовыми помощниками пользовались 63% россиян за последние полгода, – выяснили исследователи из Group4media. Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы.
Как настроить Марусю на телефоне. Здесь всё, что нужно знать
Дата публикации: 22. Если речь идет о локализации зарубежных виртуальных ассистентов, для пользователей рунета важен еще один фактор — качество адаптированной версии помощника. Мы постарались рассмотреть русскоговорящих ассистентов со всех этих позиций, но нужно понимать, что не все критерии объективны. Amazon Alexa , один из ведущих мировых виртуальных ассистентов, должен заговорить по-русски в 2022 году. Но поскольку официальной русскоязычной версии этого помощника пока нет, рассматривать в статье мы его не будем.
Google Ассистент Google Ассистент остается самым популярным голосовым помощником в мире. Ассистент запускается командой «Окей, Google» или долгим нажатием кнопки на главном экране гаджета. Речь помощника синтезируется по определенным значениям тембра, тональности и других параметров, то есть он не говорит голосом живого человека. Помощник от Google умеет искать информацию в одноименном поисковике, работать со звонками и сообщениями, управлять устройствами умного дома, находить объекты на картах и прокладывать к ним маршрут, включать мультимедийный контент и открывать сайты, вести диалоги с пользователем в рамках одной темы без необходимости уточнения, о чем именно идет речь.
О наиболее полезных командах помощника мы писали здесь. Конечно, работает он с сервисами экосистемы Google. Важное преимущество этого ассистента — умение анализировать поведение пользователя для выдачи более релевантных рекомендаций. Подобного инструмента технология Visual Snapshot нет ни у одного конкурирующего продукта.
Из недостатков помощника от Google отметим ориентированность на американский рынок и недостаточную «человечность» русскоязычной локализации. Пользователи жалуются, что виртуальный ассистент иногда «как не живой», а его адаптированность к российским реалиям оставляет желать лучшего. А еще при разговоре с ассистентом нужно предварять каждый вопрос фразой «Окей, Google», тогда как американская версия способна включаться в полноценный диалог без всяких повторов. Справедливости ради заметим, что Google Ассистент постепенно совершенствуется.
Так, за 8 месяцев с момента запуска сервиса в РФ помощник научился различать ударение в слове «замок», подружился со страховым сервисом «Согласие» и пополнил базу знаний информацией об услугах Сбербанка. Алиса Алиса от Яндекса — наиболее достойный конкурент Google Ассистента. Этот помощник изначально говорит на русском языке, его не нужно адаптировать, что само по себе большой плюс. А для машинного обучения нейросети разработчики использовали массив текстов из рунета и классику русской литературы — это помогает делать общение с помощником более «живым».
Так, Алиса умеет импровизировать, кокетничать и даже обижаться.
Так как голосовых помощников учат быть человечными? Если для распознавания голоса виртуальными ассистентами используются сложные вычисления, то решать вопрос человечности позволяет большой список ответов, сочиненных редакторами и психологами. Это заготовленные специалистами голосовые сообщения с продуманными сценариями, где составлены ответы на самые популярные вопросы и запросы людей.
Редакторы сознательно составляют пул ответов в стиле, который будет гармонировать с образом голосового помощника, чтобы образ был человечнее. Для ответов на вопросы, которые невозможно предугадать, голосовые помощники используют нейросети, обученные материалами из медиа, литературы, кино. Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги. Безопасность и конфиденциальность данных при использовании голосовых помощников Производители голосовых помощников уверяют, что данные пользователей конфиденциальны, а разговоры не прослушиваются, коммуникация с устройством безопасна.
Но как тогда голосовой помощник будет обучаться? Несмотря на слова корпораций о безопасности, нужно обращать внимание, что в момент настройки голосового помощникам пользователь дает согласие на использование и обработку персональных данных. Кроме того, без Data Science невозможна работа и развитие голосового помощника. Вопрос в том, как хранятся эти данные?
IT-гиганты сообщают, что голосовые помощники не записывают все, что происходит вокруг смартфона или колонки. Запись начинается только с момента запуска команды, обращения к ассистенту, вроде «Okey, Google», «Siri», «Алиса» и прочих. По словам разработчиков, записанные данные шифруются и хранятся на облаке, а их защите уделяют много внимания. Но все же в СМИ иногда всплывают неприятные истории нарушения конфиденциальности.
Так, в 2019 году выяснилось, что у Amazon разговоры с умной колонкой прослушивал специальный отдел независимых подрядчиков. А в 2021 году Google признал , что Google Assistant слушает пользователей в фоновом режиме.
У «Алисы» есть ряд и других достоинств и преимуществ: позволяет успешно вести поиск без помощи клавиатуры, что актуально не только для тех, кто находится за рулем, но не может в данный момент отвлечься от любой работы руками или даже имеет инвалидность скрашивает одиночество и умеет забавлять неожиданными ответами постоянно самообучается, развивая собственные ответы у «Алисы» практически нет проблем с распознаванием голосов даже с акцентами и разницей в тембрах благодаря технологии SpeechKit ответы помощницы отличаются для разных пользователей с разной геолокацией разработчики не развивают «Алису» в направлении хамства и агрессии в отношении пользователя, а также стараются привить ей манеру разговора «по делу» Минусы: все данные, которые будет получать голосовая помощница, будут сохраняться с привязкой к определенному аккаунту в Яндексе. Некоторые из них будут использоваться в рекламных целях. Или они могут быть подсмотрены другими пользователями, которым попадет в руки смартфон. Инструкция по использованию Ранние версии этого виртуального ассистента запускались при помощи отдельной программы. Сегодня «Алису» можно запустить с компьютера или телефона, сказав: «Слушай, Алиса» или найти специальную кнопку в Яндекс.
Чтобы помощница перестала реагировать на вопросы, можно изъять значок из панели внизу. Схожий механизм запуска через смартфон: нажать на бело-фиолетовый значок поисковика Яндекса или сказать кодовую фразу. Если ничего не происходит, то нажать в Яндекс. Голосовые помощники «Сири» Siri в свое время стала новаторским продуктом от Apple. Она была презентована пользователям еще в 2011 году. Но Apple сама позволила конкурентам вывести на рынок аналоги, отвоевавшие у Сири множество позиций. Все потому, что Siri долгое время не занимались в том объеме, которого требовал ассистент.
А конкуренты в кратчайшие сроки смогли предложить пользователям больше вариантов. Возможности Siri Siri, если можно так выразиться о виртуальном ассистенте, не хватило «своего лица». Ее ответы очень лаконичны, она не готова рассуждать с пользователями о том, о чем бот пока не имеет представления. Одни и те же шутки и анекдоты быстро наскучили пользователям. Даже на вопрос о собственном имени Siri не способна рассказать какую-нибудь историю, которая бы эмоционально вовлекала пользователей. Изначально возможности Сири были восприняты пользователями с восторгом: помощь при поиске, обеспечение работы некоторых функций смартфона вроде установки будильника на определенное время и напоминаний.
Самый непопулярный запрос — заказ товара. Об этом говорит исследование Forrester за 2020 год. Источник: cossa. Как голосовые помощники распознают речь Чтобы понимать человеческий голос, искусственный интеллект разделяет слова на звуки, а точнее — на звуковые маленькие части длиной в сотые доли секунды, фонемы. Затем каждая часть слова математически обрабатывается, получая в результате коэффициенты — они и описывают частотные характеристики звуковой части. На основе этих данных голосовой помощник определяет голосовой запрос. Иногда у голосового помощника не получается понять фразу, тогда он достраивает слово из контекста всего предложения. Для этого у ассистентов есть таблица вероятностей переходов, в которой описаны возможные последовательности букв в словах. Кстати, такие таблички помогают распознавать запросы пользователей в зависимости от их акцента, поэтому, например, в Siri можно выбрать британский или американский английский язык. Если спросить у голосового помощника «Как дела? Да и форма голосовых помощников все чаще обретает человеческие черты: имя, пол, голос, может быть даже чувство юмора. Так как голосовых помощников учат быть человечными? Если для распознавания голоса виртуальными ассистентами используются сложные вычисления, то решать вопрос человечности позволяет большой список ответов, сочиненных редакторами и психологами. Это заготовленные специалистами голосовые сообщения с продуманными сценариями, где составлены ответы на самые популярные вопросы и запросы людей. Редакторы сознательно составляют пул ответов в стиле, который будет гармонировать с образом голосового помощника, чтобы образ был человечнее. Для ответов на вопросы, которые невозможно предугадать, голосовые помощники используют нейросети, обученные материалами из медиа, литературы, кино. Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги.
Обзор голосовых помощников: что умеют Алиса, Салют, Маруся, Google Assistant и Siri
Начиналось все в 1952 году, когда было анонсировано появление первого голосового распознавателя чисел, разработанного компанией Bell. Позже, мир увидел инструмент под названием Shoebox, который был представлен IBM на Всемирной выставке в Сиэтле в 1962 году. Разработка была способна выполнять математические функции, а также распознавать 16 произнесенных слов и цифры от 1 до 9. Следующим этапом стало решение Harpy, созданное учёными университета Карнеги — Меллон в 1970-х годах, распознающее уже 1011 слов, что соответствовало словарному запасу трёхлетнего ребёнка. Как только были созданы технологии, способные распознавать последовательности слов, компании начали создавать для них приложения. В течение 1990-х годов такие компании, как IBM, Apple и другие, занимались разработкой решений, использующих распознавание голоса: в 1993 году Apple выпустила Macintosh с технологией PlainTalk, а в апреле 1997 года Dragon представила решение, позволяющее превращать в текст до 100 слов в минуту. Далее развитие шло в направлении решений для умного дома: в ноябре 2014 года Amazon представила смарт-динамик Alexa, через два года, в ноябре 2016-го, компания Google выпустила Google Home, а в феврале 2018 года на этот рынок вошла и компания Apple, представив Apple HomePod. А что происходит на рынке голосовых помощников в России сегодня? Голосовые помощники чаще всего используются в промо-целях.
Siri чуточку призадумалась: сразу она поставила лишь один будильник, хотя просили два.
Пришлось добавлять вечерний сигнал отдельным запросом. Google Assistant включил запрос в приложение будильника. Аналогичная ситуация с установкой таймера «Разбуди меня через полчаса» : помощники от Google и Apple легко завели время, ассистент «Яндекса» отказался. Просто спрашивать прогноз погоды слишком скучно — понятно же, что все три помощника справятся с этим легко. Поэтому зашли с другой стороны: «Мне завтра брать теплую куртку? Здесь ситуация похожая. Алиса сперва растерялась, но после повторного запроса собралась и показала прогноз погоды: Siri тоже не распознала подвох, а вот после вопроса «мне стоит завтра потеплее одеться? Google Assistant выдал список роликов по выбору трендовой куртки; на более конкретный вопрос «стоит завтра одеваться потеплее? Проще в приложении глянуть, что там завтра на улице.
Иньярриту и Metallica Помощники не всегда нормально понимают сложные имена. Это стало ясно после разговора с Алисой в «Яндекс. Станции»: система ни в какую не хотела распознавать Алехандро Гонсалеса Иньярриту в итоге все же нашла его, но понадобилось попыток десять. Вот и проверим на других ассистентах. Но сперва дадим шанс Алисе. Удивительно, но на смартфоне ассистент с первого раза верно понял имя.
На нее приходится наибольшее число звонков, поступающих в общегородской контакт-центр. Главная городская горячая линия стала одной из первых, где начали использовать искусственный интеллект, чтобы увеличить скорость и улучшить качество обработки заявок. Виртуальный ассистент может подсказать график работы и контакты органов власти, управ районов и управляющих компаний, адрес ближайшего центра госуслуг «Мои документы», записать на прием к специалистам, а также уточнить статус готовности документов. База знаний голосового помощника единой справочной службы Правительства Москвы регулярно обновляется. Сегодня она содержит 132 тематики, из них 26 добавили в прошлом году. В 2021 году на линии единой справочной службы внедрили гибридный классификатор, который сочетает технологии, позволяющие нейросети распознавать намерения абонентов и в зависимости от этого определять сценарий беседы. Благодаря этому обеспечен высокий уровень успешного определения тематики обращений. Если раньше голосовой помощник мог распознавать только отдельные слова, то сейчас не только распознает фразы целиком, но и понимает их смысл. Уровень восприятия человеческой речи роботом вырос с 92 до 96 процентов — это значит, что он с большой вероятностью правильно поймет сказанные слова, даже если человек находится в шумном месте. Также в прошлом году у виртуального ассистента появился новый навык — создание заявки на поиск документа в центре госуслуг. Если он не был готов, пользователь может подать повторный запрос, а также попросить робота перезвонить и сообщить его статус. С момента введения нового навыка жители столицы создали более 50 тысяч таких заявок. Всего голосовой помощник обработал уже свыше 31,3 миллиона обращений — почти половину от общего числа звонков в единую справочную службу. Среднее время обслуживания жителей роботом составляет две минуты.
После того как голосовой помощник услышал, интерпретировал запрос и нашел информацию на него, ему нужно вернуться с ответом к пользователю. Почти всегда информация, которую находит ассистент, — текстовая, поэтому ему необходимо считать ее и озвучить. Чтобы речь звучала естественно, для разработки голоса ассистента приглашают профессиональных дикторов или актеров, которые наговаривают тысячи часов речи. В целом, индустрия стремится делать все ответы надежными и этичными, но ошибки иногда встречаются. В составе команд разработчиков голосовых ассистентов может быть психолог, а то и несколько: они анализируют ответ помощника, насколько он безопасен и этичен для пользователя. Кроме того, перед выдачей ответов пользователю важно делать дополнительный фактчекинг данных от помощника. Да, ошибки в ответах пока могут быть, особенно в каких-то сложных навыках, например отгадывании загадок. При работе сразу с несколькими помощниками можно обратить внимание, что у каждого из них есть свои оригинальные черты: чувство юмора, тембр голоса, манера общения и даже пол. Зачем это нужно? Одно из объяснений — человек охотнее взаимодействует с устройством или технологией, у которой есть признаки эмпатии. Например, оно может «подыграть» пользователю: продолжить шутку, обозначить свои границы, дать ненавязчивый «человечный» совет. При этом разработчики голосового ассистента должны учитывать, что аудитория у продукта многомиллионная: пользоваться устройством могут взрослые, дети. Поэтому важно выдержать баланс, чтобы голосовой ассистент никого не обидел, не расстроил и тем более не причинил вред. Бывает, что разработчики стараются придавать своим продуктам некоторые индивидуальные черты. В то же время важно помнить про эффект зловещей долины , и производители это учитывают — большинство ассистентов не пытаются притворяться человеком и обычно стремятся к тому, чтобы не реагировать излишне человечно на определенные вопросы. Леонид Саночкин, технический лидер в МТС AI Сколько стоит создание ассистента и что для этого нужно уметь Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Например, разработка Олега обошлась «Тинькофф» примерно в 50 миллионов рублей и оправдала себя уже в первый месяц, когда позволила сэкономить столько же. Чтобы разработать своего помощника, стоит определиться с тем, какие проблемы будет решать ИИ и какой результат получат пользователи. Сейчас технологии позволяют разработать как голосового помощника, так и чат-бота. Они оба распознают человеческую речь, но первый может сам выстроить логическую цепочку, а второй отправит автоматизированный ответ. Если бюджет не позволяет разработать личного Олега, то лучше будет обратиться к экосистеме Сбера или Алисы, которые помогут разработать свой навык на их платформе. Навыки для Алисы можно создать с помощью платформы Яндекс. Диалоги , а Сбер работает в SmartApp Studio. Тех, кто не умеет программировать, выручит визуальный конструктор от Яндекса или сторонний Dialogflower. На базе Aimylogic можно создать навыки почти для всех известных ассистентов. По данным Just Al, создание чат-бота займет от недели до 3,5 месяцев и в среднем будет стоить от 250 до 300 тысяч рублей. При том можно заняться разработкой самостоятельно, и тогда придется оплатить лишь лицензию за использование конструктора , которая стоит от 5900 до 59 000 рублей в зависимости от количества пользователей. Работа строится по следующей схеме. Первым этапом определяются требования и создается ТЗ. На проектировании проводятся анализ и разметка пользовательских данных и создание макетов интерфейса. При разработке нужно будет реализовать бизнес-логику и интеграции. А после этого протестировать навык и запустить его. Какой голосовой ассистент лучше Алиса от Яндекса Интерфейс Алисы на смартфоне.
10 главных умных помощников в 2022 году
Эта задача решается при помощи редакторских ответов: команда авторов выбирает сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответа на каждый. Составлять ответы нужно в едином стиле, чтобы из них складывался цельный образ помощника. У каждого голосового ассистента есть личность: пол, имя, черты характера и стиль речи. Алиса не может позволить себе общаться с пользователем на «ты» и соблюдает дистанцию: здесь у неё есть прототип — Мэри Поппинс. Поэтому помощница не любит, когда с ней начинают заигрывать и сразу одергивает пользователя.
Для ответов на неклассифицируемые вопросы и реплики голосовые помощники обычно используют нейросети, обученные на базе текстов из медиа, книг и кино. Так, Алиса учится на самых разных материалах, в которых персонажи в том числе ругаются и спорят — и может научиться совсем не тому, чего хотят разработчики. Как и ребёнка, голосового помощника нельзя научить вести себя вежливо, ограждая от всего: то есть, обучая нейросеть на «чистом» датасете, где нет грубостей и прочих неприятных вещей, встречающихся в реальном мире. Если ассистент не будет знать о существовании подобных выражений, то он будет отвечать на них бездумно, случайными фразами — ведь для него эти слова останутся неизвестными.
Пусть лучше голосовой помощник знает, что это такое, и выработает определённую позицию по этим вопросам. Обучение ассистентов — как обучение детей: они всему учатся постепенно и иногда ошибаются. И это нормально. Попробуйте свои силы на Уроке цифры.
Яркие примеры — составить список необходимых продуктов, получить консультацию по поводу некоторых товаров или вообще рассчитать стоимость. Особенно интересны варианты из подборки ниже. ВкусВилл — с помощью этого умения можно найти и заказать продукты из одноименной сети с доставкой на дом. Перед заказом желательно авторизоваться, чтобы участвовать в акциях. Путешествия Увы, но после эпидемии коронавируса многие связанные с путешествиями навыки работают не так хорошо, как хотелось бы.
Простые авиабилеты — это умение показывает авиарейсы из сервиса Aviasales, причем на самые ближайшие дни. Нужно лишь ввести в строку, откуда и куда вы собираетесь поехать. В общем, это лишь для справки, купить билет можно будет только после перехода на сайт Aviasales. Travel — это не совсем навык, скорее чат с представителем сервиса. Ответ приходит довольно быстро, можно получить таким образом информацию по интересующим вопросам. Также здесь есть квест для детей и викторина, пройдя которую можно получить приз.
Для детей Развлечь ребенка? Легко, особенно для Алисы! У нее в запасе куча навыков, с помощью которых можно не только скрасить минуты ожидания, но и получить полезные знания или проверить свою память. Обычными загадками тут дело не обходится… Угадай мультфильм — Алиса включает отрывок или музыку из мультфильма, а ребенок должен отгадать его название. В этой игре можно зарабатывать опыт и кристаллы, соревноваться с другими игроками за первое место в рейтинге, а также добавлять понравившиеся песни в свою коллекцию в Яндекс. Ребенку необходимо угадывать места и предметы, а также отвечать на вопросы Алисы.
Сказки — об этом умении в свое время очень много говорили. Можно выбрать понравившийся вариант, и Алиса запустит сказку. Их читает не голосовой помощник, а звезды российской эстрады и кино. При желании можно перейти в Яндекс. Музыку к альбому, из которого воспроизводятся сказки. Продуктивность Поднимаем организацию своего рабочего времени на новый уровень с навыками голосового помощника Яндекс.
Если захотите, можете создать заметку или задачу, найти занятие по душе или вообще сообщить о нарушениях. Битрикс24 Ассистент — позволяет управлять своим профилем Битрикс24 через чат с ботом. Для начала понадобится авторизоваться через свой аккаунт. Впоследствии можно создавать задачи, добавлять встречи, а также писать сообщения. Поиск телефона — с помощью этого навыка можно найти свой телефон. Алиса попросит указать номер телефона в международном формате.
От обычного вызова это отличается тем, что голосовой ассистент запускает громкий звонок, даже если устройство находится в беззвучном режиме. Определитель информ — позволяет узнать регион определенного номера и обслуживающего его оператора связи. Если он привязан к какой-либо организации, в ответном сообщении обязательно будет указано ее название. А если указанный телефон найдется в базах подозрительных номеров, ниже отобразится дополнительная справка. Бизнес и финансы Если вы хотите рассчитать приблизительную стоимость кредита, узнать стоимость ценных бумаг или оформить страховку, то вам точно сюда. HeadHunter — позволяет найти интересные вакансии и узнать зарплату.
Станция, для которых она стала основным элементом пользовательского взаимодействия. Смотреть мультик «Тайна третьей планеты» на телевизоре, рядом с которым стоит Яндекс. Станция категорически не рекомендуется. Третье достоинство Алисы — ее отличное взаимодействие с многочисленными сервисами Яндекса заказ еды, такси и прочие полезности , а не только поиском. Станция позволяет даже управлять телевизором при помощи голоса, предлагая подписчикам Яндекс. Плюс доступ к обширнейшей видеотеке если фильм Алиса в ней не находит, то выдает ссылки на YouTube и другие сервисы. Наконец, Алиса прекрасно интегрируется с многочисленными экосистемами умного дома, которые поддерживаются Яндексом список их велик и постоянно расширяется , настолько, что может управлять устройствами, которые расположены и в городской квартире, и на даче, за многие километры от города.
При этом разработчики постоянно учат Алису новому. Сервис использует технологии SpeechKit для распознавания голоса и Turing, чтобы подобрать подходящий по смыслу ответ. Алиса обучена поддерживать живой диалог с помощью суперкомпьютеров «Яндекса», современных технологий машинного обучения и систем искусственного интеллекта на базе нейронных сетей. Не так давно к ней прикрутили, к примеру, пока в режиме бета-тестирования, возможность доступа к собственной яндексовской нейросетке YaGPT. На фоне всех этих достижений, которые помноженные на широчайшую аудиторию самого Яндекса и агрессивный маркетинг, доминирование Алисы в России совсем не удивляет. А амбиции подталкивают «Яндекс» адаптировать Алису под работу в других странах. Компания активно нанимает специалистов по обучению «Алисы» другим языкам помимо русского о чем писал Хабр в мае.
Маруся Вторая русская голосистая девушка родилась в Mail. Ru нынешнем VK немногим позже Алисы. С самого начала Маруся умела включать музыку из плейлиста пользователей «ВКонтакте», подсказывала цены на железнодорожные и авиабилеты, а также искала информацию в интернете. Преимуществом помощника была команда «Маруся, запомни», которая позволяет ассистенту сохранить нужную информацию в памяти устройства. Озвучивает Марусю актриса театра и кино Елена Соловьева. Поначалу из-за разницы в возрасте Маруся Алисе проигрывала. В Сети есть несколько веселых роликов с «параллельным» тестированием Алисы и Маруси, в которых вторая явно тупит не успевает за интеллектом и остроумием первой.
Но время шло, и Маруся стала наверстывать упущенное. Сегодня Маруся уверенно ведет поиск в Сети по голосовым запросам, позволяет пользоваться сервисами из экосистемы VK включая те же такси или каршеринг , дает возможность управлять устройствами умного дома, их список не так широк, как у Алисы, но все равно обширен. Недавно, например, научилась управлять Smart TV. По сути, различия между Марусей и Алисой сегодня состоят только в том, что они ориентированы на разные группы пользователей, поклонников яндексовских сервисов и сторонников VK. Иными словами, для тех, кто пользуется Яндекс. Есть у Маруси несколько собственных фишек. Разработчики тут можно почитать о процессе этой помощницы сделали упор на ее использование детьми.
Она может занять их развлечениями, обучать их основам английского и математики, читать сказки. Молодым родителям вполне может быть что и маленьким детям тоже такая функциональность явно понравится.
По словам Apple, прослушивание велось для того, чтобы повысить качество распознавания речи. Кто пользуется голосовыми помощниками Примерный портрет типичного любителя умных колонок — молодой человек в возрасте от 16 до 34 лет. Он с одинаковым успехом может быть как юношей, так и девушкой — статистика показывает, что голосовыми помощниками пользуются оба пола.
А ещё пользователь, вероятнее всего, китаец, так как наиболее популярны виртуальные помощники именно там. Вводить текстовые запросы на китайском довольно сложно, голос стал хорошей альтернативой. Да и в целом китайцы охотнее принимают новые технологии. Поколения по-разному используют помощников. В рамках исследования «Будущее голосового поиска» портал Search Engine Watch сравнил запросы к голосовому помощнику подростков и взрослых: Сценарии использования в бизнесе Чаще всего боты заменяют менеджеров на входящих звонках и обзвоне.
Один робот способен обработать за день до двух тысяч звонков. Компания может быстро окупить вложения на разработку помощника, убрав расходы на зарплаты, аренду площади, телефонию и интернет. Голосовой ассистент может решать и локальные задачи бизнеса. Например, в числе кейсов Surf есть концепт для ресторана KFC. Клиенту помогает сделать заказ виртуальный полковник Сандерс.
Пользователь может общаться с ним, как с кассиром. С помощью полковника Сандерса можно: быстро посмотреть нужный раздел меню, сказав «Покажи мне все бургеры»; найти самое выгодное по цене блюдо: «Покажи мне все бургеры по акции»; изучить новинки, близкие по вкусу. Система автоматически обрабатывает заказы постоянного клиента и предлагает попробовать блюда, схожие по составу; заказать доставку домой. Если клиент заказывает не первый раз, ему не нужно говорить адрес и вводить контакты. Заказ оформляется в разы быстрее; повторить заказ.
Чтобы приложение максимально подтолкнуло клиента к покупке, мы предложили в пару к голосовому ассистенту использовать AR-режим для любого блюда. Таким образом, голосовой ассистент помогает клиенту почувствовать себя так, будто он находится в реальном ресторане. Заказ блюд делается предельно быстро, компания может продать больше и сэкономить на обслуживании бизнеса. Другой пример использования голосового помощника — семейство виртуальных ассистентов Сбербанка. Это кейс с прицелом на кастомизацию: помощников три, каждый со своим характером, голосом и целевой аудиторией.
Количество сценариев соответствует широкому диапазону запросов: можно переводить деньги, записываться к парикмахеру, болтать, искать рецепты. Juniper Research утверждает, что к 2024 году потребители будут взаимодействовать с голосовыми помощниками на более чем 8,4 миллиарда устройств. Казалось бы, такая статистика предвещает расцвет популярности голосовых помощников, что ведёт к росту кейсов, связанных с технологией. Но если всмотреться внимательнее, всё не так однозначно. То есть большинство владельцев умных девайсов используют их исключительно как аудиоустройства.
Голосовые помощники
Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи. С голосовым ассистентом можно поболтать, о чём хотите — о погоде, кино или текущих делах. Голосовыми помощниками пользовались 63% россиян за последние полгода, говорится в исследовании Group4media. Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов. Google Ассистент остается самым популярным голосовым помощником в мире.
Голосовой помощник для социальных служб
Один из множества нетривиальных кейсов — компания «Лэнд-Сервис», которая обслуживает дорогостоящее холодильное оборудование. Мы сделали для них кастомизированное комплексное решение, которое самостоятельно распознает и присваивает степень критичности аварийных заявок, а дальше обзванивает всех ответственных лиц, от инженера до генерального директора, если ситуация действительно критична. Мы тоже не стоим на месте, постоянно ищем новые рынки, а наши ассистенты тем временем стремительно умнеют. Продвинутая версия VoiceBox мгновенно анализирует ответы, не делает пауз в диалоге с абонентами, обращается к клиенту по имени, уточняет адрес, состав заказа и другие переменные данные.
К тому же совершенствовались и упростились сценарии их использования, поэтому сейчас мы все чаще видим среди клиентов представителей малого и среднего бизнеса. Согласно глобальному исследованию , в 2021 году был зафиксирован значительный рост интереса к голосовым технологиями со стороны малого и среднего бизнеса, который превзошел среднегодовой прогноз рынка. В отчете утверждается, что бизнес увидел в голосовых технологиях большой потенциал для сокращения своих издержек, к тому же рынок голосовых приложений стал предлагать гибкое ценообразование, что значительно упростило интеграцию технологии в бизнес-процесс.
Поэтому компании из сферы услуг доставка, салоны красоты, кафе и рестораны, агентства недвижимости стали массово исследовать возможности продукта. Согласно нашим наблюдениям, для них важно, что они могут легко подключиться через личный кабинет и сразу протестировать все возможности, не тратя бюджет вслепую.
Не обходится и без работы с различными устройствами умного дома. Это могут быть лампочки, кондиционеры, пылесосы, кухонные устройства, телевизоры, стиральные машины, холодильники, духовки и даже авто. Google Ассистент больше подходит американскому рынку — там с его помощью можно заказывать еду на дом, покупать билеты или бронировать столик. К сожалению, его примитивность кроется в мелочах, порой может даже сложиться ощущение, помощник от Google «совсем как не живой». Разумеется, Google стремится к «человечности», чтобы, когда ассистент в телефонном разговоре записывал человека на стрижку, администратор даже не понимал, что общается с роботом. В любом случае, со своей главной обязанностью — помогать — Google Ассистент справляется на ура.
Это неплохой вариант для Android-пользователей, но в России можно найти и более продвинутого помощника. Siri от Apple — придётся переходить на «яблочную» сторону Преимущества: приятный дизайн, интеграция с сервисом Shazam, работа с картами, запоминание места парковки, можно звонить людям, читать и отправлять сообщения, планирование дня по советам Недостатки: доступность только для техники компании Apple Сегодня Siri живёт во всех операционных системах Apple. Многие забывают, что изначально это была разработка Siri Inc. Правда, 28 апреля 2010 года после покупки Siri купертиновцами планы отменились. Siri являлась проектом Международного центра искусственного интеллекта SRI.
Музыкальные способности Siri лучшие на рынке.
Для ассистента можно назначить предпочтительный стриминг: Apple Music, Spotify, Deezer HiFi или что-то более экзотичное. Для максимального качества я рекомендую Deezer: колонки HomePod могут транслировать с него треки в повышенном FLAC-качестве с минимальными потерями. Правда, официально этот сервис в России не представлен, оплачивать его придется окольными путями. Чтобы установить нужный сервис как основной на смартфоне и колонках HomePod, придется повозиться в настройках , но результат того стоит. Впрочем, российские стриминги вроде «Яндекс-музыки» привязать к HomePod не получится. Также на HomePod можно транслировать любую музыку с Айфона: можно отправить трек через AirPlay или просто поднести телефон к колонке, и она автоматически перехватит воспроизведение.
За первую половину 2021 года роботы-операторы клиентов АБК совершили порядка 360 млн звонков. В первом полугодии 2019 года этот объем равнялся 42 млн, в 2020 — 144 млн. Такой рост в АБК связывают с совпадением нескольких факторов: лояльность аудитории Доступность голосовых ассистентов в потребительском сегменте и роботов-операторов в бизнесе формируют у аудитории привычку общаться с цифровым голосом. Это связано с ростом эффективности технологии: робот лучше понимает собеседника и быстрее оказывает ему необходимую услугу. В то же время происходит закономерное увеличение пользовательской базы , обрабатываемой роботами-операторами: в первом полугодии 2021 года роботы АБК обзвонили в 800 раз больше клиентов, чем в аналогичный период 2019; в среднем звонок от робота получают более 1 млн человек в день. Для нас это идеальный пример доверия между человеком и роботом в телефонной трубке: вы звоните ему с конкретным запросом и получаете четкий ответ.
Яндекс Образование
голосовой ассистент может давать быстро ответы на все интересующие вопросы. Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. Голосовой помощник — искусственный интеллект с развитыми навыками распознавания речи, который обрабатывает огромные объемы информации, благодаря чему постоянно учится. В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Этот ассистент набрал 419,3 тыс. упоминаний за указанный период, став самым обсуждаемым голосовым помощником в российском сегменте интернета. Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному.
«Помощников много не бывает»: лучшие голосовые ассистенты для русскоязычных пользователей
Например, ассистент может помочь узнать актуальный баланс, количество мегабайт, минут и SMS на вашем номере, получить выписку по расходам, узнать о подключенных услугах, отключить ненужные, подобрать новый тариф, а также оплатить счета. Ежедневно «Елена» обрабатывает около 75 тысяч обращений клиентов, приблизительно 45 тысяч из которых обслуживает самостоятельно, не обращаясь к помощи операторов контактного центра. Также похожим функционалом обладает недавно запущенный голосовой помощник «Олег» от «Тинькофф», который может переводить деньги на счета, бронировать столик в ресторане, записывать в салоны красоты, покупать билеты в кино, менять данные пользователя в экосистеме банка, заказывать и отправлять на почту электронные документы, а также общаться на свободные темы, консультировать по банковским продуктам и давать советы, опираясь на информацию из «Тинькофф-журнала». Несмотря на существование барьеров использования голосовых помощников, в ближайшей перспективе видится возможность появления отдельного сегмента цифровой торговли - V-commerce или Voice Commerce. Мы прогнозируем, что люди будут все больше пользоваться голосовыми ассистентами для транзакционных действий: заказа еды и продуктов, оплаты билетов, покупки определенных категорий товаров. В середине июня Mail. Пока что она выполняет стандартные запросы, помогая искать нужную информацию в интернете, включать музыку, уточнять прогноз погоды, стоимость авиа и железнодорожных билетов, а также, например, какие фильмы идут в кино. Разработчики рассчитывают, что в будущем помощник будет интегрирован в другие продукты Mail. В скором времени голосовой ассистент появится и в государственном секторе - планируется запуск голосового помощника для портала «Госуслуги Бизнес» , который сможет отслеживать статусы поданных заявок, а также осуществлять онлайн-общение с представителями государственных органов.
Как работает домашний голосовой помощник — команда и распознавание голоса Каждый голосовой помощник имеет как минимум микрофон и громкоговоритель: первый нужен, чтобы слышать ваши команды, второй — чтобы отвечать вам. В зависимости от модели могут отличаться число микрофонов, их направленность как правило, это 360 градусов , чувствительность и другие параметры. Но на принципе работы это никак не сказывается. Голосовой помощник подключается к интернету, он не умеет работать без постоянного доступа к сети. Вы настраиваете свой голосовой помощник на фразу, которая его «будит», это команда, заставляющая его «слушать» все, что вы скажете. Например, сказав Alexa, вы пробудите помощник от Amazon, и он начнет слушать все, что вы говорите. Команды выключения как таковой нет, устройство просто засыпает, когда понимает, что диалог завершился. Пробудить его можно повторной командой Alexa. Много шуток в США было на тему того, что не повезло женщинам, которых зовут так же, как устройство от Amazon, у них оно будет работать постоянно. На самом деле в Alexa, также как и в других голосовых помощниках, вы можете сменить слово-команду на любое другое. Совет от разработчиков прост: чтобы это слово не было коротким и его можно было хорошо распознать даже в шумных условиях. Устройство в локальной памяти хранит все настройки, там же располагаются буфер и система распознавания голоса. Домашний голосовой помощник можно воспринимать как упрощенный вариант смартфона, в котором может быть дисплей, либо его может и не быть. Важно, что система распознавания голоса в большинстве случаев локальная, именно устройство обрабатывает звук и распознает его. В ряде случаев, когда устройство не может самостоятельно распознать и расшифровать голос, оно отправляет запись в облако, где происходит распознавание, так как серверы имеют большую производительность и большие базы данных для проверки и подбора слов. Как правило, большинство производителей используют комбинированные системы, распознавание голоса происходит локально, на сервер, который должен его обработать, он отправляется в виде условного текста или уже команды. Для ряда запросов, предполагающих местное действие, оно тут же осуществляется. Например, когда пользователь говорит «установить будильник на 8 часов утра», система локально выполняет команду, не обращаясь в облако. То же самое касается и настройки других устройств умного дома, например, изменения температуры в термостате. Многие ошибочно считают, что если голосовой помощник распознает локально команды и голос, то эти данные навсегда остаются в нем, это не так. Все зависит от производителя, марки устройства, но всегда все данные, записанные после слова-команды, передаются на серверы производителя, где они и хранятся. Эти данные могут быть использованы для более точной настройки системы распознавания и в других целях, например, их может запросить полиция в рамках расследования уголовного дела, и компания-производитель их предоставит. Следующий важный момент — это языки, на которых умеют говорить голосовые помощники. Например, для Amazon это английский и немецкий. В случае Amazon сервис Alexa — это удобный способ что-то купить на сайте Amazon, поэтому ареал распространения ограничен теми странами, где сервис имеет наибольшую аудиторию. Для того же Google Home в планах, напротив, быть везде где только возможно. Мы увидим экспансию Google Home на всех мировых рынках, он начнет появляться на всех языках. Хотя пока он представлен ровно в том же количестве стран, что его прямой конкурент. Здесь Google выступает в роли догоняющего и поэтому не спешит быть везде, так как другие конкуренты маловероятны, ниже мы обсудим, почему это так. Итак, вы сказали слово-команду, и ваше устройство «проснулось», записывает ваш голос, чтобы его распознать. Первый и самый важный элемент — это распознавание голоса и его преобразование в текст. Как правило, текущие голосовые помощники настраиваются на один основной язык. Например, если устройство поддерживает как английский, так и русский, одновременно разговаривать с ним на двух языках не выйдет, оно будет путаться и просить повторить фразы. В будущих устройствах этот момент будет с легкостью разрешен, так как голосовые помощники научатся сами определять язык, на котором вы говорите. Но пока они могут только анализировать контекст, в котором вы произносите фразу все это происходит в облаке , чтобы заменить некоторые слова на английские. Например, раньше, когда вы произносили фразу «в каком году вышел альбом обратная сторона луны у пинк флойд», она распознавалась именно так, как я написал. Причина заключается в том, что Google задействует нейронные сети для анализа не только самой фразы, но и сказанного контекста. То есть, система пытается предугадать, что именно вы хотите, какой смысл у вашего вопроса. Если вы по какой-то причине пропустили революцию в системах распознавания и расшифровки голоса, никогда не пользовались голосовой диктовкой на Android-смартфонах, то просто попробуйте это сделать в браузере по этой ссылке. В Google уже поддерживается более 80 языков, для каждого возможно преобразование голоса в текст и обратно. Конкуренты пока от Google отстают, но со временем ситуация на этом рынке выровняется, так как с течением времени, обрабатывая семплы речи, каждая компания добьется очень высокой точности распознавания голоса. Также добавим сюда алгоритмы анализа контекста в облаке. Понятно, что в Google будут первыми в этом забеге, так как уже делают это для других сервисов, в том числе и смартфонов, но преимущество не будет длиться вечность, в конечном итоге на рынке появится массовая и дешевая технология, она повторяема любой компанией.
В составе команд разработчиков голосовых ассистентов может быть психолог, а то и несколько: они анализируют ответ помощника, насколько он безопасен и этичен для пользователя. Кроме того, перед выдачей ответов пользователю важно делать дополнительный фактчекинг данных от помощника. Да, ошибки в ответах пока могут быть, особенно в каких-то сложных навыках, например отгадывании загадок. При работе сразу с несколькими помощниками можно обратить внимание, что у каждого из них есть свои оригинальные черты: чувство юмора, тембр голоса, манера общения и даже пол. Зачем это нужно? Одно из объяснений — человек охотнее взаимодействует с устройством или технологией, у которой есть признаки эмпатии. Например, оно может «подыграть» пользователю: продолжить шутку, обозначить свои границы, дать ненавязчивый «человечный» совет. При этом разработчики голосового ассистента должны учитывать, что аудитория у продукта многомиллионная: пользоваться устройством могут взрослые, дети. Поэтому важно выдержать баланс, чтобы голосовой ассистент никого не обидел, не расстроил и тем более не причинил вред. Бывает, что разработчики стараются придавать своим продуктам некоторые индивидуальные черты. В то же время важно помнить про эффект зловещей долины , и производители это учитывают — большинство ассистентов не пытаются притворяться человеком и обычно стремятся к тому, чтобы не реагировать излишне человечно на определенные вопросы. Леонид Саночкин, технический лидер в МТС AI Сколько стоит создание ассистента и что для этого нужно уметь Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Например, разработка Олега обошлась «Тинькофф» примерно в 50 миллионов рублей и оправдала себя уже в первый месяц, когда позволила сэкономить столько же. Чтобы разработать своего помощника, стоит определиться с тем, какие проблемы будет решать ИИ и какой результат получат пользователи. Сейчас технологии позволяют разработать как голосового помощника, так и чат-бота. Они оба распознают человеческую речь, но первый может сам выстроить логическую цепочку, а второй отправит автоматизированный ответ. Если бюджет не позволяет разработать личного Олега, то лучше будет обратиться к экосистеме Сбера или Алисы, которые помогут разработать свой навык на их платформе. Навыки для Алисы можно создать с помощью платформы Яндекс. Диалоги , а Сбер работает в SmartApp Studio. Тех, кто не умеет программировать, выручит визуальный конструктор от Яндекса или сторонний Dialogflower. На базе Aimylogic можно создать навыки почти для всех известных ассистентов. По данным Just Al, создание чат-бота займет от недели до 3,5 месяцев и в среднем будет стоить от 250 до 300 тысяч рублей. При том можно заняться разработкой самостоятельно, и тогда придется оплатить лишь лицензию за использование конструктора , которая стоит от 5900 до 59 000 рублей в зависимости от количества пользователей. Работа строится по следующей схеме. Первым этапом определяются требования и создается ТЗ. На проектировании проводятся анализ и разметка пользовательских данных и создание макетов интерфейса. При разработке нужно будет реализовать бизнес-логику и интеграции. А после этого протестировать навык и запустить его. Какой голосовой ассистент лучше Алиса от Яндекса Интерфейс Алисы на смартфоне. Помощник помогает пользователю в решении разных задач: Ищет информацию. Алиса может найти информацию по различным темам: погода, новости, курсы валют. Отвечает на вопросы. Развлекает пользователя.
Число используемых цифровых голосовых помощников к 2023 году утроится и составит 8 млрд по всему миру, говорится в исследовании Juniper Research. Способствовать этому будет развитие рынка умных домашних устройств. В тексте и голосе уже очевидно повсеместное распространение ботов, а вот видео, личное общение и остальные более сложные коммуникации только начинают внедряться", - отмечает начальник управления "Мессенджеры и чат-боты" департамента цифрового бизнеса ВТБ Александр Раихин. Самыми популярными и известными чат-ботами являются виртуальные ассистенты, которые разрабатывают крупнейшие корпорации.
В Петербурге назвали самых популярных голосовых помощников
Всего голосовой помощник обработал уже свыше 31,3 миллиона обращений — почти половину от общего числа звонков в единую справочную службу. Голосовые помощники появились уже несколько лет назад, но я, как и большинство людей, до сих пор не научилась их применять для упрощения своих жизненных задач. Наш список голосовых ассистентов поможет вам выбрать наиболее подходящего, чтобы он стал вашим надежным помощником в повседневных задачах. Согласно данным ВЦИОМ, голосовыми сообщениями пользуются 64% россиян.
Голосовых помощников станет больше, чем людей
Голосовые помощники составят расписание, переведут деньги, закажут еду, возьмут на себя управление умным домом — в общем, они умеют все, что положено уметь хорошему помощнику. В 2020 году в устройствах по всему миру будет использоваться 4,2 миллиарда цифровых голосовых помощников. Голосовые помощники становятся все привычнее для россиян. По данным разработчика голосовых сервисов Just AI, в 2020 году аудитория голосовых ассистентов в России составила 52 млн пользователей.