Сколько стоит создание ассистента и что для этого нужно уметь. Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Команда российского оператора Tele2 сообщила о запуске новой услуги для своих абонентов — голосового помощника по имени «Астра». Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов.
Голосовых помощников станет больше, чем людей
Рассказываем, как выбрать лучшего голосового помощника | В 2020 году в устройствах по всему миру будет использоваться 4,2 миллиарда цифровых голосовых помощников. |
Что умеет голосовой помощник Алиса | Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. |
Голосовыми помощниками пользуются более половины россиян | - инновации и инвестиции | Если мысль о том, что голосовые помощники захватывают мир, пугает вас, сейчас самое время отвести взгляд от экрана. |
10 главных умных помощников в 2022 году | Эксперт рассказал Hi-Tech , как в России появляются голосовые ассистенты и сколько денег уходит на их разработку. |
Как настроить Марусю на телефоне. Здесь всё, что нужно знать
Визитная карточка Яндекса отлично говорит на русском языке и поддерживает практически все русскоязычные сервисы, работает на Android и iOS и может управлять Smart-системами умного дома от разных производителей. Алису встраивают по умолчанию в умную бытовую технику ведущие мировые производители: Samsung, LG, Xiaomi, Polaris, Redmond, Philips и не только. Статья по теме: Автоматизация быта: что такое умный дом и как его организовать Но лучше всего Алиса взаимодействует с сервисами Яндекса. Еда, такси, музыка и прочее с этим голосовым помощником работает в идеальной паре. Кроме того, стоит отметить обучаемость Алисы: она по умолчанию вежлива, но подстраивается под тон собеседника — может даже нагрубить в ответ, но всегда сумеет выйти из конфликтной ситуации. В детском режиме эта опция отключена, и помощник сразу аккуратно игнорирует грубости и оскорбления.
Кстати, о взаимодействии с детьми: Алиса умеет общаться с малышами, рассказывать им сказки и даже придумывать новые на пару с маленькими собеседниками. Загадки, анекдоты, тосты и, самое главное — поддержание разговора: помощник от Яндекса умеет сохранять контекст, запоминая предыдущие вопросы и реплики. Одно из последних обновлений Алисы — распознавание голосов разных членов семьи. То есть, например, в зависимости от того, кто именно оставляет голосовой запрос, Алиса включает конкретную музыкальную подборку. В числе недостатков — необходимость отдельно скачивать приложение, а также несовместимость с сервисами Google и Apple.
Это неудивительно, ведь в каждом смартфоне на операционной системе Android или iOS предустановлены голосовые помощники Assistant и Siri. При этом другие устройства с голосовыми помощниками не очень-то востребованы. Аналитики приводят следующую аналогию: население Европы в два раза превосходит население Северной Америки, а по количеству устройств с голосовыми помощниками догонит ее минимум в 2022 году. Еще одной тенденцией, подмеченной Juniper Research, стало снижения интереса разработчиков голосовых помощников к персональным компьютерам.
В пример приводится Microsoft, пересмотревший стратегию развития своей разработки Cortana.
Без этой функции быстрый запуск не сработает Сколько бы разрешений Марусе я ни выдал, она никак не хочет запускаться голосом. Таковы ограничения Google, которые тот же Яндекс обходит при помощи собственного лончера. Сделает ли что-то подобное VK Group — неизвестно. Но хотелось бы.
Ну а я лишь скажу несколько слов о том, как подключить Марусю к телефону: Подключите колонку к источнику питания. Запустите приложение Маруся на своем смартфоне. Откройте настройки и перейдите в раздел «Подключить колонку». Авторизуйтесь в своей учетной записи VK ID регистрируется одним кликом. Активируйте геолокацию и Bluetooth на телефоне.
Дождитесь окончания поиска колонки и подключитесь к найденному устройству.
Успех голосовых помощников — в их гибкости. Они дают бизнесу возможность решать широкий спектр бизнес-задач: от автоматизации рутинных повторяющихся процессов до создания уникального голоса бренда для персонализированного общения с аудиторией. На сегодняшний день МТТ входит в цифровую экосистему МТС успешно запустил сотни голосовых ассистентов в различных отраслях, высокий интерес мы видим у игроков в самых разных сферах — от онлайн-торговли и доставки до газовой промышленности. Один из множества нетривиальных кейсов — компания «Лэнд-Сервис», которая обслуживает дорогостоящее холодильное оборудование. Мы сделали для них кастомизированное комплексное решение, которое самостоятельно распознает и присваивает степень критичности аварийных заявок, а дальше обзванивает всех ответственных лиц, от инженера до генерального директора, если ситуация действительно критична. Мы тоже не стоим на месте, постоянно ищем новые рынки, а наши ассистенты тем временем стремительно умнеют. Продвинутая версия VoiceBox мгновенно анализирует ответы, не делает пауз в диалоге с абонентами, обращается к клиенту по имени, уточняет адрес, состав заказа и другие переменные данные.
К тому же совершенствовались и упростились сценарии их использования, поэтому сейчас мы все чаще видим среди клиентов представителей малого и среднего бизнеса. Согласно глобальному исследованию , в 2021 году был зафиксирован значительный рост интереса к голосовым технологиями со стороны малого и среднего бизнеса, который превзошел среднегодовой прогноз рынка.
10 главных умных помощников в 2022 году
Это один из первых российских голосовых помощников — его запустили в 2018 году. Если мысль о том, что голосовые помощники захватывают мир, пугает вас, сейчас самое время отвести взгляд от экрана. Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников. Темпы роста рынка голосовых помощников, по оценке Group, превышают темпы роста IT-рынка в целом: голосовые ассистенты стали неоспоримым трендом, который продолжает набирать обороты. Выбираем самого умного голосового помощника в 2023 году.
Маруся голосовой помощник команды для умных колонок VK Капсула
Банки визуализируют голосовых помощников | АиФ Новосибирск | Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий. |
К 2023 году число голосовых помощников в мире достигнет восемь млрд | К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома. |
Голосовой помощник
В постоянно меняющемся мире технологий неизменно лишь одно: желание технокомпаний запустить свой голосовой помощник. В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. В 2017 году появился голосовой помощник AliGenie от Alibaba, «живущий» в смарт-колонке Tmall Genie.
Приятно познакомиться, Ева, Олег, Маша, Салют, Алиса! Протестировали голосовых помощников
Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов. Перспективы монетизации голосовых помощников Согласно прогнозам Juniper Research, к 2023 году в мире будут использовать 8 миллиардов голосовых помощников — на одного человека будет приходиться дватри ассистента. Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников. Кроме того, внедрены персональные медицинские помощники — устройства для непрерывного контроля состояния пациентов. Статья Голосовые ассистенты (Роботы-операторы), 80% опрошенных россиян постоянно общаются с голосовыми помощниками, В первом полугодии количество звонков с помощью голосового робота составило 360 млн, Смотрите также Голосовые помощники. В 2019 году IQ Loup Ventures протестировали голосовых помощников и выяснили – Google Assistant понимает больше вопросов, чем конкуренты и дает наиболее развернутые и понятные ответы.
Call-центры вымрут как динозавры: что ждет рынок голосовых помощников
Намного полезнее будет узнать, как сделать Марусю в фоновом режиме. Маруся в фоновом режиме на телефоне Мне, как и любому другому владельцу смартфона, важна не столько функциональность голосового помощника, сколько удобство его использования. Запускать каждый раз приложение, чтобы Маруся зачитала новости или позвонила кому-то из телефонной книги — та еще затея с учетом того, что Google Assistant позволяет делать все это без запуска программы через фразу «OK, Google». Частично обойти ограничения можно, если сделать ассистента от VK Group основным: Откройте настройки телефона. Перейдите в раздел «Приложения», а затем — «Все приложения». Нажмите на «три точки». Откройте вкладку «Приложения по умолчанию». Выберите Марусю в пунктах «Голосовой помощник», а также «Помощник и голосовой ввод». Голосовым помощником по умолчанию является Google Assistant, и это нужно исправить Эти настройки помогут вам запустить Марусю через любой приложение, воспользовавшись комбинацией кнопок или кратковременным нажатием на кнопку питания.
Предварительно на вашем смартфоне должна быть включена соответствующая опция в разделе «Функции кнопок».
Микрофон устройства фиксирует звуковые волны, очищает их от шумов, оцифровывает и разбивает их на фрагменты, которые пропускаются через обширную базу и распознаются в запрос. А современные технологии даже позволяют восстанавливать по смыслу плохо распознаваемые слова. Голосовые ассистенты постоянно обучаются с помощью обновлений от разработчиков и нейросетей. А теперь конкретнее по каждому из существующих российских голосовых помощников. Алиса Самый функциональный и совершенный голосовой помощник российского производства. Визитная карточка Яндекса отлично говорит на русском языке и поддерживает практически все русскоязычные сервисы, работает на Android и iOS и может управлять Smart-системами умного дома от разных производителей.
Алису встраивают по умолчанию в умную бытовую технику ведущие мировые производители: Samsung, LG, Xiaomi, Polaris, Redmond, Philips и не только. Статья по теме: Автоматизация быта: что такое умный дом и как его организовать Но лучше всего Алиса взаимодействует с сервисами Яндекса. Еда, такси, музыка и прочее с этим голосовым помощником работает в идеальной паре. Кроме того, стоит отметить обучаемость Алисы: она по умолчанию вежлива, но подстраивается под тон собеседника — может даже нагрубить в ответ, но всегда сумеет выйти из конфликтной ситуации. В детском режиме эта опция отключена, и помощник сразу аккуратно игнорирует грубости и оскорбления.
Впрочем, можно переформулировать... По голосовой команде — она способна настраивать ОС, запускать различные приложения и задачи, делать пометки в календаре и т. Пока же вместо нее на компьютере можно использовать Алису , Марусю , ассистента Google , или Горыныча...
Для примера рассмотрим такую модель графа с возможными физическими состояния человека: По картинке мы можем определить, что человек может находиться в четырех состояниях, причем не в каждое может перейти сразу. Например, если человек лежит, то он не может просто взять и пойти, для этого ему нужно пройти цепочку последовательности — сесть, встать и только потом уже пойти. Алгоритмы марковской модели в распознавании речи работают примерно по тому же принципу матричного графа. А благодаря наличию нейросетей, любой желающий при должных знаниях может «научить» свой сервис обучаться, то есть чем больше люди будут пользоваться теми или иными функциями, тем лучше будут оптимизированы алгоритмы работы распознавания речи, благодаря улучшению генерирующей работы Марковской модели, расширением словарного запаса и пополнением библиотеки голосовых паттернов. Так, например, в 1990 году увидела свет одна из первых коммерческих программ по распознаванию речи — Dragon Dictate, ориентированная на массовый рынок потребителей. За эту космическую сумму денег пользователь получал возможность писать текст, просто проговаривая его в микрофон. К сожалению, программа не всегда работала корректно, и допускала даже по тем меркам достаточно серьезные ошибки. Представляла она из себя портал VAL, призванный помочь покупателям в поиске нужной информации о интересующих товарах. Сферой использования этой системы были торговые центры, информационные стенды и прочие коммерчески ориентированные области деятельности. В 1997 году, вышла обновленная версия вышеупомянутой Dragon Dictate, в ней разработчики потрудились над скоростью и качеством распознавания речи. Google уже в 2002 году предприняла решение по развитию голосового поиска и интеграцией его в свою экосистему. Voice Search не имел особого успеха, но послужил отправной точкой для будущего приложения Voice Search для iPhone и Android, ставшим впоследствии интерактивным помощником Google Now, а с недавних пор Google Assistant. Система распознавания речи 2002 года от Google как и аналоги конкурентов работала при помощи телефонного звонка на специальный номер, пользователи не оценили такой способ поиска, так как он оказался попросту неудобен. Но разработчики компании засучив рукава продолжили движение в этой сфере, и судя по нынешним продуктам, время в стенах офиса на Mountain View было потрачено не зря. В систему была введена фирменная система распознавания и синтезирования речи VoiceOver. Её главным отличием была независимость от «спикера», то есть пользоваться ей мог кто угодно — систему не нужно было обучать к определенному голосу. Возможность синтеза речи нашла применение для людей с плохим зрением, система могла читать любой текст на экране, от статей в интернете, электронных писем до элементов системы, например пунктов в меню настроек и названия файлов на рабочем столе. Позже Microsoft решили не отставать от Apple и интегрировали голосовое управление в свою новую Windows Vista. Google Voice Search Наконец, мы переходим к становлению нынешних голосовых помощников. Как я говорил, Google уже в 2002 году попробовали себя в создании поиска по телефону. Спустя 7 лет компания представила приложение голосового поиска на смартфонах iPhone. Приложение функционировало с помощью облачных вычислений на серверах Google. Благодаря огромному числу голосовых запросов пользователей, словесная и фонетическая база данных на серверах к 2011 году насчитывала уже около 230 миллиардов слов на разных языках мира. Благодаря колоссальному успеху, приложение Voice Search по сей день закрепляет за собой славу самого популярного сервиса Google. Позже появилась версия и под собственную операционную систему Android. В связи с этим корпорацией была развернута масштабная рекламная кампания смартфонов на фирменной платформе, акцентируя внимание клиентов на уникальной для того времени фишке — голосовом поиске. В 2011 году функцию голосового поиска получил и фирменный браузер Google Chrome. В 2012 году вместе с презентацией Android 4. Функционал работы сервиса строился на подборе актуальной информации для пользователя с учетом его местоположения, личной информации календаря, поисковых запросов, истории браузера и маршрутам перемещения.
Самые умные голосовые помощники на сегодняшний день
✓ ТОП-9 самых популярных голосовых помощников 2022 рейтинг Медиалогии | С голосовым ассистентом можно поболтать, о чём хотите — о погоде, кино или текущих делах. |
Голосовые помощники | Сегодня мы делаем первые шаги к тому, чтобы у голосового помощника появился визуальный образ. |
Forbes Экспертиза | Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году. |
Выбираем лучший голосовой ассистент: Siri vs Google Ассистент vs Алиса
Если раньше голосовой помощник мог распознавать только отдельные слова, то сейчас не только распознает фразы целиком, но и понимает их смысл. Уровень восприятия человеческой речи роботом вырос с 92 до 96 процентов — это значит, что он с большой вероятностью правильно поймет сказанные слова, даже если человек находится в шумном месте. Также в прошлом году у виртуального ассистента появился новый навык — создание заявки на поиск документа в центре госуслуг. Если он не был готов, пользователь может подать повторный запрос, а также попросить робота перезвонить и сообщить его статус. С момента введения нового навыка жители столицы создали более 50 тысяч таких заявок. Всего голосовой помощник обработал уже свыше 31,3 миллиона обращений — почти половину от общего числа звонков в единую справочную службу. Среднее время обслуживания жителей роботом составляет две минуты. Робот в едином диспетчерском центре Одним из лидеров по объему входящего трафика также является единый диспетчерский центр, который был создан более пяти лет назад. За это время он принял свыше 36 миллионов звонков. Чаще всего туда обращаются по вопросам водоснабжения, неисправности лифтов, освещения в подъезде. Обрабатывать заявки москвичей на линии с 2020 года помогает голосовой помощник.
Его база знаний содержит более 80 тематик, в 2021 году их было 67. Например, ему можно сообщить о бесхозных вещах, мусоре в подъезде, на крыльце, на крыше дома, несанкционированных объявлениях и надписях в лифте, засоре мусоропровода, неисправности доводчика входной двери, некачественно проведенном косметическом ремонте в подъезде, повреждениях ступеней, а также оставить заявку на уборку снега и наледи на придомовой территории, ремонт и замену кода домофона, установку осветительных приборов во дворе. После регистрации обращения виртуальный помощник получает из системы информацию о плановых сроках выполнения работ и сообщает ее заявителю, такая опция появилась у него в прошлом году.
На основе этих данных голосовой помощник определяет голосовой запрос. Иногда у голосового помощника не получается понять фразу, тогда он достраивает слово из контекста всего предложения. Для этого у ассистентов есть таблица вероятностей переходов, в которой описаны возможные последовательности букв в словах.
Кстати, такие таблички помогают распознавать запросы пользователей в зависимости от их акцента, поэтому, например, в Siri можно выбрать британский или американский английский язык. Если спросить у голосового помощника «Как дела? Да и форма голосовых помощников все чаще обретает человеческие черты: имя, пол, голос, может быть даже чувство юмора. Так как голосовых помощников учат быть человечными? Если для распознавания голоса виртуальными ассистентами используются сложные вычисления, то решать вопрос человечности позволяет большой список ответов, сочиненных редакторами и психологами. Это заготовленные специалистами голосовые сообщения с продуманными сценариями, где составлены ответы на самые популярные вопросы и запросы людей.
Редакторы сознательно составляют пул ответов в стиле, который будет гармонировать с образом голосового помощника, чтобы образ был человечнее. Для ответов на вопросы, которые невозможно предугадать, голосовые помощники используют нейросети, обученные материалами из медиа, литературы, кино. Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги. Безопасность и конфиденциальность данных при использовании голосовых помощников Производители голосовых помощников уверяют, что данные пользователей конфиденциальны, а разговоры не прослушиваются, коммуникация с устройством безопасна. Но как тогда голосовой помощник будет обучаться? Несмотря на слова корпораций о безопасности, нужно обращать внимание, что в момент настройки голосового помощникам пользователь дает согласие на использование и обработку персональных данных.
Кроме того, без Data Science невозможна работа и развитие голосового помощника. Вопрос в том, как хранятся эти данные?
Кстати, несмотря на кучу преимуществ, у Siri есть и недостатки по крайней мере для русскоязычной аудитории : иногда она не понимает завуалированные вопросы и некоторые обороты речи... Впрочем, можно переформулировать... По голосовой команде — она способна настраивать ОС, запускать различные приложения и задачи, делать пометки в календаре и т.
По умолчанию Cortana предустановлена на компьютерах и мобильных устройствах с операционной системой Windows 10, а также на игровых консолях Xbox One. Также ассистент предугадывает нужды пользователя при условии, что вы разрешите сервису доступ к своим личным данным — электронной почте, календарю, местоположению и другим. Подобное уже было представлено Google в собственном помощнике Now в 2012 году, но, к сожалению, он не имел такой проработки в плане понимания контекста и уступал по количеству и качеству голосовых возможностей. Amazon Alexa Следующими на очереди идут Amazon. Компания решила влиться в набирающий обороты технологический тренд и опубликовала в 2014 году фирменный голосовой ассистент, разработка которого велась аж с 2010 года.
Изначально, как в случае с Siri, Alexa являлась отдельным приложением для смартфонов на iOS и Android. Понимая, что на одном приложении далеко не уедешь, компанией также было представлено отдельное устройство — первая в мире умная колонка с голосовым ассистентом Amazon Echo. Её уникальность состояла в том, что кроме обычных пользовательских запросов, Amazon Echo могла послужить эдаким мозгом для всей техники умного дома. То есть по голосовому запросу владелец мог контролировать температуру на термостате, управлять освещением и делать прочие подобные вещи у себя дома. Позже конкурентами в лице Google и Apple были представлены свои умные колонки Google Home и HomePod с аналогичным функционалом. Говорить подробно о них я не вижу смысла, так как различия между ними заключаются лишь в более глубокой интеграции под каждую из собственных экосистем. Общей проблемой этой троицы для пользователей, родившихся и проживающих в СНГ, является отсутствие поддержки русского языка и несовместимость с местными сервисами навигации, вызова такси, заказа еды. Станция Но совсем недавно, 29 мая, наша отечественная компания Яндекс, провела конференцию Yet another Conference 2018, на которой представила свою первую железку — умную колонку Яндекс. Станция с интегрированным в неё голосовым помощником Алиса. Станция от Яндекса была полностью спроектирована в стенах Московского офиса компании.
Кроме возможности работы в качество умного помощника, колонка имеет видеовыход HDMI и может работать с внешними проекторами, мониторами и само собой с телевизорами. Поиск фильмов осуществляется при помощи интеграции библиотеки онлайн сервисов: ivi, Кинопоиск, Амедиатека и Яндекс. Видео Музыкальные возможности колонки явно не хуже конкурентов, максимальная мощность звука составляет целых 50 Вт. В довесок имеется возможность звучания в стереорежиме. Внутреннее убранство гаджета можно увидеть на официальной схеме: В качестве основного источника аудио-контента выступает фирменный сервис Яндекс. Музыка, насчитывающий в себе коллекцию из 35 млн композиций. Также приятным бонусом является наличие открытого протокола Bluetooth, позволяющего выводить на колонку звук с любого вашего устройства при отсутствии возможности подключения колонки к сети интернет. Работает она только через Wi-Fi. К функционалу Алисы добавили раздел Диалоги. Что это такое?
Это отдельная платформа для голосовых чат-ботов, пополнить которую может любой желающий при условии прохождения модерации своего проекта командой Яндекс. Уже сейчас в библиотеке есть несколько забавных Диалогов, которые помогут вам приятно провести время. Из таких я выделил: «Игра Математика» — замечательнейшая возможность занять ребенка на некоторое время, в течение которого он будет обучаться простой арифметике в игровой форме; «Верю — не верю» — проверка на то, отличите ли вы реальный факт от выдумки, лично я давеча пока тестировал этот навык, узнал много интересных вещей, незнакомых мне ранее. И интерактивную игру «Фантастический квест», в которой с помощью своих решений вы можете решить судьбу космического путешественника — тем, кто когда-то играл в Lifeline, наверняка должно понравится.
Голосовых помощников станет больше, чем людей
Такие цены приводятся для любого приложения на смартфоне и имеют ограничение до одного миллиона минут. Для голосовых помощников дома, машин, телевизоров и прочего вам нужно обратиться в Google, цены будут выставлены индивидуально. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. До этого момента я искренне полагал, что практически не пользуюсь этой системой, когда нахожусь в США, после своего эксперимента убедился, что это не так. В среднем в день у меня порядка 20 обращений к Google Home причем я делал это один, другие люди не работали с системой , запросы стандартные, как правило, это голосовой поиск чего-то в сети, когда лениво вставать с дивана, а смартфона или планшета под рукой нет. Все запросы вписываются в 30 секунд, то есть они стоят 0. В месяц таких запросов наберется 600, в год их уже будет 7200 штук, что составит 86. Учитывая, что средний жизненный срок домашнего голосового помощника уже превышает два года рынок появился два года назад, и посчитать реальный срок невозможно, но он будет 4-5 лет как минимум , получается, что любой производитель, не имеющий бесплатной системы преобразования голоса в текст, обречен на экономический крах. Однако не все так плохо, тот же Nuance предлагает модель лицензирования на определенное число устройств, с определенным средним числом обращений в течение года или разовым лицензионным платежом. Это более гибкая модель, которая позволяет сторонним компаниям строить свои голосовые помощники.
То же самое можно сказать про подход Amazon, когда возникла конкуренция со стороны Google, в компании начали бесплатно раздавать Alexa Voice Services AVS , причем в версии с распознаванием речи только в облаке ASR , а также добавили модуль распознавания естественного языка NLU. Такое решение в какой-то мере вынужденное, так как в Amazon хотят быстро улучшить качество распознавания речи, добавить новые языки, чтобы на равных конкурировать с Google. В январе 2017 года на CES в Лас-Вегасе было показано два десятка устройств, что используют голосовые возможности от Amazon, это беспроводные колонки, персональные помощники, термометры и многие иные предметы «умного» дома. Среди корпораций, имеющих возможность доминировать на рынке голосовых помощников и разрабатывать собственные системы, отметим такие компании, как Amazon, Apple, Google, Facebook, Microsoft, Samsung. Другие производители будут вторичны, так как не смогут создать собственные системы распознавания голоса и конвертации его в текст, они будут пользоваться теми решениями, что предоставят им перечисленные компании. Скорее всего, можно ожидать, что Google будет бесплатно раздавать такие решения для партнеров, создающих голосовые помощники, во всяком случае, первоначально подход будет такой. Это подход, который мы видим в Android, на первом этапе систему раздают бесплатно и всячески подсаживают на нее производителей, а затем постепенно начинают закручивать гайки, чтобы добиться дополнительных плюсов для себя. Обработка запроса, сценарии и их выполнение После того, как голосовой помощник распознал голос и превратил его в текст, он отдает его в облако либо выполняет простую локальную команду, как это было в примере с будильником. Достоинство голосового помощника напрямую вытекает из того числа операций команд , которые он способен распознать и правильно их обработать.
Именно сценарии использования становятся второй проблемой для широкого и быстрого распространения голосовых помощников по всему миру. В Amazon привлекли сторонних разработчиков, чтобы они создавали свои сценарии использования и команды, к концу февраля 2017 года таких команд стало 10. В Amazon их называют «умениями» skills. Простота создания новых умений подкупает разработчиков, равно как и то, что продукты от Amazon популярны в Америке, поэтому очень быстро голосовые помощники научились заказывать пиццу из любого магазинчика рядом, вызывать Uber и делать множество не таких тривиальных вещей. Чем больше людей пользуется голосовыми помощниками, тем большее число сценариев возникает, а система быстрее учится их правильно обрабатывать. Например, в самом начале пути Alexa почти не знала немецкие рок-группы, хотя сам язык поддерживался. Сегодня поиск по музыкальным группам Германии и жанрам музыки пусть и не идеален, но вполне сносен, вы можете получить необходимые сведения, запросив информацию. Система обучается, и прогресс налицо. Для сторонних разработчиков возникает вопрос, кто будет создавать и поддерживать такую систему.
Например, в Китае сейчас наблюдается бум стартапов, что инвестируют десятки миллионов долларов в это направление, они создают компании, которые пытаются в одном продукте предоставить как раз обработку сценариев и их автоматизацию. Это не только и не столько рынок голосовых помощников, для такой автоматизации найдется более широкое применение, например, это обработка заказов на сайтах, создание чат-ботов для поддержки клиентов любого бизнеса, в России вы уже сталкиваетесь с этим, обращаясь в службу поддержки Билайна, беседу с вами ведет программа. Бум развития сценариев, которые нужны потребителям, напрямую связан с помощниками, они выигрывают от того, что в алгоритмы загоняют стандартные действия. К сожалению, формализовать естественный язык не так-то просто, поэтому любые диалоги с голосовым помощником или программой в сети не являются очень глубокими. Так, любой разговор можно описать в парадигме вопрос-ответ, когда каждая пара образует один уровень, большинство программ обработки диалогов сегодня ведут более-менее осмысленный разговор для 2-3 уровней, затем они начинают пасовать, и тогда появляется продуманная программистами заглушка, например, у Siri это шутки, которые должны скрыть незнание программой того, как действовать дальше. Пользовательские сценарии условно можно разделить на простейшие, те, что не зависят от страны и языка, и сложные. То есть, это предопределенные действия, реализация которых в устройстве или программе не вызывает никаких затруднений. В простых сценариях важно, чтобы система распознавания речи правильно распознала контекст и то, является запрос утверждением или вопросом. Например, одна и та же фраза может восприниматься системой различно: «Будильник на 8 часов стоит или нет?
Многие системы первоначально просто ставили будильник на это время, не проверяя, есть он уже или нет. Теперь они «научились» проверять состояние будильника и правильно отвечать на этот вопрос. Сложные сценарии напрямую привязаны к контексту языка и страны. Например, спрашивая, что сегодня идет в кино, вы не ждете, что голосовой помощник зачитает вам список фильмов в Нью-Йорке, наверное, вы хотите услышать его для своего города и желательно для своего района или любимого кинотеатра. Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях.
В Tele2 рассказали: «Астру» программировали как остроумную и дерзкую помощницу, которая хорошо разбирается в новых трендах и технологиях. Она способна грамотно отвечать на звонки, всегда на стороне абонента, может легко поставить на место спамеров и мошенников.
Она ответит на входящие вызовы, если абонент находится вне зоны действия сети, не поднимает трубку или сбрасывает звонок. Ассистент поможет узнать контакты курьера или детали записи в салон красоты.
Согласно глобальному исследованию , в 2021 году был зафиксирован значительный рост интереса к голосовым технологиями со стороны малого и среднего бизнеса, который превзошел среднегодовой прогноз рынка. В отчете утверждается, что бизнес увидел в голосовых технологиях большой потенциал для сокращения своих издержек, к тому же рынок голосовых приложений стал предлагать гибкое ценообразование, что значительно упростило интеграцию технологии в бизнес-процесс.
Поэтому компании из сферы услуг доставка, салоны красоты, кафе и рестораны, агентства недвижимости стали массово исследовать возможности продукта. Согласно нашим наблюдениям, для них важно, что они могут легко подключиться через личный кабинет и сразу протестировать все возможности, не тратя бюджет вслепую. При этом самые популярные сценарии для них — реактивация клиентской базы, автоматизация работы с брошенными корзинами, опросы качества и другие. Например, одному из агентств недвижимости на рынке Москвы цифровой сотрудник от МТТ помог сократить расходы на реактивацию клиентской базы более чем в 10 раз.
Есть множество других примеров. Недавно мы разработали ассистента, который принимает заявки радиослушателей для поздравлений в прямом эфире, используя голоса популярных радиоведущих и поднимая слушателям настроение. В свою очередь мировой опыт показывает, что наибольший профит от использования технологии получает рынок электронной коммерции, который первым в мире стал интегрировать ассистентов в свой бизнес.
А ещё можно планировать события, находить заведения и выстраивать до них маршрут.
Не обходится и без работы с различными устройствами умного дома. Это могут быть лампочки, кондиционеры, пылесосы, кухонные устройства, телевизоры, стиральные машины, холодильники, духовки и даже авто. Google Ассистент больше подходит американскому рынку — там с его помощью можно заказывать еду на дом, покупать билеты или бронировать столик. К сожалению, его примитивность кроется в мелочах, порой может даже сложиться ощущение, помощник от Google «совсем как не живой».
Разумеется, Google стремится к «человечности», чтобы, когда ассистент в телефонном разговоре записывал человека на стрижку, администратор даже не понимал, что общается с роботом. В любом случае, со своей главной обязанностью — помогать — Google Ассистент справляется на ура. Это неплохой вариант для Android-пользователей, но в России можно найти и более продвинутого помощника. Siri от Apple — придётся переходить на «яблочную» сторону Преимущества: приятный дизайн, интеграция с сервисом Shazam, работа с картами, запоминание места парковки, можно звонить людям, читать и отправлять сообщения, планирование дня по советам Недостатки: доступность только для техники компании Apple Сегодня Siri живёт во всех операционных системах Apple.
Многие забывают, что изначально это была разработка Siri Inc. Правда, 28 апреля 2010 года после покупки Siri купертиновцами планы отменились.
Как настроить Марусю на телефоне. Здесь всё, что нужно знать
голосовой ассистент может давать быстро ответы на все интересующие вопросы. Голосовые ассистенты незаметно входят в нашу обыденную жизнь, что подтверждает исследование Google: помощником пользуются более чем один раз в день 41% взрослых и 55% подростков. Эксперт рассказал Hi-Tech , как в России появляются голосовые ассистенты и сколько денег уходит на их разработку. Аналитики Juniper Research прогнозируют трехкратное увеличение использования цифровых голосовых помощников.