В этой заметке я привожу подборку лучших голосовых помощников для компьютера и телефона. Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. Число используемых цифровых голосовых помощников к 2023 году утроится и составит 8 млрд по всему миру, говорится в исследовании Juniper Research. на 121,3% в год. В постоянно меняющемся мире технологий неизменно лишь одно: желание технокомпаний запустить свой голосовой помощник.
Сегмент голосовых помощников к 2024 году вырастет на 769%
Голосовые помощники сегодня — Голосовой робот «Мегафона» поможет пассажирам NordStar не опоздать на рейс. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. Выбор имени голосового помощника проходил в несколько этапов.
Как настроить Марусю на телефоне. Здесь всё, что нужно знать
А банки вступят в конкуренцию, предлагая все более продвинутых цифровых помощников», — рассказал Вадим Кулик, заместитель президента — председателя правления банка ВТБ. Прототип будущего помощника был представлен на стенде форума. Когда пользователь обращается к умной колонке, чтобы запустить чат с банком, как это происходит в случае запуска голосового банковского помощника, на экране появляется визуальный образ. Общение происходит в режиме реального времени: Тамара реагирует на вопросы, а ее речь синхронизирована с изображением на экране — движением губ и мимикой. Визуальный образ Тамары был создан нейросетью, совместившей портреты 50 выдающихся женщин, которые в разное время внесли значимый вклад в развитие ИТ-сферы.
Хорошо обученные модели позволяют голосовому ассистенту поддерживать разговор с пользователем. Например, клиент спрашивает что-то, одна нейронная сеть переводит голос в текст, другая анализирует его и ищет ответ в базе знаний. Если ответа нет, то она просит уточнить запрос. При этом к 2025 г. Совокупный среднегодовой темп роста этого рынка в 2021—2025 гг. Экономная экономика Применение чат-ботов и их более продвинутых версий — голосовых помощников снижает нагрузку на контактные центры, увеличивает охват маркетинговых компаний, повышает удовлетворенность качеством сервиса. Для большой организации совокупный экономический эффект от применения ботов может составлять сотни миллионов рублей, для очень больших речь идет о миллиардах, считает руководитель управления развития диалоговых систем в Альфа-банке Станислав Милых. При этом боты позволяют сохранить тот же количественный состав персонала колл-центров при растущем количестве запросов.
Бизнес постоянно увеличивается в масштабе», — полагает он.
Число доступных в голосовом помощнике сервисов будет расширяться. Сейчас с помощью голосового помощника можно получить следующие виды услуг: выписку из материнского капитала; выписку о лицевом счете в СФР; выписку из трудовой книжки; Для того, чтобы получить услуги, пользователю необходимо: 1 Зайти в личный кабинет на Едином портале госуслуг или в мобильное приложение; 2 Написать в чат с Роботом Максом: "Алиса"; 3 Нажать кнопку "Связать аккаунты", в ответном сообщении придет код доступа; 4 Попросите Алису позвать Робота Макса или запустить Единый портал госуслуг ; 5 Произнесите код доступа из ответного сообщения п. На сайте Минцифры России отмечается, что связь аккаунтов происходит без передачи персональных данных.
Виртуальный ассистент не только консультирует жителей, но и помогает собирать отзывы о качестве оказанных услуг, оповещает о начале отопительного сезона и может перезвонить заявителю для уточнения информации по заявке. Его речь практически не отличить от человеческой, а точность распознавания слов составляет 96 процентов. Сегодня он обрабатывает более половины от общего числа звонков на городские горячие линии. При этом горожанам не приходится тратить время на ожидание ответа оператора. За годы существования голосовой помощник неоднократно дорабатывался, совершенствовались его навыки, а база знаний наполнялась новыми тематиками. Виртуальный ассистент консультирует горожан по наиболее распространенным вопросам в сфере госуслуг, ЖКХ, транспорта и другим темам. Это помогает решать повседневные задачи москвичей максимально быстро и удобно», — рассказал Андрей Савицкий, руководитель общегородского контакт-центра.
Первым проектом, в который внедрили голосового помощника, была передача показаний счетчиков. Это позволило ускорить обработку заявок жителей, а также грамотно распределить ресурсы операторов. Всего обработано около 4,2 миллиона звонков жителей. В среднем голосовой помощник принимает около 400 тысяч таких обращений в месяц. Он принимает показания водосчетчиков, напоминает о необходимости проведения поверки и подсказывает даты сезонного отключения воды. Горожанам достаточно произнести код плательщика, указанный в едином платежном документе, и показания счетчиков воды, после чего виртуальный ассистент сам передаст данные в расчетную систему центра госуслуг. Сегодня голосовой помощник задействован в работе 10 городских горячих линий.
Приятно познакомиться, Ева, Олег, Маша, Салют, Алиса! Протестировали голосовых помощников
Почему универсальных? Потому что пользы от них зримо больше. Они вполне успешно применяются в повседневной жизни. Даже поставить будильник или включить фоновую музыку — уже полезно. А просто походя получить полезную информацию из поисковой системы, заказать услугу или получить справку о трафике на дорогах иногда просто бесценно.
Мы сегодня расскажем о российских голосовых помощниках. Siri, Google Assistant, Alexa или Copilot бывшая Cortana останутся за рамками обзора по простой причине: они все имеют иностранное происхождение, лучше работают на английском, а их русский иногда весьма режет ухо в Microsoft своего голосового помощника вообще не обучили русскому языку, и теперь уже вряд ли станут это делать. В нынешней ситуации развивать навыки русской речи у своих продуктов Apple, Amazon и иже с ними не станут. Поэтому сегодня поговорим о пяти персонажах.
Алиса Алиса, первый российский голосовой помощник, предназначенный для массового использования, появилась в 2017 году. Голосом Алисы стала актриса театра и кино Татьяна Шитова. Девушка уже в возрасте, и жизненный опыт позволил ей научиться многому. Во-первых, она постоянно развивает языковые способности, отлично понимает русский язык не только в его варианте от Толстого и Чехова, но и в современном прочтении, с естественными для нашего времени жаргонизмами, заимствованиями и прочими разговорными фенечками.
При этом Алиса приобрела еще и способность обижаться, а также известное коварство — она предлагает поиграть с ней в «города» хотя, эта хитрость может помочь избежать желания поиграть с шулерами в реальной жизни. Во-вторых, Алиса живет практически повсюду: на десктопах, в смартфонах и планшетах, в умных телевизорах, в автомагнитолах с Яндекс. Авто и, наконец, в умных колонках Яндекс. Станция, для которых она стала основным элементом пользовательского взаимодействия.
Смотреть мультик «Тайна третьей планеты» на телевизоре, рядом с которым стоит Яндекс. Станция категорически не рекомендуется. Третье достоинство Алисы — ее отличное взаимодействие с многочисленными сервисами Яндекса заказ еды, такси и прочие полезности , а не только поиском. Станция позволяет даже управлять телевизором при помощи голоса, предлагая подписчикам Яндекс.
Плюс доступ к обширнейшей видеотеке если фильм Алиса в ней не находит, то выдает ссылки на YouTube и другие сервисы. Наконец, Алиса прекрасно интегрируется с многочисленными экосистемами умного дома, которые поддерживаются Яндексом список их велик и постоянно расширяется , настолько, что может управлять устройствами, которые расположены и в городской квартире, и на даче, за многие километры от города. При этом разработчики постоянно учат Алису новому. Сервис использует технологии SpeechKit для распознавания голоса и Turing, чтобы подобрать подходящий по смыслу ответ.
Алиса обучена поддерживать живой диалог с помощью суперкомпьютеров «Яндекса», современных технологий машинного обучения и систем искусственного интеллекта на базе нейронных сетей. Не так давно к ней прикрутили, к примеру, пока в режиме бета-тестирования, возможность доступа к собственной яндексовской нейросетке YaGPT. На фоне всех этих достижений, которые помноженные на широчайшую аудиторию самого Яндекса и агрессивный маркетинг, доминирование Алисы в России совсем не удивляет. А амбиции подталкивают «Яндекс» адаптировать Алису под работу в других странах.
Компания активно нанимает специалистов по обучению «Алисы» другим языкам помимо русского о чем писал Хабр в мае.
С годами устройства дорабатывались, а в 1962 году компания IBM представила миру технологию Shoebox. Эта система могла распознавать цифры от 0 до 9 и 16 слов. Сегодня такие достижения звучат наивно, но в прошлом веке появление технологии стало прорывом. Помимо универсальности, важна и корректная работа сервисов. Обеспечить ее помогают следующие технологии.
Автоматическое распознавание речи ASR. Процесс, позволяющий услышать и понять запрос пользователя. Для этого необходим микрофон и интернет-соединение, по которому аудиосигнал передается на серверы для последующего анализа и конвертации в текст. Понимание естественного языка NLU. Когда голос преобразован в текст, искусственному интеллекту необходимо понять его смысл и определить ключевые детали запроса. Выполнение задачи через интерфейсы программирования приложений API.
Сюда входит умение найти информацию в Сети, передать команду сопряженным устройствам экосистемы, набрать номер из списка контактов и другие действия. Взаимодействие с пользователем.
Голосовые виртуальные ассистенты на сегодняшний день, кажется, уже стали обыденностью для каждого из нас. Но они только начинают свой путь, и уж точно нет предела совершенству в развитии для каждого из присутствующих на рынке. Их становится всё больше — куда ни глянь, голосового помощника можно встретить в банковских приложениях, сервисах, браузерах, устройствах умного дома и не только.
Сегодня разберём лучших ассистентов для русскоязычной аудитории. Список последовательно отсортирован от менее подходящих до самых достойных и перспективных помощников. Ассистент от Google — хорошо, но не для нас Преимущества: большое количество совместимых устройств, точные ответы, встроенный переводчик, отправка сообщений в мессенджеры, хорошего качества поиск заведений и тесная работа с картами Недостатки: слабая адаптация под русскоязычную аудиторию, заключающаяся в отсутствии фишек, которые доступны только в США Google Ассистент — один из старожилов на современном рынке голосовых виртуальных помощников. Он был представлен 18 мая 2016 года в качестве преемника персонализированного сервиса Google Now. История и возможности.
Задолго до релиза Google Ассистента компания успела интегрировать голосовой поиск в браузер. S Voice всё же прекратил свою работу летом 2020 года, а последние два голосовых помощника под российский рынок так и не адаптировались. Не сказать, что Google Ассистент максимально подходит для российских пользователей, хотя поддержку того же русского языка он получил спустя пару лет после запуска.
Англоязычная разработка с ареалом распространения в США и Канаде, обитающая, прежде всего, в колонках и других атрибутах умного дома от Амазон. Не так давно Алексу научили немецкому и японскому языкам. Голосовой ассистент, который тесно связан с устройствами компании Самсунг и поддерживает 4 языка, на русском не говорит.
Здесь также стоит отметить и вторую голосовую разработку под названием Viv, которую изначально разрабатывали создатели Сири, и которая по обещаниям Самсунг, выкупившей стартап, будет интегрирована в Bixby 2. Штатный голосовой ассистент на платформе Windows пока не доступен на русском, но работает на 8 языках.
1937 год — Voder
- Голос будущего: как появились голосовые ассистенты
- Куртку брать?
- Правила комментирования
- Маруся голосовой помощник команды для умных колонок VK Капсула
Главное сегодня
- Голосовыми помощниками пользуются более половины россиян | - инновации и инвестиции
- Топ-6 лучших голосовых помощников. Разбираемся, какой лучше управляет всем на свете
- ВЦИОМ: более 60% опрошенных россиян пользуются голосовыми сообщениями
- Информация
Комаровка в Украине и советы по ужину: что умеют голосовые помощники Siri, Алиса и Google Assistant
Лучшие голосовые помощники: 4 ассистента с поддержкой русского языка. К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома. Расскажем о 10 главных голосовых помощниках на текущий момент и поможем понять их плюсы и минусы, а также то, какой из них подходит именно вам.
Ожидается трехкратный рост использования цифровых голосовых помощников
В то же время современные ученые утверждают, что языковые модели ИИ, на которых основаны голосовые помощники, не столько понимают нас, сколько имитируют это понимание. Мне, как и любому другому владельцу смартфона, важна не столько функциональность голосового помощника, сколько удобство его использования. Запускать каждый раз приложение, чтобы Маруся зачитала новости или позвонила кому-то из телефонной книги. Чат с Алисой, работающей на нейросети YandexGPT — широкие возможности искусственного интеллекта. В новом Чате с виртуальным ассистентом Алисой можно придумывать креативные идеи для работы и учебы, писать и редактировать тексты, создавать новые кулинарные. Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов. Полный список голосовых команд для голосового ассистента Маруся от компании Mail ru (VK).
Куртку брать?
- Главное сегодня
- Рекомендуем по теме
- Коммуникации пациента с врачами
- Комаровка в Украине и советы по ужину: что умеют голосовые помощники Siri, Алиса и Google Assistant
Маруся голосовой помощник команды для умных колонок VK Капсула
Академия Яндекса составила путеводитель по работе голосовых помощников и узнала у разработчиков Алисы, как их речь делают человечной. Как голосовые помощники распознают речь Первая стадия в работе голосового ассистента — это обработка звука. Если сказать помощнику «Лев Толстой», то он услышит не два слова, а звуковой сигнал, в котором гласные и согласные плавно перетекают друг в друга. Задача системы распознавания речи SpeechKit — восстановить по этому сигналу то, что человек говорил. Процесс распознавания осложняется тем, что одни и те же фразы, произнесённые разными людьми в разной обстановке например, в вагоне метро или в безлюдном парке , будут давать непохожие друг на друга сигналы. Поэтому для распознавания речи голосовой помощник делит слова на звуковые фрагменты — фонемы. Носители языка узнают именно их: например, первые гласные в словах «дом» и «домашний» мы воспринимаем одинаково, хотя звуки разные. В Алисе различают всего 48 фонем — в соответствии с подходом Ленинградской фонологической школы. Для того, чтобы распознавать фонемы, помощник работает с их числовым представлением.
Так, когда вы произносите запрос, смартфон записывает его и отправляет на сервер компании, которая разрабатывала голосового помощника. Там запись разделяется на множество маленьких фреймов — фрагментов речи длиной в сотые доли секунды. Затем каждый фрейм подвергают математическим преобразованиям и в результате получают коэффициенты, описывающие его частотные характеристики. А на основании этих данных ассистент может предположить, к какой фонеме принадлежит фрейм. Как и человек, голосовой помощник не всегда хорошо распознаёт звуки, и ему приходится достраивать слова исходя из контекста и статистики.
В первом варианте оценивается, сколько взаимодействий с клиентом было и сколько стало. Например, без ассистента в день общались с 1000 клиентов, а с ним — с 10 000. Во втором — проводится сравнительный анализ конверсии в продажах.
В этом случае конверсия с голосового ассистента сравнивается с конверсией контакт-центра», — поделился директор по развитию цифровых каналов банка «Синара» Алексей Аверин. Важно, что голосового помощника можно применять там, где надо просто проинформировать клиента о чем-либо или предоставить определенную информацию, сказала директор по маркетингу и PR застройщика GloraX Екатерина Ульянова. По ее словам, в результате множество контактов осуществляется за короткий промежуток времени. Например, напоминать клиенту о предстоящем событии — передаче ключей, заключении договора, внесении очередного платежа по графику рассрочки. Без бота такие действия требуют большого количества человеко-часов. Со временем чат- и голосовые боты станут неотъемлемой частью жизни, а диалог с продвинутым разговорным ИИ будет практически невозможно отличить от общения с живым человеком, полагает Станислав Милых.
Бумерам, поколению 1990-х и даже миллениалам трудно заставить себя разговаривать с колонкой, чайником или утюгом. Ощущение идиотизма ещё сильнее, если приходится общаться с техникой в публичных местах. Использовать голосовую команду для поиска информации без визуала сложно. На вопрос «Сколько времени? А покупка техники, выбор отеля или ресторана уже требуют в ответ фотографии и видео. Проблемы с защитой персональных данных. Например, Siri можно активировать, когда телефон находится в фоновом режиме. А значит, любой человек может включить ассистента и выполнить какие-то действия. Известный пример: в 2019 году Apple официально принесла извинения за то, что нанимала субподрядчиков, прослушивающих записи разговоров пользователей. В большинстве случаев запись включалась автоматически после того, как юзер произнёс ключевую фразу: «Привет, Siri». По словам Apple, прослушивание велось для того, чтобы повысить качество распознавания речи. Кто пользуется голосовыми помощниками Примерный портрет типичного любителя умных колонок — молодой человек в возрасте от 16 до 34 лет. Он с одинаковым успехом может быть как юношей, так и девушкой — статистика показывает, что голосовыми помощниками пользуются оба пола. А ещё пользователь, вероятнее всего, китаец, так как наиболее популярны виртуальные помощники именно там. Вводить текстовые запросы на китайском довольно сложно, голос стал хорошей альтернативой. Да и в целом китайцы охотнее принимают новые технологии. Поколения по-разному используют помощников. В рамках исследования «Будущее голосового поиска» портал Search Engine Watch сравнил запросы к голосовому помощнику подростков и взрослых: Сценарии использования в бизнесе Чаще всего боты заменяют менеджеров на входящих звонках и обзвоне. Один робот способен обработать за день до двух тысяч звонков. Компания может быстро окупить вложения на разработку помощника, убрав расходы на зарплаты, аренду площади, телефонию и интернет. Голосовой ассистент может решать и локальные задачи бизнеса. Например, в числе кейсов Surf есть концепт для ресторана KFC. Клиенту помогает сделать заказ виртуальный полковник Сандерс. Пользователь может общаться с ним, как с кассиром. С помощью полковника Сандерса можно: быстро посмотреть нужный раздел меню, сказав «Покажи мне все бургеры»; найти самое выгодное по цене блюдо: «Покажи мне все бургеры по акции»; изучить новинки, близкие по вкусу. Система автоматически обрабатывает заказы постоянного клиента и предлагает попробовать блюда, схожие по составу; заказать доставку домой. Если клиент заказывает не первый раз, ему не нужно говорить адрес и вводить контакты. Заказ оформляется в разы быстрее; повторить заказ.
Иногда у голосового помощника не получается понять фразу, тогда он достраивает слово из контекста всего предложения. Для этого у ассистентов есть таблица вероятностей переходов, в которой описаны возможные последовательности букв в словах. Кстати, такие таблички помогают распознавать запросы пользователей в зависимости от их акцента, поэтому, например, в Siri можно выбрать британский или американский английский язык. Если спросить у голосового помощника «Как дела? Да и форма голосовых помощников все чаще обретает человеческие черты: имя, пол, голос, может быть даже чувство юмора. Так как голосовых помощников учат быть человечными? Если для распознавания голоса виртуальными ассистентами используются сложные вычисления, то решать вопрос человечности позволяет большой список ответов, сочиненных редакторами и психологами. Это заготовленные специалистами голосовые сообщения с продуманными сценариями, где составлены ответы на самые популярные вопросы и запросы людей. Редакторы сознательно составляют пул ответов в стиле, который будет гармонировать с образом голосового помощника, чтобы образ был человечнее. Для ответов на вопросы, которые невозможно предугадать, голосовые помощники используют нейросети, обученные материалами из медиа, литературы, кино. Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги. Безопасность и конфиденциальность данных при использовании голосовых помощников Производители голосовых помощников уверяют, что данные пользователей конфиденциальны, а разговоры не прослушиваются, коммуникация с устройством безопасна. Но как тогда голосовой помощник будет обучаться? Несмотря на слова корпораций о безопасности, нужно обращать внимание, что в момент настройки голосового помощникам пользователь дает согласие на использование и обработку персональных данных. Кроме того, без Data Science невозможна работа и развитие голосового помощника. Вопрос в том, как хранятся эти данные? IT-гиганты сообщают, что голосовые помощники не записывают все, что происходит вокруг смартфона или колонки.
Сколько стоит работа голосового помощника в России
Множество полезных навыков для голосового помощника ждут вас в Каталоге навыков Алисы. Google Ассистент остается самым популярным голосовым помощником в мире. Множество полезных навыков для голосового помощника ждут вас в Каталоге навыков Алисы.
Голосовых помощников станет больше, чем людей
Голосовые помощники также могут повысить производительность, освобождая пользователей от необходимости тратить время на выполнение повседневных задач. Они могут упростить процессы планирования, организации и выполнения задач. Помимо этого, голосовые помощники могут стать удобным инструментом для пожилых людей, которые могут испытывать трудности с использованием технологий. Так как предоставляют простой способ взаимодействия с устройствами. Когда появился голосовой помощник и кто его придумал Сегодня мы ассоциируем голосовых помощников с такими технологическими гигантами, как Apple, Google, Amazon и Microsoft. Однако история голосовых помощников началась задолго до появления этих компаний. Одним из первых голосовых помощников был Dragon Dictate, разработанный в начале 1980-х годов компанией Dragon Systems.
Эта программа позволяла пользователям диктовать текст с помощью голоса, который затем превращался в печатный текст на компьютере. Хотя это не совсем был голосовой помощник в современном понимании, он стал одним из первых примеров технологии распознавания голоса. Следующим этапом в развитии голосовых помощников стал 2011 год, когда компания Apple представила Siri — голосового помощника, изменившего парадигму интерфейсов пользовательских устройств. Siri обеспечивала удобный способ взаимодействия с устройствами Apple через голосовые команды, отвечая на вопросы, выполняя задачи и предоставляя информацию. За Siri последовали другие голосовые помощники, такие как Google Assistant, Amazon Alexa и Microsoft Cortana, каждый из которых предоставлял свои уникальные возможности и функции. Важно отметить, что развитие голосовых помощников стало возможным благодаря внедрению искусственного интеллекта и машинного обучения.
Эти технологии позволили голосовым помощникам обучаться и адаптироваться к запросам пользователей, делая их все более умными и способными. Что умеют голосовые помощники: 5 возможностей 1. Поисковые запросы Голосовые помощники позволяют пользователям выполнять поисковые запросы в интернете, не используя руки для ввода команд на клавиатуре или сенсорном экране.
Локальный контекст становится архиважным, и глобальные компании зачастую не могут сделать ничего в этой области. Исключением является Google, у которого системы Google Now и Google Maps построены вокруг сбора точек интереса, или POI, то есть «изучают» мир, отзывы о тех или иных заведениях.
В Amazon этой информации нет, поэтому сценарии подразумевают не только алгоритм действий, но им нужна и первоначальная информация. В России дочерняя компания i-Free под названием Just AI с 2011 года создает такую платформу, то есть они пытаются создавать сценарии, применимые для российского рынка. Первым продуктом, в котором на массовом рынке применяются сценарии, созданные компанией, стал робот Pudding в нашем варианте «Емеля» , он умеет разговаривать на русском языке, искать определенный контент и защищать детей от нежелательных слов и запросов. Назвать «Емелю» роботом сложно, это самый настоящий голосовой помощник, ориентированный на детей в возрасте от 5 до 11 лет, при этом он не является игрушкой. Со стороны компании Just AI в этом голосовом помощнике сценарии и распознавание русской речи движок от Nuance.
В теории, если ребенок начнет интересоваться самоубийством или подобными темами, такой «робот» может отговорить его и отправить экстренное сообщение родителям — это те самые сценарии, которые нужно разработать и добавить их в устройство. Другой пример, дети часто хотят, чтобы им рассказали сказку, выбор сказок огромен, и возникает вопрос, на какой остановиться. В таких голосовых помощниках будет выбор приоритетных произведений, известных как детям, так и родителям. То есть, если вы не знаете, что именно хотите услышать, то говорите: «Хочу сказку». А уже сам помощник выбирает, какую именно сказку вы услышите.
Насколько умным будет ваш голосовой помощник, напрямую зависит от того, насколько он понимает контекст беседы, знает ваш образ жизни например, где вы работаете и адрес офиса, ваш распорядок дня. Понятно, что в этой гонке преимущество за Google, так как в рамках Ассистента компания знает про вас так много, что может построить разумные сценарии и подсказки, которые будут уместны и важны. Другие компании в этом направлении пока являются отстающими, но пытаются быстро развиваться. Умение обработать запрос, правильно выделить его контекст и найти релевантный ответ для голосовых помощников становится важнейшим свойством. Те компании, что научились выпускать голосовых помощников в Китае а таких уже десятки , не могут быстро и легко локализовать продукт для России или других стран, им нужны сценарии, которых у них нет.
Им нужно понимание локального контекста, а оно не может появиться из ниоткуда. И на этом пути выигрывают компании, которые уже начинают собирать такие данные всеми возможными способами. Мне это чем-то напоминает золотую лихорадку в картографии, когда в первые годы развития карт на мобильных устройствах все бились за максимальное и точное наполнение по POI, так как карта без расшифровки названий компаний и магазинов, времени их работы и тому подобного — это почти бесполезный рисунок. Обратите внимание, что есть еще один важный момент для домашних голосовых помощников, это наличие контента, например, музыки. Одно дело, когда у вас уже есть подписка на какой-то музыкальный сервис и вы слушаете и ищете музыку в нем.
Другое дело, если вы ищете что-то, чего там нет, тут на первый план выходит легальность воспроизведения и то, насколько большая библиотека доступна вашему помощнику, может ли он получить этот контент бесплатно или он должен его купить. Это интересный вопрос, но на нем мы останавливаться не будем. Из текста в голос — обратное преобразование Самые сложные операции позади, голос распознали, запрос обработали, помощник получил ответ в виде текста, и тут самое время его озвучить. К сожалению, системы преобразования текста в речь не так уж идеальны, и в них с легкостью можно узнать робота. Понятно, что в ближайшие 5-6 лет этот момент кардинально изменится, но сегодня многие преобразователи напоминают робота Вертера из советского фантастического фильма, говорят они нечисто, немного заикаются.
К сожалению, этот момент просто требует времени и изменения технологий, крупные производители получат преобразователи текста в голос со сносными характеристиками быстрее, чем небольшие компании. Посмотрите в ролике, как общается «Емеля», чтобы скрыть недостатки TTS-движка, тут даже придумали историю, что это робот с другой планеты и поэтому он говорит именно так. Понятно, что этот «робот» не звучит чисто, у Google Home или Amazon язык лучше, но нет поддержки русского у Google Home она появится в 2018 году, осенью, если судить по текущим планам компании. Отсутствие в России голосовых помощников объясняется просто — чтобы адаптировать китайские устройства, нужно обладать как модулями конвертации речи в текст и обратно, так и неким подобием AI, который обрабатывает сценарии и имеет некий контент на борту. В этом аспекте тот же «Емеля», или Roobo Pudding — первый пробный шар, который интересен с точки зрения технологий, как продукт для конечного потребителя он интересен в меньшей мере.
Впрочем, об этом мы поговорим в обзоре, где устроим для него подробнейшие испытания всех возможностей. Короткое заключение Рынок домашних голосовых помощников будет расти, и постепенно такие устройства станут распространены во всех уголках мира. Если еще двадцать лет назад центром умного дома мы представляли некий компьютер, который стоит в уголке или, напротив, размещен на видном месте, то теперь на эту роль претендуют голосовые помощники, тем более что в новых поколениях их стали оснащать экранами. В любом случае такие голосовые помощники дешевле, чем отдельный компьютер, а умеют ровно столько же и даже больше, так как это специализированные устройства. Несмотря на кажущуюся простоту, в таких помощниках сосредоточены по-настоящему высокие технологии.
Помимо уже упомянутого «Емели», российский пользователь может увидеть домашний голосовой помощник от Яндекса, в приложении Яндекс. Бета это голосовой чат с Алисой не напоминает Alexa? Пока это глубокая стадия беты, и чат выглядит очень и очень простым, незамысловатым. Но именно Яндекс в России способен создать не только чат для смартфонов, но и домашнего голосового помощника. Будьте уверены, что как только Алиса выйдет из стадии беты, через 8-9 месяцев родится домашний голосовой помощник, так как технология будет готова, а два других кирпичика в виде преобразования речи из текста и обратно у компании уже есть, и это собственная разработка.
Зная, как в Яндексе всегда стараются успеть быстрее Google, можно ожидать, что домашний голосовой помощник покажут на конференции Яндекс весной 2018 года и постараются начать продавать до сентября 2018 года, когда в России должен появиться Google Home.
Дмитрий Головин, заместитель руководителя департамента информационных технологий города Москвы: «В базе знаний робота-помощника содержится более 400 тематик, по которым он может оказать помощь, например, записать на прием к врачу или сдать показания счетчиков. Он подскажет график работы органов исполнительной власти и статус готовности документов, а также подаст заявку в Единый диспетчерский центр.
Роботу-помощнику достаточно двух минут, чтобы выслушать вопрос, получить дополнительную информацию и предоставить ответ звонившему». В мэрии отметили, что голосовой помощник находит нужную информацию в два раза быстрее человека.
Особенно для тех, кто не может пользоваться другими формами технологий, которые требуют мобильности, ловкости рук и хорошего зрения, например, смартфонами. Cuida Health помогает пожилым людям общаться с родственниками, получать доступ к разным сервисам, инструктаж по здоровому образу жизни и т. ElliQ — это проактивный социальный "робот" на базе технологий искусственного интеллекта, предназначенный для помощи старикам вести более активный и социально открытый образ жизни, предлагая им различные активности и упрощая связь с родными. LifePod разрабатывает сервис по уходу за пожилыми и больными людьми на базе голосовых технологий, предназначенный для повышения качества жизни больных людей и их родственников за счет мониторинга и поддержки ежедневной деятельности. Memory Lane представляет собой систему, помогающую пользователям помнить события своей жизни, улучшить свое настроение и обмениваться своими воспоминаниями и событиями с близкими людьми. Reminder Rosie создала недорогое и простое решение, напоминающее о графике приема лекарств, запланированных встречах и визитах к врачу, а также ежедневных задачах.
RemindMeCare - программное обеспечение, организующее лечение, персональный уход и активности пожилого человека, интегрированное с голосовой системой Amazon Alexa. Senter - разрабатывает систему, объединяющую современные IoT- и AI-технологии для обеспечения ежедневной деятельности и организации здорового образа жизни пожилых людей. Коммуникации пациента с врачами Голосовые технологии помогают упростить и автоматизировать общение пациентов с медицинскими организациями. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. VoiceFriend - простое, но мощное напоминающее решение, позволяющее вовремя информировать пожилых людей, медицинский персонал и членов семьи о разного рода событиях и предоставлять важную информацию. И одна из главных причин этого - перегрузка, в том числе из-за количества времени, затрачиваемого на ввод информации в компьютерные системы, заполнение документов. Несколько компаний работают сегодня над системами, позволяющими автоматизировать ввод врачебных записей в системы электронных медицинских карт. Kiroku - система, позволяющая автоматически "выбирать" нужный контекст из разговора с пациентом и автоматически создавать клинические записи для врача.
Рынок умных колонок и голосовых ассистентов в России и мире
К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома. Голосовые ассистенты незаметно входят в нашу обыденную жизнь, что подтверждает исследование Google: помощником пользуются более чем один раз в день 41% взрослых и 55% подростков. В нашем контакт-центре на ряду с голосовым помощником, работают операторы. Полный список голосовых команд для голосового ассистента Маруся от компании Mail ru (VK). К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома.