Независимая подборка лучших голосовых помощников с учетом всех плюсов и минусов. Алиса, Сбер Салют и Google Assistant стали самыми обсуждаемыми голосовыми помощниками по версии «Медиалогии».
«Остроумная и дерзкая»: в Tele2 запустили голосового помощника «Астра» для абонентов
Telegram: Contact @habr_com_news | Если мысль о том, что голосовые помощники захватывают мир, пугает вас, сейчас самое время отвести взгляд от экрана. |
Яндекс Образование | Агентство Juniper Research опубликовало смелый прогноз индустрии голосовых помощников и умных ассистентов. |
Forbes Экспертиза
Последние необходимы для непрерывного обучения и развития ассистентов. С годами устройства дорабатывались, а в 1962 году компания IBM представила миру технологию Shoebox. Эта система могла распознавать цифры от 0 до 9 и 16 слов. Сегодня такие достижения звучат наивно, но в прошлом веке появление технологии стало прорывом. Помимо универсальности, важна и корректная работа сервисов. Обеспечить ее помогают следующие технологии.
Автоматическое распознавание речи ASR. Процесс, позволяющий услышать и понять запрос пользователя. Для этого необходим микрофон и интернет-соединение, по которому аудиосигнал передается на серверы для последующего анализа и конвертации в текст. Понимание естественного языка NLU. Когда голос преобразован в текст, искусственному интеллекту необходимо понять его смысл и определить ключевые детали запроса.
Выполнение задачи через интерфейсы программирования приложений API. Сюда входит умение найти информацию в Сети, передать команду сопряженным устройствам экосистемы, набрать номер из списка контактов и другие действия.
Наибольший спрос на голосовые решения аналитики отмечают в банковской сфере и e-commerce — их использование помогает компаниям не отставать от потребительского спроса. При этом в ближайшее время количество голосовых решений увеличится и в сфере здравоохранения — в период COVID-19 голосовые чат-боты уже помогали проводить скрининги и сортировку пациентов. В России есть два десятка сильных игроков, которые разделили между собой рынок голосовых роботов. Это исследование мы посвятили тем из них, кто показывает рост. Как и большинство технологических рынков, российский VoiceTech кратно — более чем в два раза — вырос в ковидный 2020 год, после этого рост замедлился.
Но, по ее словам, Google пока не планирует выводить свои разработки на рынок: «Мы признаем, что машинная интерпретация языка создает ряд нерешенных проблем, поэтому в целом мы придерживаемся очень осторожного подхода».
Безмозглые имитаторы Искусственный интеллект, обученный на сотнях книг и бесчисленных интернет-страницах, имитирует естественный язык в высшей степени убедительно. Почему бы не использовать его как своего рода поисковую систему, которая синтезирует информацию из нескольких источников и упаковывает ее в удобочитаемые предложения? Проблема в том, что языковые модели ИИ — это бездумная имитация. Они могут подобрать нужное слово или достроить фразу, но, вопреки смелым заявлениям Пичаи, утверждающего, что его ИИ «понимает» многие темы, языковые модели не осознают, что говорят, и не могут рассуждать о том, что передают их слова. Это важно, поскольку говорящий ИИ перевернет наши представления об обмене информацией с машиной. По словам Бендер, когда мы вводим поисковой запрос и получаем информацию, мы понимаем, что взаимодействием с компьютером. Но если мы формулируем запрос так, словно машина способна нас понять, мы будем ждать от нее и более разумных ответов. Шах отмечает, что пользователи и без того уже весьма некритично относятся к результатам поиска, а общение на естественном языке лишь усилит их доверчивость.
Идея синтеза ответов на поисковые запросы с помощью ИИ появилась из так называемых прямых ответов — коротких текстовых выдержек, показываемых в результатах поиска над ссылками. Теоретически они могут дать вам нужную информацию, избавив от необходимости читать более длинные тексты. Бендер не против использования языковых моделей для обмена простыми вопросами и ответами — она сама пользуется Google Assistant на кухне, чтобы конвертировать единицы измерения в рецептах. Но Шах и Бендер также приводят более тревожный пример — в прошлом году Google на запрос «Какой самый уродливый язык Индии? Никаких простых ответов Здесь возникает дилемма. Получать прямые ответы удобно, но часто они могут быть неверными, неуместными или оскорбительными.
Алиса сперва растерялась, но после повторного запроса собралась и показала прогноз погоды: Siri тоже не распознала подвох, а вот после вопроса «мне стоит завтра потеплее одеться? Google Assistant выдал список роликов по выбору трендовой куртки; на более конкретный вопрос «стоит завтра одеваться потеплее? Проще в приложении глянуть, что там завтра на улице.
Иньярриту и Metallica Помощники не всегда нормально понимают сложные имена. Это стало ясно после разговора с Алисой в «Яндекс. Станции»: система ни в какую не хотела распознавать Алехандро Гонсалеса Иньярриту в итоге все же нашла его, но понадобилось попыток десять. Вот и проверим на других ассистентах. Но сперва дадим шанс Алисе. Удивительно, но на смартфоне ассистент с первого раза верно понял имя. Siri тоже сразу предложила подборку ссылок на мексиканского мастера: статьи в Wikipedia, онлайн-кинотеатр и так далее. То же самое сделал и Google Assistant. Настоящий помощник умеет еще и поднять шефу настроение, так что заказываем шутки.
С просьбой «расскажи анекдот» Алиса и Google Assistant справились насколько успешно, сказать сложно — чувство юмора-то у людей разное , а вот Siri замялась: Хотя, видимо, в этом и была вся соль. С поиском музыки вышло неоднозначно: на запрос «открой последний альбом Metallica» Алиса сразу включила первый трек с нужной пластинки, а Siri почему-то запустила вторую песню. Справедливости ради отметим, что мы не просили проигрывать альбом с начала, но логично было бы сделать именно так. Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован.
Как это работает? Голосовые помощники для дома и квартиры на примере Google, Amazon и других
Список TOP-30 популярных голосовых помощников в мире | В процессе голосовому ассистенту можно задавать вопросы и просить его о помощи, если что‑то не получается отправить. |
«Алиса» научилась рассказывать москвичам об оценках детей в школе: Россия: | Выбор имени голосового помощника проходил в несколько этапов. |
10 главных умных помощников в 2022 году
Голосовые помощники составят расписание, переведут деньги, закажут еду, возьмут на себя управление умным домом — в общем, они умеют все, что положено уметь хорошему помощнику. Специально чтобы подсчитать, сколько может стоить сторонней компании обслуживание домашнего голосового помощника, установил диктофон и посчитал, сколько запросов в среднем в день у меня к Google Home. голосовой ассистент может давать быстро ответы на все интересующие вопросы.
Коммуникации пациента с врачами
- Для чего нужен голосовой помощник
- Публикации
- Рынок умных колонок и голосовых ассистентов в России и мире
- 29 регионов России используют голосовых помощников в сфере здравоохранения
Call-центры вымрут как динозавры: что ждет рынок голосовых помощников
на 121,3% в год. Статья Голосовые ассистенты (Роботы-операторы), 80% опрошенных россиян постоянно общаются с голосовыми помощниками, В первом полугодии количество звонков с помощью голосового робота составило 360 млн, Смотрите также Голосовые помощники. Добавьте в голосовой помощник Алису от Яндекса новые навыки на тему — Новости. Этого голосового ассистента создали, когда Siri ещё не была адаптирована для русскоязычных пользователей. Выбираем самого умного голосового помощника в 2023 году. Всего голосовой помощник обработал уже свыше 31,3 миллиона обращений — почти половину от общего числа звонков в единую справочную службу.
Сколько стоит работа голосового помощника в России
Рядовые функции Марусе по плечу, но в целом пользоваться ей в полной степени смогут лишь те, кто предан VK и сервисам Mail. Дуся Ассистент Дуся — отд ельное приложение, доступное в Google Play только для устройств на Android. Её главная о собенн ость в том, что можно самостоятельно настраивать скрипты её функционала. По умолчанию их свыше 150: это запуск разных приложений, создание заметок, установка будильников, навигация и так далее. Дуся настраивается с помощью ПК или чата в Телеграме, посредством текстовых команд. Кроме того, она способна распознавать управление жестами и виджетами. Главный Дусин недостаток — платный доступ: бесплатная версия работает всего неделю.
Оно распознаёт речь, поддерживает диалог и, как Алиса, способно сохранять контекст. Популярностью «Ассистент на русском» похвастать не может, как и лёгким доступом: бесплатная версия работает неделю, полная стоит 500 рублей. Кроме того, последнее обновление было в начале 2014 года. От конкурентов, правда, особо не отличается, а Алисе во многом значительно уступает.
И одна из главных причин этого - перегрузка, в том числе из-за количества времени, затрачиваемого на ввод информации в компьютерные системы, заполнение документов. Несколько компаний работают сегодня над системами, позволяющими автоматизировать ввод врачебных записей в системы электронных медицинских карт. Kiroku - система, позволяющая автоматически "выбирать" нужный контекст из разговора с пациентом и автоматически создавать клинические записи для врача. MDOps позволяет значительно уменьшить время на создание документации путем диктовки и автоматического создания клинических записей с помощью iPhone или iPad. Notable использует носимые устройства, голосовой интерфейс и AI для упрощения взаимодействий врача с пациентом. Saykara упрощает захват данных с помощью виртуального записывающего решения на базе AI-технологий, которое позволяет избавиться от необходимости работы с системой электронных медицинских карт. Sopris Health — это интеллектуальная клиническая платформа, использующая "умную" систему расшифровки голоса на базе AI. Suki - цифровой виртуальный ассистент для врачей, который позволяет снизить нагрузку, связанную с заполнением медицинской документации. При этом используются обработка естественной речи для ее преобразования в текст и наоборот. Кроме того, есть решения, которые отслеживают развитие болезни со временем, используя речевые данные. Ava предназначена для глухих и слабослышащих людей, показывая им кто и что говорит. VocaliD использует голосовой банк и технологии обработки голоса, позволяющие создать уникальные голоса, персонализирующие любые устройства, которые преобразуют текст в голос. Voiceitt - разрабатывает первую в мире технологию распознавания голоса, предназначенную для понимания нестандартной речи. Платформы для разработчиков Эти компании создают программные решения для тех, кто хочет разрабатывать и публиковать голосовые приложения, особенно если они предназначены для нескольких аппаратных платформ например, Amazon Alexa и Google Home.
Typle — простенькая утилита для Windows 7, 8 и 10. Функционал Typle весьма ограничен: программа может открывать файлы и приложения, но при этом не способна, скажем, управлять музыкальным проигрывателем. Зато Typle прекрасно понимает русский язык, а благодаря продвинутой технологии распознавания речи может работать даже с бюджетными микрофонами. Заключение В скором времени владельцев гаджетов с Android ждет нелегкий выбор. А между тем, развитие голосовых помощников идет полным ходом. У Тинькофф и Сбербанка, например, уже давно также появились свои собственные ассистенты. Удивляться этому не следует, ведь голосовые помощники — это не только весело, но и действительно удобно. Читайте также.
Популярность голосовых ассистентов в мире растет. Amazon Alexa, Apple Siri, Google Assistant, Microsoft Cortana, Samsung Bixby и российская "Алиса" совершенствуются и все лучше справляются со своими задачами, такими как поиск нужной информации в интернете, управление календарем и будильником, совершение звонков по телефону, озвучивание полученных сообщений и отправка ответных, развлечение пользователей и многое другое. Сегодня активнее всего виртуальными помощниками пользуются владельцы смартфонов, но аналитики ожидают, что в ближайшие годы голосовые ассистенты будут быстро распространяться и на других видах устройств. Также в прогнозе Juniper Research говорится о стремительном развитии голосовой коммерции - к 2023 году объем этого рынка превысит 80 миллиардов долларов. Аналитики пояснили, что включают в понятие денежные переводы и покупки цифровых товаров, а не только совершение традиционных покупок при помощи голосовых ассистентов.
Маруся голосовой помощник команды для умных колонок VK Капсула
Сколько стоит создание ассистента и что для этого нужно уметь. Пока разработку собственных голосовых помощников могут позволить себе крупные компании. Сколько стоит создание ассистента и что для этого нужно уметь. Пока разработку собственных голосовых помощников могут позволить себе крупные компании. В статье мы рассмотрим историю развития голосовых ассистентов — от первых синтезаторов речи 1779 года до умных колонок в наших домах. Голосовые ассистенты незаметно входят в нашу обыденную жизнь, что подтверждает исследование Google: помощником пользуются более чем один раз в день 41% взрослых и 55% подростков. В постоянно меняющемся мире технологий неизменно лишь одно: желание технокомпаний запустить свой голосовой помощник. К 2024 году более 90% голосовых помощников будут осуществлять поддержку и управлять девайсами умного дома.
Ожидается трехкратный рост использования цифровых голосовых помощников
Пичаи продемонстрировал демо-версию, в которой чат-бот отвечал на вопросы о Плутоне на естественном языке. Вместо того, чтобы перечислить результаты поискового запроса, он вступил в беседу от лица карликовой планеты. Пичаи: «Скажи мне, что бы я увидел, посетив Плутон? Пичаи: «Звучит великолепно». LaMDA: «Уверяю вас, поездка стоит того. Однако вам следует взять пальто, так как становится очень холодно». Это было очень мило, даже несмотря на то, что иногда LaMDA ошибался. По словам Пичаи, языковая модель, которую использует чат-бот, по-прежнему находится на стадии разработки.
Также глава Google заявил, что они пока не планируют внедрять LaMDA в свои продукты, но уже использует бот для изучения новых способов поиска информации и взаимодействия с компьютером. Идеал, в соответствии с которым разрабатываются поисковые системы, — это всезнающий ИИ, выдающий актуальную и точную информацию в виде краткого и простого для понимания текста. А с появлением голосовых помощников, таких как Siri и Alexa, языковые модели становятся универсальной технологией для поиска информации. Однако не всем нравится это новшество. Некоторые исследователи утверждают, что видимая простота диалога между пользователем и ИИ скрывает тот факт, что ИИ при этом наделяется авторитетом, которой ни на чем не основан. Не так давно Чираг Шах, специалист по поисковым технологиям из Вашингтонского университета, и его коллега Эмили Бендер, изучающая компьютерную лингвистику и этические проблемы обработки естественного языка, опубликовали статью , в которой поделились опасениями, что использование для поиска языковых моделей может привести к распространению дезинформации и поляризации общественного мнения. Также исследовательница предупреждает об опасностях использования больших языковых моделей в своей статье , написанной в соавторстве с Тимнит Гебру, технической руководительницей комитета по этическим вопросам, связанным с ИИ.
Голосовой помощник Alexa заговорит голосом усопших Голосовой помощник Alexa заговорит голосом усопших 23 июня 2022, 16:11 МСК Поделиться Комментарии На конференции Re:Mars компания Amazon представила новую функцию для голосового помощника Alexa. Во время презентации старший вице-президент Рохит Прасад попросил прочитать «Волшебника страны Оз» голосом бабушки. Голосовой помощник тут же переключился на более мягкий и человеческий голос, имитируя члена семьи.
Теперь — вопросы, привязанные к актуальным событиям: Да, Сири действительно открывает App Store, если спросить ее, как сыграл «Локомотив».
Алиса то ли отшучивается, то ли думает, что шутим мы. И только Ассистент выдал четкий и точный ответ. Дальше посложнее. Вопросы на индексацию новостей: Все три помощника выдали поисковые ссылки с небольшими превью.
Однако в окне Ассистента правильный ответ выделен жирным шрифтом, поэтому можно считать, что только этот бот справился с заданием. Ассистент выступил блестяще, Алиса с Сири отбились ссылками, но в окне помощника «Яндекса» хотя бы видно название фильма. Еще один вопрос про «Оскар» — но посложнее: И вновь Ассистент на высоте! Сири внезапно ответила на вопрос, который ей задавали полчаса назад, Алиса открыла «Яндекс».
Кроме того, Ассистент распознал контекст — понял, что «про него» — это про Тома Хэнкса. Еще немного кино: Все как всегда: Сири опять городит черти-что, Алиса и Ассистент справляются без труда. Теперь — к знаменитостям: Программа «Престолы»? Сири, ты серьезно?
У Алисы и Ассистента все как всегда хорошо. Теперь задачка на распознавание контекста. Ассистент в него «умеет», поэтому посмотрим на Алису и Сири. На первый вопрос Сири ответила и даже, что забавно, показала возраст Дурова , а вот второй посчитала за отдельный.
Алиса выступила на уровне Google Ассистента. Теперь — к менее известным фактам: Сири вообще не поняла, на каком языке к ней обратились. Ассистент с Алисой как всегда не подвели. Задачи Начнем с самых простых и полезных.
Сообщения: А вот здесь подводит уже Алиса.
Typle — простенькая утилита для Windows 7, 8 и 10. Функционал Typle весьма ограничен: программа может открывать файлы и приложения, но при этом не способна, скажем, управлять музыкальным проигрывателем. Зато Typle прекрасно понимает русский язык, а благодаря продвинутой технологии распознавания речи может работать даже с бюджетными микрофонами. Заключение В скором времени владельцев гаджетов с Android ждет нелегкий выбор. А между тем, развитие голосовых помощников идет полным ходом. У Тинькофф и Сбербанка, например, уже давно также появились свои собственные ассистенты. Удивляться этому не следует, ведь голосовые помощники — это не только весело, но и действительно удобно. Читайте также.