Навык «Утреннее шоу» Алисы идеально подходит для людей, которые хотят быть в курсе всех новостей и интересных мероприятий. В Алису от Яндекса добавили функцию Утреннее шоу. Что сказать: «Алиса, запусти утреннее шоу», «Алиса, включи утреннее шоу». Эти программы помогают узнать нужную информацию в начале дня или рассказать о том, что вы могли пропустить. Сделать это можно в приложении «Дом с Алисой»: Настройки → Контент → Шоу с Алисой. Афиша мероприятий и новости.
Шёпот и эмоции в Алисе: история развития голосового синтеза Яндекса
Она откроет тексты песен не только российских, но и зарубежных исполнителей. Кнопка «Т» в музыкальном плеере даст понять, для каких треков доступен текст. Персонализация утреннего шоу Теперь пользователь может решать, каким будет ваше утреннее шоу. Например, можно выбрать, какой контент и в каком порядке будет воспроизводиться: подкасты на разные темы, прогноз погоды, конкретные навыки, музыкальные треки или новости из определённых источников. Афиша мероприятий и новости Анонсы интересных событий в городе будут отображаться на главном экране Станции Дуо Макс.
Приложение «Яндекс Музыка» автоматически синхронизирует текст с исполняемой песней. Эта функция доступна как для российских, так и для зарубежных треков. Доступность функции, можно понять по кнопке «Т» в музыкальном плеере. Новые спортивные каналы по подписке Подписчики «Яндекс Плюса» получили доступ к новым спортивным каналам, таким как «Матч Премьер» и «Матч! Футбол», что позволит наслаждаться прямыми трансляциями важнейших спортивных событий. Расширенные возможности видео Видео, найденные через поиск, теперь можно сразу же воспроизводить на «ТВ Станции».
Алиса прекрасно ориентируется в происходящем и говорит о том, что волнует людей. Например, сейчас в паузах между новостями и песнями Алиса рассказывает, как с пользой и удовольствием провести время дома. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов. Утреннее шоу доступно в Яндекс.
Чтобы узнать о предстоящем событии больше, нужно нажать на кнопку «Подробнее», и Алиса покажет все детали во встроенном Браузере. Если во время прослушивания нужно перейти к новой рубрике, достаточно сказать Алисе «Дальше» — и она тут же перейдёт к следующему блоку. Радионяня для каждого в семье Теперь каждый пользователь может включить режим радионяни на Яндекс Станции и получать звуки из детской прямо на телефон. Нужно только пригласить близких в свой Дом и указать, кто может включать режим радионяни. Сообщения между Станциями Когда нужно передать близким или друзьям что-то важное, можно отправлять сообщение прямо на умную колонку со своей Станции.
Вышло апрельское обновление Алисы и умных устройств Яндекса
Правда, только если он от «Яндекса». Источник: yandex. После каждого этапа Алиса будет делать паузу, чтобы вы успели выполнить ее советы. Чтобы перейти к следующему шагу, нужно сказать: «Дальше». В этом режиме Алиса будет сама ставить таймер.
Управление воспроизведением осуществляется голосом, что включает команды паузы, перемотки и выбора качества видео. Пользователи могут использовать команды, такие как: «Алиса, включи шоу» — для начала воспроизведения выбранного видео. Персонализация «Утреннего шоу» Пользователи могут настраивать порядок и тип контента, который будет воспроизводиться в «Утреннем шоу». Афиша мероприятий на главном экране «Станция Дуо Макс» научилась отображать анонсы мероприятий, проходящих в городе пользователя. Радионяня для каждого Режим радионяни на «Яндекс Станции» теперь доступен для каждого члена семьи. Сообщения между «Станциями» Функция отправки сообщений между устройствами улучшена тем, что теперь «Алиса» указывает, откуда именно пришло сообщение — с какой комнаты или «Дома».
Руководитель проекта "Алиса" Андрей Законов отмечает, что данное нововведение было сделано с той целью, чтобы Алису стали воспринимать не только как умного помощника с голосовым «интерфейсом», а как некоего виртуального компаньона, который может не только быть полезным в конкретных задачах, но и помогать приятно провести время в своей компании, тем более, в условиях сокращения социальных контактов. Станция включая версию Мини и других «умных колонках», поддерживающих Алису. Чтобы запустить данную программу, необходимо сказать кодовую фразу «Алиса, включи утреннее шоу».
Алиса направит жалобу на дороги, благоустройство или здравоохранение в местный орган власти, отвечающий за ее решение.
Как посчитать калории для себя Не знаете, сколько калорий в пище? Скажите Алисе: она посчитает все за вас и даже подскажет меню на следующий день Яндекс. Станция — хороший помощник для тех, кто следит за своей фигурой. Скажите Алисе «Попроси умный счетчик калорий записать» и уточните блюдо.
В ответ ассистент вам расскажет о содержании белков, жиров и углеводов в пище. Если фиксировать с помощью Алисы съеденное за день, то вечером она сообщит, сколько калорий вы употребили за день и даже рассчитает меню на следующий день. Алиса точно знает названия блюд и подскажет, что употреблять из напитков. Остались вопросы по статье?
Задать их можете в нашем Telegram-чате! Как начать тренироваться дома Тренажерный зал — это круто, но кто сказал, что тренировки дома чем-то хуже? Скажите: «Алиса, запусти навык фитнес-наставник«. Голосовой помощник заменит вам тренера: Алиса расскажет, как сделать упражнение, включит музыку и посчитает примерное количество сожженных калорий.
А какие классные навыки Алисы знаете вы?
Тексты песен на ТВ Станциях
- Новый формат контента в утреннем шоу Алисы: истории от навыков
- Утреннее шоу от Алисы на Яндекс Станции: как включить и настроить
- У "Алисы" от Яндекса появилась новая функция - теперь она ведет "утреннее шоу"
- Товары из материала
Шёпот и эмоции в Алисе: история развития голосового синтеза Яндекса
«Мы хотим, чтобы Алиса была не только помощником, но и другом, с которым приятно проводить время. Поэтому мы учим её следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении». В умных колонках с Алисой появилось персональное утреннее шоу: теперь можно слушать полезную информацию и музыку, подобранную специально для слушателя. О сервисе Прессе Авторские права Связаться с нами Авторам Рекламодателям Разработчикам. В этой статье мы рассмотрим, что такое утреннее шоу от Алисы, как включить его на Яндекс Станции и как настроить.
«Яндекс» научил «Алису» вести персональное утреннее шоу
Музыке — в нем собраны треки, отобранные для пользователя. Чтобы запустить программу, достаточно сказать: «Алиса, включи утреннее шоу! Поэтому мы учим ее следить за новостями, развлекать пользователей и создавать приятную атмосферу в доме, и утреннее шоу — первый шаг в этом направлении», — говорит руководитель продукта Андрей Законов.
Новости радиостанций можно слушать как в утреннем шоу, так и отдельно. Причём их зачитывает ведущий. Голосовой помощник следит за новостными выпусками девяти радиостанций. А утреннее шоу — это такой формат, который позволяет собрать воедино то, что любишь. Несложные манипуляции с настройками — и человек получает именно то, что хочет.
Во-первых, будет играть только та музыка, которая нравится вам. Во-вторых, в настройках приложения Яндекс вы можете выбрать желаемые источники новостей и интересующие вас темы. Настройте Утреннее шоу для себя: выберите источники новостей, подкасты и даже гороскоп Зайдите в приложение Яндекс и выберите «Устройства»; Нажмите на вкладку «Настройки»; Выберите «Шоу Алисы».
В списке включите темы, которые вам хочется услышать. Среди них можно найти даже короткие подкасты. В навыках для шоу я включил для себя «Цитату дня» и «Комплимент дня» — подкат от Алисы засчитан! Читайте также: Чего мне не хватает в Яндекс. Станции Яндекс. Станция уведомления Не все знают, но на вашу Яндекс. Станцию могут приходить полезные уведомления о новых сериалах на Кинопоиске, музыкальных новинках и выпусках подкастов, на которые вы подписаны. Включить их очень просто. Если колонка мигает зеленым, значит, вам пришло новое уведомление Зайдите в приложение Яндекс; Перейдите в «Настройки»; Выберите «Уведомления от Алисы». Когда на колонку поступит уведомление, прозвучит короткий звуковой сигнал, а сама колонка начнет мигать зеленым.
Просто скажите «Алиса, что нового? Какой сериал посмотреть Яндекс.
Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения. Язык — хитрая штука. Не все знаки препинания в речи выражаются паузами Например, после вводного слова «конечно» на письме мы ставим запятую, но в речи обычно не делаем паузу. А там, где знаков препинания нет, мы часто делаем паузы. Если эту информацию не передавать в акустическую модель, то она пытается её выводить и не всегда успешно. Первая модель Алисы из-за этого могла начать вздыхать в случайных местах длинного предложения. Для этого мы взяли датасет, разметили его детектором активности голоса, сгруппировали паузы по длительности, ввели класс длины паузы, на каждое слово навесили тэг и на этом корпусе обучили ещё одну голову внимания из тех же нейросетевых эмбеддингов, что использовались для детекции омографов.
Осенью 2020 года мы перевели на трансформеры нормализацию — в синтезе она нужна, чтобы решать сложные случаи, когда символы читаются не «буквально», а по неким правилам. Например, «101» нужно читать не как «один-ноль-один», а как «сто один», а в адресе yandex. Обычно нормализацию делают через комбинацию взвешенных трансдьюсеров FST — правила напоминают последовательность замен по регулярным выражениям, где выбирается замена, имеющая наибольший вес. Мы долго писали правила вручную, но это отнимало много сил, было очень сложно и не масштабируемо. Тогда решили перейти на трансформерную сеть, «задистиллировав» знания наших FST в нейронку. Теперь новые «правила раскрытия» можно добавлять через доливание синтетики и данных, размеченных пользователями Толоки, а сеть показывает лучшее качество, чем FST, потому что учитывает глобальный контекст. Итак, мы научили Алису говорить с правильными интонациями, но это не сделало ее человеком — ведь в нашей речи есть еще стиль и эмоции. Работа продолжалась. С чувством, толком, расстановкой: стили голоса Алисы Один и тот же текст можно произнести десятком разных способов, при этом сам исходный текст, как правило, никаких подсказок не содержит. Если отправить такой текст в акустическую модель без дополнительных меток и обучить её на достаточно богатом различными стилями и интонациями корпусе, то модель сойдёт с ума — либо переусреднит всё к металлическому «голосу робота», либо начнёт генерировать случайный стиль на каждое предложение.
Это и произошло с Алисой: в начале она воспроизводила рандомные стили в разговоре. Казалось, что у неё менялось настроение в каждом предложении. Вот пример записи с явными перебоями в стилях: Чтобы решить проблему, мы добавили в акустическую модель стили: в процессе обучения нейросети специально ввели «утечку». Суть в том, что через очень lossy-пространство всего 16 чисел на всё предложение разрешаем сетке посмотреть на ответ — истинную мел-спектрограмму, которую ей и нужно предсказать на обучении. За счёт такой «шпаргалки» сеть не пытается выдумывать непредсказуемую по тексту компоненту, а для другой информации не хватит размерности шпаргалки. На инференсе мы генерируем стилевую подсказку, похожую на те, что были в обучающем сете. Это можно делать, взяв готовый стиль из обучающего примера или обучив специальную подсеть генерировать стили по тексту. Если эту подсеть обучить на особом подмножестве примеров, можно получить специальные стили для, скажем, мягкого или дружелюбного голоса. Или резкого и холодного. Или относительно нейтрального.
Чтобы определиться со стилем по умолчанию, мы устроили турнир, где судьями выступали пользователи Толоки. Там не было разметки, мы просто нашли кластеры стилей и провели между ними соревнование. Победил кластер с очень мягкой и приятной интонацией. Дальше началось самое интересное. Мы взяли образцы синтезированной «мягкой» речи Алисы и фрагменты речи актрисы Татьяны Шитовой, которые относились к более резкому стилю. Затем эти образцы с одним и тем же текстом протестировали вслепую на толокерах. Оказалось, что люди выбирают синтезированный вариант Алисы, несмотря на более плохое качество по сравнению с реальной речью человека. В принципе, этого можно было ожидать: уверен, многие предпочтут более ласковый разговор по телефону то есть с потерей в качестве живому, но холодному общению. К примеру, так звучал резкий голос: А так — мягкий: Результаты турниров позволили нам выделить во всем обучающем датасете данные, которые относятся к стилю-победителю, и использовать для обучения только их. Благодаря этому Алиса по умолчанию стала говорить более мягким и дружелюбным голосом.
Этот пример показывает, что с точки зрения восприятия важно работать не только над качеством синтеза, но и над стилем речи. После этого оставалось только обогатить Алису новыми эмоциями. Бодрая или спокойная: управляем эмоциями Алисы Когда вы включаете утреннее шоу Алисы или запускаете автоматический перевод лекции на YouTube, то слышите разные голоса — бодрый в первом случае и более флегматичный в другом. Эту разницу сложно описать словами, но она интуитивно понятна — люди хорошо умеют распознавать эмоции и произносить один и тот же текст с разной эмоциональной окраской. Мы обучили этому навыку Алису с помощью той же разметки подсказок, которую применили для стилей. У языка есть интересное свойство — просодия , или набор элементов, которые не выражаются словами. Это особенности произношения, интенсивность, придыхание и так далее. Один текст можно произнести со множеством смыслов. Как и в случае со стилями речи, можно, например, выделить кластеры «веселая Алиса», «злая Алиса» и так далее. Поскольку стилевой механизм отделяет просодию «как говорим» от артикуляции «что говорим» , то новую эмоцию можно получить буквально из пары часов данных.
По сути, нейросети нужно только выучить стиль, а информацию о том, как читать сочетания фонем, она возьмёт из остального корпуса. Прямо сейчас доступны три эмоции. Например, часть пользователей утреннего шоу Алисы слышат бодрую эмоцию. Кроме того, её можно услышать, спросив Алису «Кем ты работаешь? Флегматичная эмоция пригодилась для перевода видео — оказалось, что голос по умолчанию слишком игривый для этой задачи. Наконец, радостная эмоция нужна для ответов Алисы на специфические запросы вроде «Давай дружить» и «Орёл или решка? Ещё есть негативная эмоция, которую пока не знаем, как использовать — сложно представить ситуацию, когда людям понравится, что на них ругается робот. Первый корпус эмоций мы записали ещё при WaveGlow, но результат нас не устроил и выкатывать его не стали. С переходом на HiFi-GAN стало понятно, что он хорошо работает с эмоциями, это позволило запустить полноценный эмоциональный синтез.
Место под большое лого и рекламу навыков
8 новых фишек «Яндекс Станций» и «Яндекс ТВ Станций», которые появились в апреле | первый шаг в этом направлении". |
На колонках с Алисой появилась функция Утреннего шоу | Друзья Алисы и пользователи сервисов Яндекса, общаясь с Алисой, смогут узнавать актуальные новости из мира мотоциклов. |
Утреннее шоу Алисы стало персональным
Мы расскажем, что такое сценарии для Алисы, чем они отличаются от команд и какие хорошие команды уже придумали пользователи. Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Утренние шоу впервые появились в апреле этого года. Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций. Теперь голосовой помощник может запускать новостные блоки с девяти станций, включая «Хит ФМ» и «Коммерсантъ FM». Утренние шоу впервые появились в апреле этого года. Умная лампочка Яндекс с Алисой, цоколь E27, белая (YNDX-00501). Выбрать тематику новостей и подкастов можно в приложении «Яндекс», сказав «Алиса, открой настройки шоу» или «Алиса, открой настройки новостей».
Утреннее шоу Алисы стало персональным 😎
Новые функции «Алисы» и «Яндекс Станций» за апрель 2024 года | Настроить Утреннее шоу Алиса. В последнее время я отказался от соцсетей и почти не читаю новостей о том, что происходит в мире, не считая спорта. |
«Яндекс» научил «Алису» вести персональное утреннее шоу | В этой статье мы рассмотрим, что такое утреннее шоу от Алисы, как включить его на Яндекс Станции и как настроить. |
Вышло апрельское обновление Алисы и умных устройств Яндекса | Для настройки новостей на Яндекс Алисе необходимо открыть раздел «Интеграция» в настройках приложения. |
Слушать утреннее и вечернее шоу Алисы на Станции | И тогда возникает вопрос: «Читает ли Алиса последние новости так, как она это делала раньше?». |
Что умеет «Яндекс-станция»: 17 полезных функций и команд для Алисы
Несложные манипуляции с настройками — и человек получает именно то, что хочет. Думаю, новую возможность особенно оценят авторы подкастов, у которых появилась ещё одна площадка», — отметил Андрей Законов, руководитель продукта голосового помощника «Алиса». Помимо чтения актуальных новостей по утрам, «Алиса» также научилась отслеживать эфиры радиостанций.
Голосовой помощник может ответить на запрос и при заблокированном экране телефона [28]. Станцию Мини. Станции за 9990 рублей колонка отличалась меньшей ценой 3990 рублей , а также с ней можно взаимодействовать с помощью жестов [29].
Портативная модель защищена от воды и работает до восьми часов без подзарядки. С помощью док-станции её можно сделать стационарной [30]. Станция Макс». Она сохранила корпус предыдущей модели, получила LED-экран, трехполосный звук совокупной мощностью 65 Вт и поддерживает видео в 4k [31]. Станцию Лайт.
В октябре 2021 года — Яндекс. Станция Мини 2-го поколения. На момент анонса Станции Лайт её родоначальная версия Станция Мини стоила уже 6990 рублей[ источник не указан 48 дней ]. Конструкторы навыков Для создания навыков для Алисы можно воспользоваться конструкторами навыков. Чтобы создать навык, необходимо задать его алгоритм в специальном визуальном конструкторе.
Конструктор представляет собой дерево с множеством условных переходов ветвей. Можно передать заявки от клиентов из Алисы в amoCRM, Битрикс24, Google-таблицы и на электронную почту [ источник не указан 48 дней ]. На других языках С марта 2019 года «Алиса» доступна на турецком языке в приложении « Яндекс. Навигатор » под названием Alisa с ударением на последний слог [32]. Озвучила «Алису» турецкая актриса дубляжа Селяй Ташдоген [33].
Прочее Пользователи положительно оценили способность Алисы поддерживать беседу, шутить и давать ответы на нетривиальные вопросы. С запуском голосового помощника в СМИ вышли многочисленные репортажи со скриншотами чатов, в которых в ответ на провокационные запросы Алиса повела себя неожиданным для пользователя образом: часто дерзила, дразнилась, спорила и отказывалась выполнять команды [34]. В беседе двух Алис одна другой посоветовала выброситься в окно [35]. Алиса продемонстрировала, что понимает вопрос про миелофон , а также умение рассказывать анекдоты о роботах и читать известные стихи, добавляя к ним технологические термины [34] [35] , понимает жаргон [9]. Алиса появлялась в русскоязычной версии мультфильма « Монстры на каникулах 3: Море зовёт »: в одном из эпизодов главный герой Дракула общался с голосовым помощником данный product placement используется в рамках исключительной договорённости Яндекса с Sony Pictures Entertainment , в прокате для других стран голосовой поисковик остался обезличен.
Ещё раньше с ней общались герои российского фильма « Я худею » [36]. В 2018 году вышел фильм «Алиса», снятый Василисой Кузьминой при поддержке продюсерской компании Bazelevs Тимура Бекмамбетова.
Будь в курсе последних новостей из мира гаджетов и технологий iGuides для смартфонов Apple Утреннее шоу «Алисы» стало персональным Александр Кузнецов — 2 октября 2020, 17:10 Утреннее шоу голосовой ассистентки «Алисы» теперь можно настроить на свой вкус, указав тематику новостей и подкастов. Например, человек может выбрать новости спорта и подкасты про кино. Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. Она читает новости, ставит людям музыку и развлекает историями на разные темы — почти как настоящий диджей.
Правда, на более низком уровне обновилось примерно всё. Акустическая модель В отличие от старой параметрики, новую модель мы построили на основе seq2seq-подхода с механизмом внимания. Помните проблему с потерей контекста в нашей ранней параметрике? Если нет нормального контекста, то нет и нормальной интонации в речи. Решение пришло из машинного перевода. Дело в том, что в машинном переводе как раз возникает проблема глобального контекста — смысл слов в разных языках может задаваться разным порядком или вообще разными структурами, поэтому порой для корректного перевода предложения нужно увидеть его целиком. Для решения этой задачи исследователи предложили механизм внимания — идея в том, чтобы рассмотреть всё предложение разом, но сфокусироваться через softmax-слой на небольшом числе «важных» токенов. При генерации каждого нового выходного токена нейросеть смотрит на обработанные токены фонемы для речевого синтеза или символы языка для перевода входа и «решает», насколько каждый из них важен на этом шаге. Оценив важность, сеть учитывает её при агрегировании результатов и получает информацию для генерации очередного токена выхода. Таким образом нейросеть может заглянуть в любой элемент входа на любом шаге и при этом не перегружается информацией, поскольку фокусируется на небольшом количестве входных токенов. Для синтеза важна подобная глобальность, так как интонация сама по себе глобальна и нужно «видеть» всё предложение, чтобы правильно его проинтонировать. На тот момент для синтеза была хорошая seq2seq-архитектура Tacotron 2 — она и легла в основу нашей акустической модели. Мел-спектрограмма Параметрическое пространство можно сжать разными способами. Более сжатые представления лучше работают с примитивными акустическими моделями и вокодерами — там меньше возможностей для ошибок. Более полные представления позволяют лучше восстановить wav, но их генерация — сложная задача для акустической модели. Кроме того, восстановление из таких представлений у детерминированных вокодеров не очень качественное из-за их нестабильности. С появлением нейросетевых вокодеров сложность промежуточного пространства стала расти и сейчас в индустрии одним из стандартов стала мел-спектрограмма. Она отличается от обычного распределения частоты звука по времени тем, что частоты переводятся в особую мел-частоту звука. Другими словами, мел-спектрограмма — это спектрограмма, в которой частота звука выражена в мелах , а не герцах. Мелы пришли из музыкальной акустики, а их название — это просто сокращение слова «мелодия». Строение улитки уха из Википедии Эта шкала не линейная и основана на том, что человеческое ухо по-разному воспринимает звук различной частоты. Вспомните строение улитки в ухе: это просто канал, закрученный по спирали. Высокочастотный звук не может «повернуть» по спирали, поэтому воспринимается достаточно короткой частью слуховых рецепторов. Низкочастотный же звук проходит вглубь. Поэтому люди хорошо различают низкочастотные звуки, но высокочастотные сливаются. Мел-спектрограмма как раз позволяет представить звук, акцентируясь на той части спектра, которая значимо различается слухом. Это полезно, потому что мы генерируем звук именно для человека, а не для машины. Вот как выглядит мел-спектрограмма синтеза текста «Я — Алиса»: У мел-спектрограммы по одному измерению [X на рисунке выше] — время, по другому [Y] — частота, а значение [яркость на рисунке] — мощность сигнала на заданной частоте в определенный момент времени. Проще говоря, эта штуковина показывает, какое распределение по мощностям было у различных частот звука в конкретный момент. Мел-спектрограмма непрерывна, то есть с ней можно работать как с изображением. А так звучит результат синтеза: 3. Новый вокодер Вероятно, вы уже догадались, что мы перешли к использованию нового нейросетевого вокодера. Именно он в реальном времени превращает мел-спектрограмму в голос. Наиболее близкий аналог нашего первого решения на основе нейросетей, которое вышло в 2018 году — модель WaveGlow. Архитектура WaveGlow основана на генеративных потоках — довольно изящном методе создания генеративных сетей, впервые предложенном в статье про генерацию лиц. Сеть обучается конвертировать случайный шум и мел-спектрограмму на входе в осмысленный wav-сэмпл. За счёт случайного шума на входе обеспечивается выбор случайной wav-ки — одной из множества соответствующих мел-спектрограмме. Как я объяснил выше, в домене речи такой случайный выбор будет лучше детерминированного среднего по всем возможным wav-кам. В отличие от WaveNet, WaveGlow не авторегрессионен, то есть не требует для генерации нового wav-сэмпла знания предыдущих. Его параллельная свёрточная архитектура хорошо ложится на вычислительную модель видеокарты, позволяя за одну секунду работы генерировать несколько сотен секунд звука. Главное отличие, за счёт которого HiFi-GAN обеспечивает гораздо лучшее качество, заключается в наборе подсетей-дискриминаторов. Они валидируют натуральность звука, смотря на сэмплы с различными периодами и на различном масштабе. Как и WaveGlow, HiFi-GAN не имеет авторегрессионной зависимости и хорошо параллелится, при этом новая сеть намного легковеснее, что позволило при реализации ещё больше повысить скорость синтеза. Кроме того, оказалось, что HiFi-GAN лучше работает на экспрессивной речи, что в дальнейшем позволило запустить эмоциональный синтез — об этом подробно расскажу чуть позже. Схема HiFi-GAN из статьи авторов модели Комбинация этих трёх компонентов позволила вернуться к параметрическому синтезу голоса, который звучал плавно и качественно, требовал меньше данных и давал больше возможностей в кастомизации и изменении стиля голоса. Параллельно мы работали над улучшением отдельных элементов синтеза: Летом 2019 года выкатили разрешатор омографов homograph resolver — он научил Алису правильно ставить ударения в парах «зАмок» и «замОк», «белкИ» и «бЕлки» и так далее. Здесь мы нашли остроумное решение. В русском языке эти слова пишутся одинаково, но в английском написание отличается, например, castle и lock, proteins и squirrels. Из этого представления легко выделить информацию о том, как произносить омограф, ведь перевод должен различать формы для корректного подбора английского варианта. Буквально на 20 примерах можно выучить классификатор для нового омографа, чтобы по эмбеддингу перевода понимать, какую форму нужно произнести. Летом 2020 года допилили паузер для расстановки пауз внутри предложения. Язык — хитрая штука. Не все знаки препинания в речи выражаются паузами Например, после вводного слова «конечно» на письме мы ставим запятую, но в речи обычно не делаем паузу. А там, где знаков препинания нет, мы часто делаем паузы. Если эту информацию не передавать в акустическую модель, то она пытается её выводить и не всегда успешно. Первая модель Алисы из-за этого могла начать вздыхать в случайных местах длинного предложения. Для этого мы взяли датасет, разметили его детектором активности голоса, сгруппировали паузы по длительности, ввели класс длины паузы, на каждое слово навесили тэг и на этом корпусе обучили ещё одну голову внимания из тех же нейросетевых эмбеддингов, что использовались для детекции омографов.
Как настроить новости в Алисе
- Утреннее шоу «Алисы» стало персональным
- Что умеет «Яндекс-станция»: 17 полезных функций и команд для Алисы
- Утреннее шоу Алисы – получайте новости и полезную информацию каждое утро
- Новости — подборка навыков Алисы, голосового помощника от Яндекса.
- Место под большое лого и рекламу навыков
Утреннее шоу Алисы – получайте новости и полезную информацию каждое утро
Утреннее шоу Алисы теперь можно настроить на свой вкус. Для этого пользователь может сам выбрать тематику новостей и подкастов. В умных колонках с Алисой появилось персональное утреннее шоу: теперь можно слушать полезную информацию и музыку, подобранную специально для слушателя. В этой статье мы рассмотрим, что такое утреннее шоу от Алисы, как включить его на Яндекс Станции и как настроить. Навык «Утреннее шоу» Алисы идеально подходит для людей, которые хотят быть в курсе всех новостей и интересных мероприятий. Умная лампочка Яндекс с Алисой, цоколь E27, белая (YNDX-00501).
«Яндекс» научил «Алису» вести персональное утреннее шоу
Голосовой помощник «Алиса» научили проводить утренние шоу, которые подстраиваются под определённого пользователя. Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей. Настройте Утреннее шоу для себя: выберите источники новостей, подкасты и даже гороскоп Зайдите в приложение Яндекс и выберите «Устройства»; Нажмите на вкладку «Настройки»; Выберите «Шоу Алисы». «Алиса» научилась персонализировать «Утреннее шоу». Настройка частоты получения новостей позволит вам сделать использование навыка Алисы более удобным и эффективным, подстроив его под ваш ритм жизни. Кроме того, в голосовом помощнике появились новости радиостанций. Утреннее шоу — это развлекательная программа, где «Алиса» выступает в роли ведущей.
8 новых фишек «Яндекс Станций» и «Яндекс ТВ Станций», которые появились в апреле
Как включить новости в Яндекс Браузере. Покупайте, слушайте утреннее шоу алисы, оно 3 часа или почти 4 часа. «Алиса» научилась персонализировать «Утреннее шоу» и включать новости радиостанций Вслед за появлением интерактивных рецептов голосовой помощник «Алиса». «Алиса» научилась персонализировать «Утреннее шоу». Настройка частоты получения новостей позволит вам сделать использование навыка Алисы более удобным и эффективным, подстроив его под ваш ритм жизни. В Алису от Яндекса добавили функцию Утреннее шоу.