Yandex SpeechKit
Yandex.SpeechKit | |
---|---|
Разработчик | Яндекс |
Языки интерфейса | русский, турецкий, английский |
Первый выпуск | 2013 |
Сайт | tech.yandex.ru/speechkit… |
Медиафайлы на Викискладе |
Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].
Краткие сведения
[править | править код]Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].
SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].
Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].
SpeechKit[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях[4].
4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].
Возможности
[править | править код]Голосовая активация
[править | править код]Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].
Выделение смысловых объектов
[править | править код]Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].
Синтез речи
[править | править код]Преобразование текста в речь на базе скрытых марковских моделей[6].
Применение технологии
[править | править код]Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:
- Персональный помощник «Алиса»[8];
- Мультимедийная система голосового управления автомобилем, являющаяся конкурентом Car Play и Android Auto (подписаны контракты с «КАМАЗом», «Toyota» и «Honda»)[9];
- Перевод денежных средств голосом у Бинбанка[10];
- Автоматическое тегирование звонков, впервые внедренное c Calltouch[11];
- Автоозвучка текстов (на сайте газеты «Известия»)[12].
Примечания
[править | править код]- ↑ 1 2 3 «Яндекс» разработал собственную технологию распознавания речи . Дата обращения: 30 декабря 2013. Архивировано 30 декабря 2013 года.
- ↑ Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Архивная копия от 29 апреля 2015 на Wayback Machine // радио Эхо Москвы
- ↑ 1 2 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация. speechkit.yandex.ru. Дата обращения: 29 сентября 2015.
- ↑ 1 2 3 4 5 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи . Дата обращения: 4 августа 2014. Архивировано из оригинала 6 августа 2014 года.
- ↑ 1 2 «Яндекс» распознает речь на iOS и Android . Дата обращения: 30 декабря 2013. Архивировано 1 января 2014 года.
- ↑ 1 2 3 Право голоса . Дата обращения: 31 октября 2014. Архивировано из оригинала 14 сентября 2015 года.
- ↑ Вести.net: синтез речи от «Яндекса» и плата за репосты. Дата обращения: 13 сентября 2016. Архивировано 10 мая 2017 года.
- ↑ «Яндекс» выпустил голосового помощника «Алиса». Дата обращения: 30 октября 2017. Архивировано 21 июня 2018 года.
- ↑ «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины. Дата обращения: 30 октября 2017. Архивировано 20 октября 2020 года.
- ↑ Россияне смогут переводить деньги с помощью голосовых команд. Дата обращения: 30 октября 2017. Архивировано 7 августа 2020 года.
- ↑ Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса». Дата обращения: 30 октября 2017. Архивировано 29 октября 2021 года.
- ↑ НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна. Дата обращения: 30 октября 2017. Архивировано 7 ноября 2017 года.