Yandex.SpeechKit

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Yandex.SpeechKit
Yandex-speechkit.tech logo rgb2.png
Разработчик Яндекс
Языки интерфейса русский, турецкий, английский
Первый выпуск 2013
Сайт tech.yandex.ru/speechkit…
Commons-logo.svg Yandex.SpeechKit на Викискладе

Yandex.SpeechKit (произносится как Яндекс.СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].

Краткие сведения[править | править код]

Демонстрация новых возможностей СпичКита на YaC-2014

Разработками в области речевых технологий Яндекс занимается с 2012 года[2].

SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].

Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].

SpeechKit[3] используется в приложениях «Яндекс.Браузер», «Яндекс.Город», «Яндекс.Карты», «Яндекс.Навигатор» и ещё около 400 приложениях[4].

4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].

Возможности[править | править код]

Голосовая активация[править | править код]

Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].

Выделение смысловых объектов[править | править код]

Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].

Синтез речи[править | править код]

Преобразование текста в речь на базе скрытых марковских моделей[6].

Применение технологии[править | править код]

Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:

  • мультимедийная система голосового управления автомобилем, являющаяся конкурентом Car Play и Android Auto (подписаны контракты с «Камазом», «Toyota» и «Honda»)[8];
  • голосовой помощник «Алиса»[9];
  • перевод денежных средств голосом у Бинбанка[10];
  • автоматическое тегирование звонков впервые внедренное c Calltouch[11];
  • автоозвучка текстов (на сайте газеты «Известия»)[12].

Примечания[править | править код]

  1. 1 2 3 «Яндекс» разработал собственную технологию распознавания речи
  2. Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы
  3. 1 2 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация.. speechkit.yandex.ru. Дата обращения 29 сентября 2015.
  4. 1 2 3 4 5 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи
  5. 1 2 «Яндекс» распознает речь на iOS и Android
  6. 1 2 3 Право голоса
  7. Вести.net: синтез речи от «Яндекса» и плата за репосты
  8. «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины
  9. «Яндекс» выпустил голосового помощника «Алиса»
  10. Россияне смогут переводить деньги с помощью голосовых команд
  11. Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса»
  12. НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна

См. также[править | править код]

Ссылки[править | править код]

Sound.png Внешние аудиофайлы
Sound.png Железки начали понимать // Интернет-кафе «Соб@ка»
Sound.png Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы