Yandex SpeechKit

Материал из Википедии — свободной энциклопедии
(перенаправлено с «Yandex.SpeechKit»)
Перейти к навигации Перейти к поиску
Yandex.SpeechKit
Логотип программы Yandex.SpeechKit
Скриншот программы Yandex.SpeechKit
Разработчик Яндекс
Языки интерфейса русский, турецкий, английский
Первый выпуск 2013
Сайт tech.yandex.ru/speechkit…
Логотип Викисклада Медиафайлы на Викискладе

Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].

Краткие сведения

[править | править код]
Демонстрация новых возможностей СпичКита на YaC-2014

Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].

SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].

Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].

SpeechKit[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях[4].

4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].

Возможности

[править | править код]

Голосовая активация

[править | править код]

Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].

Выделение смысловых объектов

[править | править код]

Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].

Синтез речи

[править | править код]

Преобразование текста в речь на базе скрытых марковских моделей[6].

Применение технологии

[править | править код]

Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:

Примечания

[править | править код]
  1. 1 2 3 «Яндекс» разработал собственную технологию распознавания речи. Дата обращения: 30 декабря 2013. Архивировано 30 декабря 2013 года.
  2. Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Архивная копия от 29 апреля 2015 на Wayback Machine // радио Эхо Москвы
  3. 1 2 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация. speechkit.yandex.ru. Дата обращения: 29 сентября 2015.
  4. 1 2 3 4 5 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи. Дата обращения: 4 августа 2014. Архивировано из оригинала 6 августа 2014 года.
  5. 1 2 «Яндекс» распознает речь на iOS и Android. Дата обращения: 30 декабря 2013. Архивировано 1 января 2014 года.
  6. 1 2 3 Право голоса. Дата обращения: 31 октября 2014. Архивировано из оригинала 14 сентября 2015 года.
  7. Вести.net: синтез речи от «Яндекса» и плата за репосты. Дата обращения: 13 сентября 2016. Архивировано 10 мая 2017 года.
  8. «Яндекс» выпустил голосового помощника «Алиса». Дата обращения: 30 октября 2017. Архивировано 21 июня 2018 года.
  9. «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины. Дата обращения: 30 октября 2017. Архивировано 20 октября 2020 года.
  10. Россияне смогут переводить деньги с помощью голосовых команд. Дата обращения: 30 октября 2017. Архивировано 7 августа 2020 года.
  11. Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса». Дата обращения: 30 октября 2017. Архивировано 29 октября 2021 года.
  12. НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна. Дата обращения: 30 октября 2017. Архивировано 7 ноября 2017 года.
Внешние аудиофайлы
Железки начали понимать // Интернет-кафе «Соб@ка»
Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы