Speech Synthesis Markup Language

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Speech Synthesis Markup Language (SSML) (Язык Разметки Синтеза Речи) - представляет собой основанный на XML язык разметки для приложений синтеза речи[1]. Он был рекомендован рабочей группой W3C[2]. SSML часто встраивается в сценарии VoiceXML для интерактивных систем телефонии[3]. Однако, это также может быть использовано независимо от телефонии, например для создания аудио книг.

SSML основан на языке разметки Java Synthesis Markup Language (JSML), разработанном Sun Microsystems, хотя нынешние рекомендации были разработаны главным образом производителями синтезаторов речи. Он охватывает практически все аспекты синтеза речи, хотя в некоторых областях остались неопределенные аспекты, поэтому каждый производитель принимает иной вариант языка[4]. Кроме того, в отсутствие разметки, синтезатор, как ожидается, должен выполнить свое собственное толкование этого текста. Так SSML не является таким жестким в плане синтаксиса, как язык C, или даже HTML.

Пример[править | править исходный текст]

Вот пример документа SSML:

<?xml version="1.0"?>
<speak xmlns="http://www.w3.org/2001/10/synthesis"
       xmlns:dc="http://purl.org/dc/elements/1.1/"
       version="1.0">
  <metadata>
    <dc:title xml:lang="en">Telephone Menu: Level 1</dc:title>
  </metadata>
 
  <p>
    <s xml:lang="en-US">
      <voice name="David" gender="male" age="25">
        For English, press <emphasis>one</emphasis>.
      </voice>
    </s>
    <s xml:lang="es-MX">
      <voice name="Miguel" gender="male" age="25">
        Para español, oprima el <emphasis>dos</emphasis>.
      </voice>
    </s>
  </p>
 
</speak>

Примечания[править | править исходный текст]