Dolby Digital

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Киноплёнка с цифровым и аналоговым звуком
Слева направо: Sony Dynamic Digital Sound (SDDS); Dolby Digital (между отверстий перфорации); аналоговый оптический; метки (DTS).

Dolby Digital (AC-3, ATSC A/52) (До́лби Ди́джитал) — система цифрового многоканального звука для кинематографа, разработанная фирмой «Dolby Laboratories, Inc.» в 1991 году[1].

Формат стандартизирован Advanced Television Systems Committee, ему присвоен код A/52, Dolby Digital (DD) является торговой маркой.

Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.

Звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе, что и фильм, позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных, а также обеспечивает синхронность изображения и звука. В кинотеатрах системы IMAX звук записывается на отдельном жестком диске и синхронизируется с кинопленкой при помощи временно́го кода SMPTE.

Кодер системы Dolby AC-3[править | править вики-текст]

Цифровой поток на выходе кодера представляет собой последовательность аудиофреймов (Pack AC-3 Frame). Содержащаяся в нём информация условно может быть разделена на две части: основную (Main Information) и дополнительную (Side Information).

Аудиофрейм кодера включает шесть аудиоблоков. Каждый аудиоблок содержит информацию о 512 отсчётах для каждого из кодируемых сигналов (Audio 1, Audio 2, …, Audio n). Вследствие 50 % временного перекрытия в аудиоблок для каждого из сигналов включаются 256 отсчётов предыдущего блока и 256 новых отсчётов. В шести аудиоблоках аудиофрейма общее число обрабатываемых отсчётов для каждого из входных сигналов будет равно 512 × 6 = 3072. Заметим, что если число кодируемых звуковых сигналов равно 5 (формат 3/2), то общее число отсчётов, информация о которых содержится в одном аудиофрейме, составит (512 × 5) × 6 = 15360, однако с учётом 50 % временного перекрытия здесь будет лишь 15360 ÷ 2 = 7680 новых отсчётов.

После сегментации по времени выборки отсчётов звуковой сигнал каждого канала преобразуется в новую совокупность цифровых данных посредством модифицированного дискретного косинусного преобразования (МДКП). Сегментация звуковых сигналов по времени с 50%-ным перекрытием выборок и их преобразование из временной в частотную область выполняются в блоке время-частотного преобразования (Frequency Domain Transform). Перед ортогональным преобразованием выборки отсчётов звуковых сигналов взвешиваются оконной функцией. Последняя представлена в стандарте А/52 таблицей.

Преобразование выборки звукового сигнала из временной области может быть выполнено посредством одного длинного (512-точечного) или двух коротких (256-точечных) преобразований. В первом случае будет получено 256, а во втором — соответственно 128 + 128 коэффициентов МДКП. При короткой выборке коэффициенты МДКП обеих сегментов, содержащие по 128 значений, объединяются в один общий блок путём их чередования. В этом общем блоке будут также 256 коэффициентов МДКП.

Длинное преобразование наиболее предпочтительно для сигналов, медленно изменяющихся по амплитуде с течением времени. Оно имеет лучшее разрешение по частоте. Короткое преобразование обеспечивает лучшее разрешение по времени и применяется для сигналов, амплитуды которых быстро меняются во времени, например в области атаки звука. Флаг Block Switch Flags(blksw flags) указывает, какое преобразование (длинное или короткое) применено при расчёте коэффициентов МДКП. Параметр Block Switch Flags включается в выходной поток цифровых данных как дополнительная информация и используется декодером при выполнении обратного ортогонального преобразования.

При малых скоростях передачи цифровых данных в кодере Dolby AC-3 предусмотрено использование специальной процедуры объединения канальных сигналов (Coupling), позволяющей при их кодировании обойтись меньшим числом битов.

В системе Dolby AC-3 каждый коэффициент МДКП представляется в формате с плавающей запятой двумя значениями: экспонентой (или порядком) и мантиссой: Xd[k] = A[k] × 2-B[k], где A[k] и B[k] — соответственно мантисса и порядок k-го коэффициента преобразования. Порядок равен числу нулей перед первой единицей двоичного представления коэффициента МДКП. Он является по сути дела его масштабным коэффициентом (или нормирующим множителем). Например, если коэффициент МДКП Xd[k] = 0,158 и его двоичное представление записывается как 0,001010000110, то порядок (масштабного коэффициента) B[k] = 2, а мантисса равна 0,1010000110 в двоичной или A[k] = 0,6308 в десятичной системах исчисления. Знак коэффициента МДКП учитывается при кодировании мантиссы. Перед кодированием мантисы нормируются (Normalize Mantissas). Экспоненты и мантиссы коэффициентов МДКП кодируются отдельно в блоках Encode Exponent и Quantisse, Encode Mantissas.

В блоке распределения битов (Bit Allocation) учитывается эффект маскировки. В основе процедуры выделения битов лежит модель слуха, позволяющая оценить максимально допустимое (пороговое) значение уровня шума, который ещё маскируется полезным сигналом в полосе кодирования, и в соответствии с данными этих расчетов выделить при кодировании мантисс коэффициентов МДКП соответствующее число разрядов. Все указанные вычисления выполняются в блоке, называемом обычно психоакустической моделью. Каждая нормированная мантисса квантуется с числом ступеней квантования, соответствующим числу битов, определённому в модуле Bit Allocation.

Порядок кодирования коэффициента МДКП в кодере Dolby AC-3 представляет собой число, изменяющееся в пределах от 0 до 24. Поэтому кодовое слово порядка должно иметь по крайней мере m = 5 разрядов (25 = 32). Максимальный порядок в кодере ограничивается значением 24.

Известно, что если спектр выборки звукового сигнала анализируется при помощи банка фильтров, каждый из которых имеет достаточно узкую полосу частот, то разница в уровнях энергии сигнала между соседними фильтрами редко превышает значение 12 dB. Это обстоятельство учтено при кодировании порядков. При кодировании порядков в кодере системы Dolby AC-3 применён метод дифференциальной импульсно-кодовой модуляции, когда кодируется не сам порядок, а разность между значениями порядков соседних коэффициентов МДКП.Первое значение порядка для сигнала каждого канала в самой первой наиболее низкой по частоте полосе анализа — это всегда четырёхбитовое кодовое слово, что соответствует диапазону изменения чисел от 0 до 15. Порядок в следующей вверх по частоте полосе анализа определяется как разница между текущим и предыдущим значениями порядков соответствующих коэффициентов МДКП. В кодере Dolby AC-3 разрешающая способность дифференциальной импульсно-кодовой модуляции (дискретность изменения порядков) при кодировании ограничена значениями −2, −1, 0, +1, +2. Максимальное изменение порядков соседних коэффициентов МДКП составляет ± 2, что соответствует ± 12 dB.

Дифференциальное значение порядков коэффициентов МДКП объединяются в группы. Для процедуры группирования используются три возможных стратегии, обозначенные в стандарте как D15, D25 и D45. В стратегии D15 каждая пара, а в стратегии D45 уже каждая четвёрка дифференциальных значений порядков представлены одним значением числа M в потоке цифровых данных.

Дифференциальные значения порядков, полученные непосредственно из исходных коэффициентов МДКП, на практике не всегда дают максимальную разность соседних коэффициентов, не превышающую диапазон ± 2, что требуют соответствующие таблицы стандарта Dolby AC-3. Поэтому перед кодированием необходима дополнительная обработка массива порядков. С её помощью уменьшаются некоторые значения порядков, но при этом изменяются и соответствующие им значения мантисс так, что в их двоичном представлении впереди появляются нули. После выполнения этой операции максимальный дифференциальный порядок уже не будет превышать требуемое значение, равное ± 2.

Выбор стратегии (D15, D25 или D45) кодирования порядков коэффициентов МДКП — это компромисс между хорошим частотным разрешением, разрешением по времени и числом битов, требуемым для кодирования экспонент. Стратегии D15 и D25 могут быть использованы для кодирования сигналов, имеющих неравномерный спектр, когда значение зкспоненты изменяется довольно быстро от одной полосы анализа к другой. Если же спектр сигнала достаточно гладкий (плоский), тогда используются стратегии кодирования D45.

После выбора стратегии кодирования порядков кодер Dolby AC-3 объединяет кодовые слова, соответствующие дифференциальным значениям экспонент, в группы. Для всех режимов работы кодера наборы чисел M для трёх соседних (k, k + 1, k + 2) коэффициентов МДКП M[k], M[k + 1], M[k + 2] группируются и кодируются как одно семибитовое слово по правилу:

M[k, k+1,k+2] = {25M[k]} + {5M[k + 1]} + M[k + 2].

Диапазон изменения мантисс коэффициентов МДКП лежит в пределах от −1 до +1.Знак коэффициента МДКП учитывается при кодировании мантиссы. Процесс квантования мантисс коэффициентов МДКП в стандарте Dolby AC-3 имеет следующие особенности:

  • число возможных ступеней квантования соответствует следующему ряду чисел:0, 3, 5, 7, 11, 15, 32, 64, 128, 256, 512, 1024, 2048, 4096, 16384, 65536; используется равномерное квантование мантисс;
  • при числе ступеней квантования, равном 3, 5, 7, 11 и 15, используется так называемое симметричное квантование, во всех остальных случаях — асимметричное;
  • при числе ступеней квантования, равном 3, 5 и 11, кодовые слова мантисс объединяются в группы. При трёх ступенях квантования три кодовых слова, соответствующие трём значениям мантисс, кодируются одним пятибитовым кодовым словом. При пяти ступнях квантования три кодовых слова мантисс группируются и кодируются одним семибитовым кодовым словом. При 11 ступенях квантования два кодовых слова мантисс группируются и кодируются одним семибитовым кодовым словом; в остальных случаях процедуры группирования нет.

При симметричном квантовании вместо квантованных значений мантисс в цифровой поток включены их индексы, заданные соответствующей таблицей. Например, если число ступеней квантования равно 3, а значение мантиссы лежит в пределах от −1 до −1/3, то передаваться к декодеру будет значение, равное −2/3, и ему будет соответствовать индекс mc = 0. Если значение мантиссы лежит в интервале от −1/3 до +1/3, то декодеру передаётся значение, равное нулю, и кодируется индекс mc = 1. И наконец, если значение мантиссы находится в интервале от +1/3 до +1, то декодеру передаётся значение, равное +2/3, и кодируется соответствующий ему табличный индекс mc = 2. Аналогичным образом в форме таблиц задаются интервалы значений мантисс и соответствующие им индексы для числа ступеней квантования равных соответственно 5, 7, 11 и 15. Такой способ квантования позволяет уменьшить число требуемых битов. Для всех других ступеней квантования (32, 64, …, 65536) кодируются не индексы, а сами мантиссы коэффициентов МДКП.

Следующим этапом является кодирование и упаковка в цифровой поток табличных индексов квантованных значений мантисс. При симметричном квантовании для уменьшения требуемого для кодирования индексов числа битов используется дополнительно процедура групирования. Например, при числе ступеней квантования, равном 7, индекс мантиссы изменяется в пределах от 0 до 6. Для кодирования этого ряда чисел требуется 3 бита. При 11 ступенях квантования табличный индекс мантисс лежит в интервале от 0 до 10, а при 15 ступенях квантования он находится уже в интервале от 0 до 14. При этом требуемое для кодирования каждого из них число битов соответственно равно 4 или 5. Группирование табличных индексов позволяет уменьшить требуемое для их кодирования число битов при 3, 5 и 11 ступенях квантования. При 3 и 5 ступенях квантования три табличных индекса мантисс, а при 11 ступенях квантования два табличных индекса мантисс кодируются одним кодовым словом по следующим правилам:

                                       Group_code[3] = 9mc[a] + 3mc[b] + mc[c];
                                       Group_code[5] = 25mc[a] + 5mc[b] + mc[c];
                                       Group_code[11] = 11mc[a] + mc[b],

где Group_code[3], Group_code[5] и Group_code[11] — кодовые слова групп табличных индексов мантисс соответственно при 3, 5, 11 ступенях квантования; mc[a], mc[b], mc[c] — табличные индексы мантисс коэффициентов МДКП с номерами a, b и c. Итак при трёх ступенях квантования мантисс (n = 3) кодовое слово группы, состоящей из трёх индексов, будет содержать 5 битов, поэтому на кодирование каждой мантиссы в этом случае будет затрачено 5 ÷ 3 = 1,67 бита. При n = 5 кодовое слово группы мантисс будет представлено уже семибитовым числом, и на кодирование каждой мантиссы потребуется уже 7 ÷ 3 = 2,33 бита. И наконец, при n = 11 на кодирование каждой мантиссы потребуется уже 7 ÷ 2 = 3,5 бита, а при n = 15 — 4 бита и т. д.

В кодере определяется длина кодового слова каждой мантиссы или соответствующего ей табличного индекса, после чего мантиссы распаковываются по специальной процедуре.

При работе в режиме объединения звуковых сигналов кодер объединяет высокочастотные части исходных сигналов в определённой полосе частот в один общий сигнал и генерирует дополнительно так называемые координаты объединения. Последние будут использованы декодером для восстановления энергетических соотношений высокочастотных частей спектра каждого исходного сигнала, подвергнутого процедуре объединения. После декодирования объединённые части в каждом из восстановленных сигналов будут иметь одинаковый спектральный состав и отличаться только уровнем.

Кодер формирует общий сигнал путём простого сложения коэффициентов МДКП объединяемых сигналов. При этом коэффициенты МДКП с 37-го по 252-й группируются в 18 субполос (так называемых полос объединения) по 12 коэффициентов в каждой такой субполосе. Нижняя и верхняя частотные границы полос объединения задаются пользователем. Координаты объединния рассчитываются для каждого объединения субполосного сигнала. Они представляют собой отношения максимальных коэффициентов МДКП каждого объединяемого сигнала и суммарного сигнала в субполосе объединения. Далее координаты объдинения преобразовываются в формат чисел с плавающей запятой и включаются в выходной поток данных как дополнительная информация. Суммарный (объединённый) сигнал кодируется так же, как и сигнал независимых каналов.

Декодер системы Dolby AC-3[править | править вики-текст]

Декодер Dolby AC-3 получает порядки коэффициентов МДКП в кодированном и упакованном виде. Чтобы их распаковать и декодировать, необходимо иметь дополнительную информацию о числе передаваемых экспонент в сигнале каждого канала и о стратегии их кодирования (D15,D25,D45), использовавшейся в кодере. Процесс декодирования порядков осуществляется в блоке декодирования экспонент (Decode Exponent). После декодирования порядков выполняется процедура распаковки, деквантования и денормирования мантисс коэффициентов МДКП (Dequantize, Denormalize Mantissas). Для её выполнения используются параметры психоакустической модели, параметры, определяющие распределение битов в кодере, а также восстановление значения порядков коэффициентов МДКП. Операция денормирования мантисс производится посредством сдвигов разрядов кодового слова мантиссы вправо. При этом число сдвигов определяется порядком соответствующего коэффициента МДКП. Если в кодере была использована процедура объединения сигналов ряда каналов, то, очевидно, декодер должен выполнить обратную операцию (De-Coupling), используя переданные декодеру в поле данных дополнительной информации значения координат объединения. В блоке обратного ортогонального МДКП (Inverse Transform) осуществляется обратное преобразование реконструированного в декодере сигнала во временную область.

SI BSI Audio Block 0 Audio Block 1 Audio Block 2 Audio Block 3 Audio Block 4 Audio Block 5 AUX Data CRC

Схема 1.Структура данных аудиофрейма системы Dolby AC-3.


Block Switch Flags Dither Flags Dynamic Range Control Coupling Strategy Coupling coordinates Exponent strategy Exponent Bit Allocation Parametrs Mantissas

Схема 2.Структура данных аудиоблока системы Dolby AC-3.

Структура аудиоданных в стандарте Dolby AC-3 показана на схеме 1.Поле данных заголовка (Header) аудиофрейма содержит информацию о синхронизации SI (Syncronizator Information) и информацию о конфигурации потока данных BSI (Bit Stream Information).

Поле данных SI включает синхрослово (0000 1011 0111 0111,или OB77h), биты помехоустойчивого кодирования (CRC — код), частоту дискретизации и размер аудиофрейма. Аудиофрейм системы Dolby AC-3 включает два 16-битовых слова CRC-кода, первое из них следует в начале каждого фрейма после слова синхронизации, а второе — в его конце. Поле данных BSI содержит информацию о конфигурации потока цифровых данных, например, такую, как тип сервиса, режим работы кодера (то есть число кодируемых сигналов или тип звукового формата), абсолютный акустический уровень сигнала каждого канала, информацию о языке, о времени и другое.

Структура данных аудиоблока показана на схеме 2.Он включает в себя следующие поля битов: Block Switch Flags — параметр длины ортогонального преобразования; Dither Flags — признак наличия добавочного шума; Dynamic Range Control — данные управления динамическим диапазоном передаваемых сигналов; Coupling Strategy — информация об объединении сигналов (сигналы каких каналов объединены и начиная с какой частоты); Coupling Coordinats — координаты объединения для сигнала каждого канала; Exponent Strategy — выбранная стратегия кодирования порядков; Exponents — кодовые слова порядков коэффициентов МДКП; Bit Allocation Parametrs — параметры психоакустической модели; Mantissas — кодовые слова мантисс коэффициентов МДКП.

Технологии Dolby Digital[править | править вики-текст]

Dolby Digital EX[править | править вики-текст]

EX — это приставка, использующаяся для обозначения систем звука Dolby Digital c 5.1 каналами: двух фронтальных, центрального с расширением ещё на один или даже два, оппозитно расположенных, низкочастотного, и двух тыловых объёмного звучания.

Dolby Digital Surround-EX[править | править вики-текст]

L1 g dolbydsurroundex.gif

Dolby Digital Surround-EX добавляет ссобой дорожке третий канал объёмного звука. Идея принадлежит звукорежиссёрам студии Skywalker Sound. Технология разработана совместно с Dolby Laboratories и Lucasfilm THX.

Dolby Digital Live[править | править вики-текст]

Dolby Digital Live (DDL) — технология кодирования многоканального (5.1) аудиосигнала в формат AC3 в реальном времени, предложенная компанией Dolby Technologies. Предназначена для передачи многоканального звука из игр и иных приложений на ресивер по интерфейсу S/PDIF(оптическому или коаксиальному).

Её использование позволяет избавиться от ограничений, из-за которых по цифровым интерфейсам могли передаваться только уже готовые (то есть хранящиеся закодированными в формат AC3 или DTS) многоканальные дорожки, обычно являющиеся звуковым сопровождением фильмов), а в играх возможности цифрового выхода ограничивались обычным стереозвуком. (Для полноценного 5.1 в играх в таких случаях требуется трёхпроводное аналоговое подключение, если оно, конечно, возможно.)

Принципиальным и неустранимым недостатком технологии DDL является некая потеря качества звука от сжатия его в AC3 формат(сравнимая с переходом от CD-Audio к mp3 с высоким битрейтом) что, однако совершенно некритично для основного предполагаемого её применения.

В настоящее время эта технология встречается преимущественно в материнских платах, оснащённых кодеками Realtek ALC882D, ALC888DD и ALC888H, а также с некоторыми кодеками C-Media. Такие платы можно найти по фразам «AC3 Encode» или собственно «Dolby Digital Live» в описаниях товара.

Также эта технология начинает внедряться в ноутбуки, где в условиях дефицита места для «лишних» аналоговых разъёмов сулит наибольшие преимущества — один разъём позволит получить полноценный 5.1 звук во всех приложениях при условии подключения ноутбука к ресиверу или набору активных колонок со встроенным декодером.

Из отдельных звуковых карт с поддержкой этой технологии стоит отметить Terratec Aureon 7.1, а в популярных звуковых картах семейства Creative X-Fi поддержка DDL отсутствует, но (по неофициальной информации) в будущем не исключено её введение задним числом при выходе новой версии драйверов.


На 2010 год из семейства Creative X-Fi можно выделить следующие модели с поддержкой этой технологии: CREATIVE X-Fi Titanium 7.1, CREATIVE X-Fi Titanium Fatal1ty Pro 7.1, CREATIVE X-Fi Titanium Fatal1ty Champion 7.1

Dolby Digital Plus[править | править вики-текст]

Детище компаний MIPS Technologies и Dolby Laboratories.

Особенности:

  • Многоканальный звук с независимыми каналами
  • Поддерживается до 7.1 каналов* и возможность наличия нескольких аудио программ в одном потоке
  • Вывод потока Dolby Digital для совместимости со старыми устройствами
  • Максимальная скорость потока до 6 Mbps
  • Битрейт от 3 Mbps на HD DVD и до 1.7 Mbps на Blu-ray Disc
  • Поддерживается HDMI
  • В одном потоке может содержатся материал на разных языках
  • Новые возможности при кодировании для аудио профессионалов
  • Сохранение высокого качества на более эффективных для радиовещания скоростях передачи данных (200 Kbps для 5.1 каналов)

' Dolby Digital Plus поддерживает больше 8 аудио каналов. Стандарты HD DVD и Blu-ray Disc сейчас ограничивают это число до 8.

Dolby TrueHD[править | править вики-текст]

Dolby TrueHD является форматом звука сжатого без потерь по алгоритму Meridian Lossless Packing (MLP). Характеристики звука, сжатого по стандарту:

  • до 14 каналов из потока, хотя чаще всего сегодня используются в фильмах на Blu-ray дисках: 6 (5.1) каналов и максимум 8 (7.1), а поддерживается воспроизведения со стороны AV-ресиверах — 8 каналов (7.1);
  • разрядность до 24 бит и частота дискретизации 192 кГц (что и для носителя Blu-ray — 18 Мбит/с), хотя для фильмов на Blu-ray распространено до 8 каналов с 24 бит и 96 кГц при сжатии до потока при сжатии 63 Мбит/с или — 6 каналов с 24 бит и 192 кГц при сжатого потока до 18 Мбит/с[2].

Технологии Dolby на оптических носителях[править | править вики-текст]

HD DVD Blu-ray Disc DVD-Video DVD-Audio Лазердиск
Кодек Аппаратная поддержка Число каналов (макс.) Макс. скорость потока Аппаратная поддержка Число каналов (макс.) Макс. скорость потока Аппаратная поддержка Число каналов (макс.) Макс. скорость потока Аппаратная поддержка Число каналов (макс.) Макс. скорость потока Аппаратная поддержка Число каналов (макс.) Макс. скорость потока
Dolby Digital Обязательно 5.1 504 кбит/с Обязательно 5.1 640 кбит/с Обязательно 5.1 448 кбит/с Дополнительно в видеочасти для совместимости с обычными DVD-плеерами 5.1 448 кбит/с Дополнительно 5.1 384 kbit/s
Dolby Digital Plus 7.1 3 Мбит/с Дополнительно 7.1 1.7 Мбит/с
Не используется
Dolby TrueHD 8 18 Мбит/с 8 18 Мбит/с

Интересные факты[править | править вики-текст]

См. также[править | править вики-текст]

Примечания[править | править вики-текст]


Литература[править | править вики-текст]

  • Д. Г. Чекалин О многоканальном звуковоспроизведении (рус.) // «Мир техники кино» : журнал. — 2008. — № 8. — С. 14—19.
  • Digital Audio compression Standart (AC-3)/Doc.A/52, 1995-12-20
  • И. А. Алдошина, Э. И. Вологодин, А. П. Ефимов и др. Электроакустика и звуковое вещание: учебное пособие для вузов / Под редакцией Ю. А. Ковалгина. — М.: Горячая линия-Телеком, Радио и связь, 2007. — 872 с.:ил.

Ссылки[править | править вики-текст]