Dolby Digital

Материал из Википедии — свободной энциклопедии

Перейти к: навигация, поиск
Киноплёнка с цифровым и аналоговым звуком
Слева на право: Sony Dynamic Digital Sound (SDDS); Dolby Digital (между отверстий перфорации); аналоговый оптический; метки (DTS).

Dolby Digital (AC-3, ATSC A/52) (До́лби Ди́джитал) — система пространственного звуковоспроизведения, разработанная фирмой «Dolby Laboratories, Inc.» («Dolby Labs»), руководимой Реем Долби, пионером аудио- и видеопромышленности.

Формат стандартизирован Advanced Television Systems Committee, ему присвоен код A/52, Dolby Digital (DD) является торговой маркой.

Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.

В киноиндустрии звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе что и фильм позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных, а так же обеспечивает абсолютную синхронность изображения и звука.

Кодер системы Dolby AC-3.

Цифровой поток на выходе кодера представляет собой последовательность аудиофреймов (Pack AC-3 Frame). Содержащаяся в нём информация условно может быть разделена на две части: основную (Main Information) и дополнительную (Side Information).

Аудиофрейм кодера включает шесть аудиоблоков. Каждый аудиоблок содержит информацию о 512 отсчётах для каждого из кодируемых сигналов (Audio 1, Audio 2, ..., Audio n). Вследствие 50% временного перекрытия в аудиоблок для каждого из сигналов включаются 256 отсчётов предыдущего блока и 256 новых отсчётов. В шести аудиоблоках аудиофрейма общее число обрабатываемых отсчётов для каждого из входных сигналов будет равно 512 × 6 = 3072. Заметим, что если число кодируемых звуковых сигналов равно 5 (формат 3/2), то общее число отсчётов, информация о которых содержится в одном аудиофрейме, составит (512 × 5) × 6 = 15360, однако с учётом 50% временного перекрытия здесь будет лишь 15360 ÷ 2 = 7680 новых отсчётов.

После сегментации по времени выборки отсчётов звуковой сигнал каждого канала преобразуется в новую совокупность цифровых данных посредством модифицированного дискретного косинусного преобразования (МДКП).Сегментация звуковых сигналов по времени с 50%-ным перекрытием выборок и их преобразование из временной в частотную область выполняются в блоке время-частотного преобразования (Frequency Domain Transform). Перед ортоганальным преобразованием выборки отсчётов звуковых сигналов взвешиваются оконной функцией. Последняя представлена в стандарте А/52 таблицей.

Преобразование выборки звукового сигнала из временной области может быть выполнено посредством одного длинного (512-точечного) или двух коротких (256-точечных) преобразований. В первом случае будет получено 256, а во втором — соответственно 128 + 128 коэффициентов МДКП. При короткой выборке коэффициенты МДКП обеих сегментов, содержащие по 128 значений, объединяются в один общий блок путём их чередования. В этом общем блоке будут также 256 коэффициентов МДКП.

Длинное преобразование наиболее предпочтительно для сигналов, медленно изменяющихся по амплитуде с течением времени. Оно имеет лучшее разрешение по частоте. Короткое преобразование обеспечивает лучшее разрешение по времени и применяется для сигналов, амплитуды которых быстро меняются во времени, например в области атаки звука. Флаг Block Switch Flags(blksw flags) указывает, какое преобразование (длинное или короткое) применено при расчёте коэффициентов МДКП. Параметр Block Switch Flags включается в выходной поток цифровых данных как дополнительная информация и используется декодером при выполнении обратного ортогонального преобразования.

При малых скоростях передачи цифровых данных в кодере Dolby AC-3 предусмотрено использование специальной процедуры объединения канальных сигналов (Coupling), позволяющей при их кодировании обойтись меньшим числом битов.

В системе Dolby AC-3 каждый коэффициент МДКП представляется в формате с плавающей запятой двумя значениями: экспонентой (или порядком) и мантиссой: Xd[k] = A[k] × 2^-B[k],

где A[k] и B[k] — соответственно мантисса и порядок k-го коэффициента преобразования. Порядок равен числу нулей перед первой единицей двоичного представления коэффициента МДКП. Он является по сути дела его масштабным коэффициентом (или нормирующим множителем). Например, если коэффициент МДКП Xd[k] = 0,158 и его двоичное представление записывается как 0,001010000110, то порядок (масштабного коэффициента) B[k] = 2, а мантисса равна 0,1010000110 в двоичной или A[k] = 0,6308 в десятичной системах исчисления. Знак коэффициента МДКП учитывается при кодировании мантиссы. Перед кодированием мантисы нормируются (Normalize Mantissas). Экспоненты и мантиссы коэффициентов МДКП кодируются отдельно в блоках Encode Exponent и Quantisse, Encode Mantissas.

В блоке распределения битов (Bit Allocation) учитывается эффект маскировки. В основе процедуры выделения битов лежит модель слуха, позволяющая оценить максимально допустимое (пороговое) значение уровня шума, который ещё маскируется полезным сигналом в полосе кодирования, и в соответствии с данными этих расчетов выделить при кодировании мантисс коэффициентов МДКП соответствующее число разрядов. Все указанные вычисления выполняются в блоке, называемом обычно психоакустической моделью. Каждая нормированная мантисса квантуется с числом ступеней квантования, соответствующим числу битов, определённому в модуле Bit Allocation.

Порядок кодирования коэффициента МДКП в кодере Dolby AC-3 представляет собой число, изменяющееся в пределах от 0 до 24. Поэтому кодовое слово порядка должно иметь по крайней мере m = 5 разрядов (2^5 = 32). Максимальный порядок в кодере ограничивается значением 24.

Известно,что если спектр выборки звукового сигнала анализируется при помощи банка фильтров,каждый из которых имеет достаточно узкую полосу частот,то разница в уровнях энергии сигнала между соседними фильтрами редко превышает значение 12 dB.Это обстоятельство учтено при кодировании порядков.При кодировании порядков в кодере системы Dolby AC-3 применён метод дифференциальной импульсно-кодовой модуляции,когда кодируется не сам порядок,а разность между значениями порядков соседних коэффициентов МДКП.Первое значение порядка для сигнала каждого канала в самой первой наиболее низкой по частоте полосе анализа - это всегда четырёхбитовое кодовое слово,что соответствует диапазону изменения чисел от 0 до15.Порядок в следующей вверх по частоте полосе анализа определяется как разница между текущим и предыдущим значениями порядков соответствующих коэффициентов МДКП.В кодере Dolby AC-3 разрешающая способность дифференциальной импульсно-кодовой модуляции (дискретность изменения порядков) при кодировании ограничена значениями -2, -1, 0, +1, +2.Максимальное изменение порядков соседних коэффициентов МДКП составляет ± 2,что соответствует ± 12 dB.

Дифференциальное значение порядков коэффициентов МДКП объединяются в группы.Для процедуры группирования используются три возможных стратегии,обозначенные в стандарте как D15,D25 и D45.В стратегии D15 каждая пара,а в стратегии D45 уже каждая четвёрка дифференциальных значений порядков представлены одним значением числа M в потоке цифровых данных.

Дифференциальные значения порядков,полученные непосредственно из исходных коэффициентов МДКП,на практике не всегда дают максимальную разность соседних коэффициентов ,не превышающую диапазон ± 2,что требуют соответствующие таблицы стандарта Dolby AC-3.Поэтому перед кодированием необходима дополнительная обработка массива порядков.С её помощью уменьшаются некоторые значения порядков,но при этом изменяются и соответствующие им значения мантисс так,что в их двоичном представлении впереди появляются нули.После выполнения этой операции максимальный дифференциальный порядок уже не будет превышать требуемое значение,равное ± 2.

Выбор стратегии (D15,D25 или D45) кодирования порядков коэффициентов МДКП - это компромисс между хорошим частотным разрешением,разрешением по времени и числом битов,требуемым для кодирования экспонент.Стратегии D15 и D25 могут быть использованы для кодирования сигналов,имеющих неравномерный спектр,когда значение зкспоненты изменяется довольно быстро от одной полосы анализа к другой.Если же спектр сигнала достаточно гладкий (плоский),тогда используются стратегии кодирования D45.

После выбора стратегии кодирования порядков кодер Dolby AC-3 объединяет кодовые слова,соответствующие дифференциальным значениям экспонент,в группы.Для всех режимов работы кодера наборы чисел M для трёх соседних (k, k + 1, k + 2) коэффициентов МДКП M[k], M[k + 1], M[k + 2] группируются и кодируются как одно семибитовое слово по правилу:

                                 M[k, k+1,k+2] = {25M[k]} + {5M[k + 1]} + M[k + 2].

Диапазон изменения мантисс коэффициентов МДКП лежит в пределах от -1 до +1.Знак коэффициента МДКП учитывается при кодировании мантиссы.Процесс квантования мантисс коэффициентов МДКП в стандарте Dolby AC-3 имеет следующие особенности:

•число возможных ступеней квантования соответствует следующему ряду чисел:0,3,5,7,11,15,32,64,128,256,512,1024,2048,4096, 16384,65536; используется равномерное квантование мантисс;

•при числе ступеней квантования,равном 3, 5, 7, 11 и 15,используется так называемое симметричное квантование,во всех остальных случаях - асимметричное;

•при числе ступеней квантования,равном 3, 5 и 11,кодовые слова мантисс объединяются в группы.При трёх ступенях квантования три кодовых слова,соответствующие трём значениям мантисс,кодируются одним пятибитовым кодовым словом.При пяти ступнях квантования три кодовых слова мантисс группируются и кодируются одним семибитовым кодовым словом.При 11 ступенях квантования два кодовых слова мантисс группируются и кодируются одним семибитовым кодовым словом; в остальных случаях процедуры группирования нет.

При симметричном квантовании вместо квантованных значений мантисс в цифровой поток включены их индексы,заданные соответствующей таблицей.Например,если число ступеней квантования равно 3,а значение мантиссы лежит в пределах от -1 до -1/3, то передаваться к декодеру будет значение,равное -2/3,и ему будет соответствовать индекс mc = 0.Если значение мантиссы лежит в интервале от -1/3 до +1/3,то декодеру передаётся значение,равное нулю,и кодируется индекс mc = 1.И наконец, если значение мантиссы находится в интервале от +1/3 до +1, то декодеру передаётся значение,равное +2/3,и кодируется соответствующий ему табличный индекс mc = 2.Аналогичным образом в форме таблиц задаются интервалы значений мантисс и соответствующие им индексы для числа ступеней квантования равных соответственно 5, 7, 11 и 15.Такой способ квантования позволяет уменьшить число требуемых битов.Для всех других ступеней квантования (32, 64,..., 65536) кодируются не индексы, а сами мантиссы коэффициентов МДКП.

Следующим этапом является кодирование и упаковка в цифровой поток табличных индексов квантованных значений мантисс.При симметричном квантовании для уменьшения требуемого для кодирования индексов числа битов используется дополнительно процедура групирования.Например,при числе ступеней квантования,равном 7,индекс мантиссы изменяется в пределах от 0 до 6.Для кодирования этого ряда чисел требуется 3 бита.При 11 ступенях квантования табличный индекс мантисс лежит в интервале от 0 до 10,а при 15 ступенях квантования он находится уже в интервале от 0 до 14.При этом требуемое для кодирования каждого из них число битов соответственно равно 4 или 5.Группирование табличных индексов позволяет уменьшить требуемое для их кодирования число битов при 3, 5 и 11 ступенях квантования.При 3 и 5 ступенях квантования три табличных индекса мантисс,а при 11 ступеняхквантования два табличных индекса мантисс кодируются одним кодовым словом по следующим правилам:

                                       Group_code[3] = 9mc[a] + 3mc[b] + mc[c];
                                       Group_code[5] = 25mc[a] + 5mc[b] + mc[c];
                                       Group_code[11] = 11mc[a] + mc[b],

где Group_code[3],Group_code[5] и Group_code[11] - кодовые слова групп табличных индексов мантисс соответственно при 3, 5, 11 ступенях квантования;mc[a],mc[b],mc[c] - табличные индексы мантисс коэффициентов МДКП с номерами a, b и c.Итак при трёх ступенях квантования мантисс (n = 3) кодовое слово группы,состоящей из трёх индексов,будет содержать 5 битов,поэтому на кодирование каждой мантиссы в этом случае будет затрачено 5 ÷ 3 = 1,67 бита.При n = 5 кодовое слово группы мантисс будет представлено уже семибитовым числом,и на кодирование каждой мантиссы потребуется уже 7 ÷ 3 = 2,33 бита.И наконец,при n = 11 на кодирование каждой мантиссы потребуется уже 7 ÷ 2 = 3,5 бита,а при n = 15 - 4 бита и т.д.

В кодере определяется длина кодового слова каждой мантиссы или соответствующего ей табличного индекса,после чего мантиссы распаковываются по специальной процедуре.

При работе в режиме объединения звуковых сигналов кодер объеденяет высокочастотные части исходных сигналов в определённой полосе частот в один общий сигнал и генерирует дополнительно так называемые координаты объединения.Последние будут использованы декодером для восстановления энергетических соотношений высокочастотных частей спектра каждого исходного сигнала, подвергнутого процедуре объединения.После декодирования объединённые части в каждом из восстановленных сигналов будут иметь одинаковый спектральный состав и отличаться только уровнем.

Кодер формирует общий сигнал путём простого сложения коэффициентов МДКП объеденяемых сигналов.При этом коэффициенты МДКП с 37-го по 252-й группируются в 18 субполос (так называемых полос объединения) по 12 коэффициентов в каждой такой субполосе. Нижняя и верхняя частотные границы полос объединения задаются пользователем.Координаты объединния расчитываются для каждого объединения субполосного сигнала.Они представляют собой отношения максимальных коэффициентов МДКП каждого объединяемого сигнала и суммарного сигнала в субполосе объединения.Далее координаты объдинения преобразовываются в формат чисел с плавающей запятой и включаются в выходной поток данных как дополнительная информация.Суммарный (объеденённый) сигнал кодируется так же,как и сигнал независимых каналов.

Декодер системы Dolby AC-3

Декодер Dolby AC-3 получает порядки коэффициентов МДКП в кодированном и упакованном виде.Чтоы их распоковать и декодировать, необходимо иметь дополнительную информацию о числе передаваемых экспонент в сигнале каждого канала и о стратегии их кодирования (D15,D25,D45), использовавшейся в кодере.Процесс декодирования порядков осуществляется в блоке декодирования экспонент (Decode Exponent).После декодирования порядков выполняется процедура распаковки,деквантования и денормирования мантисс коэффициентов МДКП (Dequantize, Denormalize Mantissas).Для её выполнения используются параметры психоакустической модели,параметры,определяющие распределение битов в кодере,а также восстановление значения порядков коэффициентов МДКП. Операция денормирования мантисс производится посредством сдвигов разрядов кодового слова мантиссы вправо.При этом число сдвигов определяется порядком соответствующего коэффициента МДКП.Если в кодере была использована процедура объединения сигналов ряда каналов,то,очевидно ,декодер должен выполнить обратную операцию (De-Coupling), используя переданные декодеру в поле данных дополнительной информации значения координат объединения.В блоке обратного ортогонального МДКП (Inverse Transform) осуществляется обратное преобразование реконструированного в декодере сигнала во временную область.

SI BSI Audio Block 0 Audio Block 1 Audio Block 2 Audio Block 3 Audio Block 4 Audio Block 5 AUX Data CRC

Схема 1.Структура данных аудиофрейма системы Dolby AC-3.


Block Switch Flags Dither Flags Dynamic Range Control Coupling Strategy Coupling coordinates Exponent strategy Exponent Bit Allocation Parametrs Mantissas

Схема 2.Структура данных аудиоблока системы Dolby AC-3.


Стуктура аудиоданных в стандарте Dolby AC-3 показана на схеме 1.Поле данных заголовка (Header) аудиофрейма содержит информацию о синхронизации SI (Syncronizator Information) и информацию о конфигурации потока данных BSI (Bit Stream Information).

Поле данных SI вкючает синхрослово (0000 1011 0111 0111,или OB77h),биты помехоустойчивого кодирования (CRC - код),частоту дискретизации и размер аудиофрейма.Аудиофрейм системы Dolby AC-3 включает два 16-битовых слова CRC-кода,первое из них следует в начале каждого фрейма после слова синхронизации,а второе - в его конце.Поле данных BSI содержит информацию о конфигурации потока цифровых данных,например,такую,как тип сервиса,режим работы кодера (т.е. число кодируемых сигналов или тип звукового формата), абсолютный акустический уровень сигнала каждого канала,информацию о языке,о времени и другое.

Структура данных аудиоблока показана на схеме 2.Он включает в себя следующие поля битов: Block Switch Flags - параметр длины ортогонального преобразования; Dither Flags - признак наличия добавочного шума; Dynamic Range Control - данные упраавления динамическим диапазоном передаваемых сигналов; Coupling Strategy - информация об объединении сигналов (сигналы каких каналов объеденены и начиная с какой частоты); Coupling Coordinats - координаты объединения для сигнала каждого канала; Exponent Strategy - выбранная стратегия кодирования порядков; Exponents - кодовые слова порядков коэффициентов МДКП; Bit Allocation Parametrs - параметры психоакустической модели; Mantissas - кодовые слова мантисс коэффициентов МДКП.


Содержание

[править] Литература

1. Digital Audio compression Standart (AC-3)/Doc.A/52, 1995-12-20;

2. Электроакустика и звуковое вещание: учебное пособие для вузов/И. А. Алдошина, Э. И. Вологодин, А. П. Ефимов и др.;Под редакцией Ю. А Ковалгина. - М.:Горячая линия-Телеком,Радио и связь, 2007.- 872 с.:ил.

[править] Dolby Digital EX

EX — это приставка, использующаяся для обозначения систем звука Doldy Digital c 7.1 каналами: двух фронтальных, центрального, низкочастотного, двух тыловых объёмного звучания и двух фронтальных объёмного звучания.

[править] Dolby Digital Surround-EX

Dolby Digital Surround-EX добавляет звуковой дорожке третий канал объёмного звука. Идея принадлежит звукорежиссёрам студии Skywalker Sound. Технология разработана совместно с Dolby Laboratories и Lucasfilm THX.

[править] Dolby Digital Live

[править] Dolby Digital Plus

[править] Dolby TrueHD

[править] См. также

[править] Интересные факты


[править] Ссылки