Цветовая субдискретизация

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Цветовая субдискретизация (англ. Chroma subsampling) — технология кодирования изображений со снижением цветового разрешения, при которой частота выборки цветоразностных сигналов может быть меньше частоты выборки яркостного сигнала. Основана на особенности человеческого зрения, выраженной большей чувствительностью к перепадам яркости, чем цвета. Цветовая субдискретизация является важным способом снижения скорости цифрового потока видеоданных (цифровое сжатие видеоинформации). Используется в системах аналогового и цифрового телевидения, цифровой видеозаписи и алгоритмах сжатия изображений, таких как JPEG.

На практике кодирование изображений осуществляется уменьшением разрешения в цветоразностных каналах при сохранении разрешения в канале яркости.

История[править | править вики-текст]

Метод был впервые разработан в 1950-х Альдой Бедфордом для системы цветного телевидения компании RCA. Позже он получил своё развитие в стандарте NTSC. Впрочем, принцип разделения яркости и информации о цвете был придуман ещё раньше — в 1938 году Джорджесом Валенси.

Введение[править | править вики-текст]

Для совместимости с черно-белым телевизионным сигналом и для возможности уменьшения полосы частот, требуемой для передачи цветностной информации, в цветном телевидении используются специальные схемы суммирования трёх составляющих видеосигнала Y' - означает яркость, а R-Y' и B-Y' — так называемые цветоразностные сигналы. Для перевода компонентного видеосигнала в цифровую форму в соответствии с рекомендациями ITU-R 601 применяется кодирование по следующим формулам:

\begin{align}
Y'  &=& 0.299  \cdot R' & + 0.587 \cdot G'+ 0.114 \cdot B'\\
C_R &=& 0.713 \cdot (R' &- Y')\\
C_B &=& 0.564 \cdot (B' &-Y')
\end{align}

При передаче таких сигналов, возможно восстановление исходных составляющих цветов: красной (R), синей (B) и зеленой (G), которые используются в большинстве систем отображения видеоинформации.

При Y', Cr, Cb представлении видеосигнала цветоразностные компоненты Cr, Cb передаются с пространственным разрешением, в два раза меньшим разрешения по яркостному сигналу, при этом частота дискретизации для яркостного сигнала Y' устанавливается равной 13,5 МГц, что в два раза больше, чем для цветоразностных сигналов Cr и Cb — 6,75 МГц. Для цифровых стандартов принято базовое значение частоты дискретизации равное 3,375 МГц, таким образом, частоты дискретизации яркостного и двух цветоразностных сигналов будут находиться в соотношении 4:2:2.

Для сигналов ТВЧ согласно части II Рекомендации ITU-R 709-3 установлены частоты дискретизации сигналов яркости 74,25 МГц и цветности 37,125 МГц.

Форматы субдискретизации[править | править вики-текст]

Структура дискретизации сигнала обозначается как соотношение между тремя частями X:a:b (например, 4:2:2), описывающими число выборок яркостных и цветоразностных сигналов. Также иногда используется обозначение с четырьмя частями (4:2:2:4), где четвёртая цифра, если она включена, должна быть идентична первой цифре, указывающая на наличие сигнала четвертого канала, содержащего информацию прозрачности (альфа-канал). Этими частями являются:

  • X — частота дискретизации яркостного канала, выраженная коэффициентом базовой частоты (ширина макропикселя)
  • a — число выборок цветоразностных сигналов (Cr, Cb) в горизонтальном направлении в первой строке
  • b — число (дополнительных) выборок цветоразностных сигналов (Cr, Cb) во второй строке
  • Alpha — частота дискретизации альфа-канала (по отношению к первой цифре). Может быть опущен, если альфа-компонент отсутствует, и равна X при его наличии.
4:1:1       4:2:0       4:2:2       4:4:4
Y'CrCb                                
                               
= = = =
Y'                                                                
                               
+ + + +
1 2 3 4  X = 4 1 2 3 4  X = 4 1 2 3 4  X = 4 1 2 3 4  X = 4
(Cr, Cb) 1  a = 1 1 2  a = 2 1 2  a = 2 1 2 3 4  a = 4
1  b = 1      b = 0 1 2  b = 2 1 2 3 4  b = 4
¼ горизонтального разрешения,
полное вертикальное разрешение
½ горизонтального разрешения,
½ вертикального разрешение
½ горизонтального разрешения,
полное вертикальное разрешение
полное горизонтальное разрешение,
полное вертикальное разрешение

Chroma subsampling ratios.svg

8:4:4 Y'CbCr[править | править вики-текст]

Каждая из цветоразностных компонент Cb и Cr имеют одинаковую частоту дискретизации. Компонента яркости имеет в два раза большее разрешение. Эта система используется сканерами киноплёнки высокого уровня, устройствами телекино.

4:4:4 Y'CbCr[править | править вики-текст]

Каждая из трех компонент Y'CbCr имеет одинаковую частоту дискретизации. Эта схема иногда используется в дорогих сканерах и кинематографическом пост-продакшн производстве. Как правило, для предоставления такой пропускной способности используется двухканальный интерфейс HD-SDI, стандарта SMPTE 372M. Первое подключение для передачи сигнала 4:2:2, второе подключение — для сигнала 0:2:2, в сочетании будет передано 4:4:4.

4:4:4 R'G'B' (без субдискретизации)[править | править вики-текст]

Стоит отметить, что под "4:4:4" может пониматься цветовое пространство R'G'B', которое вовсе не имеет цветовой субдискретизации. Видеоформаты, такие как HDCAM SR, могут записывать цифровой видеосигнал с частотой выборки 4:4:4 R'G'B' посредством двухканального HD-SDI.

4:2:2[править | править вики-текст]

Используется в научных исследованиях, профессиональных системах и формате MPEG-2. Рекомендация 601 определяет стандарт полного цифрового видеосигнала с соотношением частот дискретизации яркостного и цветоразностных сигналов как 4:2:2. В каждой строке передается полный сигнал яркости, а для цветоразностных сигналов производится выборка каждого второго отсчета. Таким образом, цветовое горизонтальное разрешение снижается вдвое.

4:2:1[править | править вики-текст]

Этот режим также определен технически. Используется в ограниченном наборе аппаратных и программных кодеров.

4:1:1[править | править вики-текст]

В соотношении 4:1:1, горизонтальное разрешение цветоразностных сигналов снижается до четверти от полного разрешения сигнала яркости, также пропускная способность уменьшается в два раза по сравнению с режимом без субдискретизации. Первоначально, 4:1:1 применялся в формате DV, который не считался вещательным и был единственным приемлемым форматом видеозаписи для низкобюджетных и потребительских приложений. В настоящее время, DV-формат (с выборкой 4:1:1) используется профессионально для производства новостей и воспроизведения видео при помощи серверов.

В системе NTSC, если частота дискретизации яркости равна 13,5 МГц, то это означает, что каждый из сигналов Cr и Cb будет дискретизован с частотой 3,375 МГц, что соответствует максимальной пропускной способности частоты Найквиста 1,6875 МГц, в то время как традиционный "NTSC кодер высокого класса аналогового вещания" будет иметь частоту Найквиста 1,5 МГц и 0,5 МГц для I/Q каналов. Однако в большинстве единиц оборудования, особенно в дешевых телевизорах и VHS / Betamax видеомагнитофонах, каналы цветности имеют пропускную способность только 0,5 МГц для Cr и Cb (что эквивалентно для I/Q). Таким образом, система фактически обеспечивает увеличенную пропускную способность цвета по сравнению с лучшими композитными аналоговыми спецификациями для NTSC, несмотря на то, что используется только 1/4 от полной полосы частот цветовой составляющей "полного" цифрового сигнала. Форматы, которые используют 4:1:1, включают в себя:

  • DVCPRO ( NTSC и PAL )
  • NTSC DV и DVCAM
  • D-7

4:2:0[править | править вики-текст]

Различные варианты 4:2:0 конфигураций можно найти в:

  • В стандартах кодирования видео ИСО/МЭК, MPEG, МККТТ и Группы экспертов кодирования видео "H.26x", включая реализации H.262/MPEG-2 Part 2, такие как DVD (хотя некоторые профили MPEG-4 Part 2 и H.264/MPEG-4 AVC позволяют кодировать со структурой выборки более высокого качества, например, такой как 4:4:4)
  • PAL DV и DVCAM
  • HDV
  • AVCHD и AVC-Intra 50
  • Apple Intermediate Codec
  • Наиболее распространенные реализации JPEG / JFIF и MJPEG
  • VC-1

Для цветоразностных компонентов Cb и Cr при дискретизации отбрасывается каждый второй отсчёт по горизонтали и по вертикали. Есть три варианта схем 4:2:0, имеющих различные горизонтальные и вертикальные размещения отсчётов:

  • Отсчеты цветоразностных компонентов в формате 4:2:0, принятом в системе компрессии MPEG-2, не совмещены с отсчётами яркостной составляющей.
  • В JPEG / JFIF, H.261 и MPEG-1, Cb и Cr совмещены и располагаются между альтернативными отсчетами яркости.
  • В 4:2:0 DV, отсчёты цветоразностных компонентов Cb и Cr совмещены с отсчётами яркостной составляющей изображения, может быть получен из прототипной структуры 4:2:2 путем поочередного исключения одного цветоразностного компонента в каждой второй строке каждого поля.

Этот вид обработки данных особенно хорошо подходит для цветных систем PAL и SECAM. Большинство цифровых видео форматов PAL используют соответственно 4:2:0, за исключением DVCPRO25, который использует 4:1:1. Оба варианта 4:1:1 и 4:2:0 вдвое сокращают пропускную способность по сравнению с представлением без субдискретизации.

4:1:0[править | править вики-текст]

Поддерживается некоторыми кодеками, но используется не слишком широко. При этом соотношении коэффициентов используется половина вертикального и четверть горизонтального цветового разрешения, и лишь одна восьмая часть от полосы пропускания максимального цветового разрешения.

3:1:1[править | править вики-текст]

Используется в формате видеозаписи высокой чёткости Sony HDCAM (не HDCAM SR). В горизонтальном направлении производится выборка отсчетов сигнала яркости на три четверти от полной частоты дискретизации HD — 1440 выборок в строке против 1920 в HDCAM SR. В вертикальном направлении, как в канале яркости, так и в канале цветности производится полная дискретизация HD (1080 отсчетов).

Терминология[править | править вики-текст]

Термин Y'UV относится к аналоговой схеме кодирования, в то время как Y'CbCr ссылается на цифровые схемы кодирования. Одно из различий между ними в том, что набор коэффициентов компонентов цветности U, V и Cb, Cr различен. Однако термин YUV часто используется ошибочно, обращаясь к кодировке Y'CbCr. Следовательно, выражения типа "4:2:2 YUV" всегда относятся к 4:2:2 Y'CbCr, так как просто нет такого понятия, как 4:x:x в аналоговой кодировке (например, YUV).

Также термином яркость и символом Y часто пользуются ошибочно, обращаясь к яркости, которая обозначается символом Y'. Обратите внимание, что яркость (Y'), принятая у видео инженеров отклоняется от яркости (Y) в колориметрии (как определено в CIE ). Яркость (в ТВ) формируется как взвешенная сумма компонентов RGB с гамма-коррекцией (трехцветной). Яркость формируется как взвешенная сумма линейных (трехцветной) компонентов RGB.

На практике, CIE символ Y часто неправильно используется для обозначения яркости. В 1993 году SMPTE принятое Руководство для инженеров EG 28, уточняет два термина. Обратите внимание, что главным символом ' используется, чтобы указать гамма-коррекцию.

Кроме того, понятие хрома/цветность у видео инженеров отличается от цветности в колориметрии. Хрома/цветность в видео-инженерной практике формируется из весовых компонентов трехцветной, нелинейных компонентов. Условия цветность и насыщенность часто используются как синонимы для обозначения цветности.

Видеоформаты[править | править вики-текст]

Следующая таблица показывает характеристики большинства видеоформатов и типов применяемой субдискретизации цветоразностных компонент, а также другие связанные с ними параметры, такие как скорость передачи данных и степень сжатия.

Формат Владелец Субдискретизация Глубина цвета Скорость потока
данных (Мбит/с)
Тип компрессии Степень сжатия Разрешение (пикселей)
Телевидение стандартной чёткости (SD)
DV/MiniDV Несколько 4:2:0 (PAL)
4:1:1 (NTSC)
8 бит 25 ДКП 5:1 720×576(PAL)
720×480(NTSC)
DVCPRO 25 Panasonic 4:1:1 8 бит 25 ДКП 5:1 720×576(PAL)
720×480(NTSC)
DVCPRO 50 Panasonic 4:2:2 8 бит 50 ДКП 3,3:1 720×576(PAL)
720×480(NTSC)
DVCAM Sony 4:2:0 (PAL)
4:1:1 (NTSC)
8 бит 25 ДКП 5:1 720×576(PAL)
720×480(NTSC)
Digital Betacam Sony 4:2:2 10 бит 90 ДКП 2,3:1 720×576(PAL)
720×480(NTSC)
Betacam SX Sony 4:2:2 10 бит 18/170 MPEG-2 10:1 720×576(PAL)
720×480(NTSC)
MPEG IMX Sony 4:2:2 8 бит 30
40
50
MPEG-2 6:1
4:1
3,3:1
720×576(PAL)
720×480(NTSC)
XDCAM Sony 4:2:0/4:1:1
4:2:2
8 бит 30
40
50
ДКП
MPEG-2
6:1
4:1
3,3:1
720×576(PAL)
720×480(NTSC)
Телевидение высокой чёткости (HD)
DVCPRO 100 Panasonic 4:2:2 8 бит 100 ДКП 6,7:1 1440×1080
960×720
HDCAM Sony 3:1:1 8 бит 144 MPEG-4 4:1 1440×1080
HDCAM SR Sony 4:2:2
4:4:4
10 бит 440
880
MPEG-4 4,2:1
2,7:1
1920×1080
HDV Sony JVC Canon 4:2:0 8 бит 19/25 MPEG-2 18:1 1440×1080
1920×1080
1280×720
AVCHD Panasonic Sony 4:2:0 8 бит 18/24 H.264/MPEG-4 1440×1080
1920×1080
1280×720
XDCAM HD Sony 4:2:0 8 бит 18/50 MPEG-2 1440×1080
1280×720

См. также[править | править вики-текст]

Литература[править | править вики-текст]