Масштабирование изображения

Масштаби́рование изображения — изменение размера цифрового изображения с сохранением пропорций. Под масштабированием подразумевается как увеличение («апскейлинг» от англ. upscaling), так и уменьшение («даунскейлинг», англ. downscaling) разрешения изображения. Широко применяется в компьютерной графике, обработке видео, в частности, реализуется на аппаратном уровне в телевизорах и видеопроигрывателях.

При этом, в зависимости от типа графики (растровая, векторная), масштабирование производится разными алгоритмами. Масштабирование векторных изображений происходит без потерь качества изображения, при увеличении растровых может происходить потеря качества изображения: возможны существенные искажения геометрии мелких деталей и появление ложных узоров на текстурах. Поэтому при масштабировании растровых изображений используются специализированные алгоритмы, сглаживающие нежелательные эффекты.

Методы масштабирования общего назначения[править | править код]

Слева — изображение, полученное размножением, справа — результат бикубической интерполяции

Общая теория методов масштабирования описана в статье Передискретизация.

Если в изображении есть мелкие контрастные детали, важно его перевести в линейное цветовое пространство — иначе (если исходник в sRGB) на уменьшенном изображении получившаяся «каша» из светлого и тёмного будет темнее, чем надо.

Окно передискретизационного фильтра равно размеру исходного или целевого пикселя — что больше^[1].

Многим алгоритмам нужны виртуальные пиксели за границей кадрового буфера. В зависимости от назначения алгоритма, можно физически сделать изображение на несколько пикселей больше или брать данные из другого места методом if-then. Данные можно брать с краёв (если имеем дело с законченным изображением), брать пустые пиксели (если изображение — спрайт) или брать пиксели с другой стороны изображения (если изображение должно бесшовно повторяться)^{[источник не указан 1188 дней]}.

Увеличение[править | править код]

Для увеличения обычно используют не передискретизационные фильтры в общем виде, а частный случай — интерполяцию.

Простейшим способом удвоения разрешения является метод копирования ближайшего пикселя, заменяющий каждый пиксель четырьмя пикселями того же цвета, при этом изображение, сохраняя детали оригинала, приобретает нежелательный «лестничный эффект». Этот же способ может быть применён для более тонких изменений разрешения, например, для масштаба 99 % или 101 % соответственно убирают или дублируют каждую сотую точку.

Метод билинейной интерполяции обеспечивает некоторое сохранение гладкости контуров рисунка, но иногда вызывает нежелательные эффекты сглаживания деталей и всё равно порождает довольно заметный «эффект лестницы». Более совершенным методом является использование бикубической интерполяции.

Уменьшение[править | править код]

Для уменьшения изображений используют свёртку с той или иной функцией-ядром. Методу ближайшего соседа соответствует узкий прямоугольник, билинейной интерполяции — треугольное ядро… Часто для уменьшения фотографий используются фильтр Ланцоша, дающий субъективную резкость, и прямоугольный фильтр (box filter), размывающий изображение.

Использование методов увеличения для уменьшения и наоборот[править | править код]

Небольшое (до 0,5×) уменьшение часто проводят интерполяцией. При бо́льших коэффициентах начинаются потери информации — отсюда возникшая во времена первых фоторедакторов рекомендация уменьшать поэтапно, не более чем вдвое за раз.

Интерполяция методом ближайшего соседа и билинейная, как самые простые, используются, когда надо масшабировать в реальном времени, в играх и графическом ПО. MIP-текстурирование основано на том, что берут качественно уменьшенную текстуру подходящего размера — а потом масштабируют интерполяцией с коэффициентом, близким к единице.

Метод свёртки с ядром, используемый при уменьшении, при увеличении (если установить правильную ширину окна — 1 исходный пиксель) не вредит качеству, но может давать лишнюю вычислительную работу. Некоторые ядра (например, фильтр Ланцоша) при увеличении более чем в два раза вносят свои артефакты.

Прямоугольным фильтром пользуются современные (2010-е и позже) пиксельные игры, чтобы увеличить изображение вдвое и более, в том числе с нецелым коэффициентом^[2].

Методы масштабирования пиксельной графики[править | править код]

Для увеличения малоцветных изображений в малом разрешении лучше всего подходят специальные алгоритмы, разработанные для растровой графики, позволяющие при незначительных искажениях точности прорисовки форм сохранить и подчеркнуть чёткие контуры и мелкие детали. Также существуют сглаживающие алгоритмы, подходящие для обработки фотографий и многоцветных растровых изображений с эффектом лесенки, объединяемые под наименованием «методов сверхмасштаба» (англ. supersampling).

Сравнение[править | править код]

В таблице приведено сравнение алгоритмов масштабирования, выполненных с помощью свободно распространяемой программы 2dimagefilter.

Алгоритм	Изображение
(Исходные изображения)
Super-xBR 4x
Eagle 3x
hq3x
Scale 3x
XBR 3x
SuperEagle
SuperSaI
SaI 2x
Scale 2x

Методы масштабирования векторной графики[править | править код]

Векторную графику можно отрендерить в любом разрешении, которое нужно. Но есть нюансы.

На сверхнизких разрешениях векторная графика становится немасштабируемой, потому что погрешности рендеринга становятся велики. Векторная иконка, нарисованная под 16×16, плохо смотрится в 24×24 и совсем плохо — в 20×20. Уже в TrueType (конец 80-х) попытались разрешить это противоречие, добавив сложные коды хинтинга. Хинтинг устанавливает взаимосвязи между разными элементами буквы, и в зависимости от них искажает пропорции, чтобы улучшить читаемость.
Устройство изображения во многом зависит от того, какую часть поля зрения оно занимает. Если оно займёт существенную часть поля зрения, можно сделать тонкие линии и узкие пробелы между буквами. Если малую часть (маленькая иконка, смотрим издали, дорожный знак с совмещёнными изображениями вроде «стоянка на 5 машин»…) — наоборот, нужны толстые линии и большие пробелы. Автоматически этот вопрос не решается, только ручной нюансировкой.

Отдельная задача — масштабирование заведомо векторного/графичного изображения, отрендеренного в растр и, возможно, искажённого алгоритмами сжатия (например, для реставрации мультфильмов). Задача не столь ограничивающая, как трассировка растра — если обнаружена, например, градиентная заливка, не нужно её переводить в векторные примитивы. Для этого существует, например, нейросетевой алгоритм waifu2x.

Расстояние до видимой разницы[править | править код]

Научные данные, используемые для расчета разрешающей способности человеческого глаза, служат основой для расчета оптимального расстояния просмотра для различных разрешений экрана. Когда вы сидите на оптимальном расстоянии, вы сможете увидеть все детали на экране без разглядывания отдельных пикселей. Оптимальное расстояние зависит от размера экрана. Чем больше экран, тем дальше от него можно сидеть.

Если вы сидите на оптимальном расстоянии, вы увидите все детали изображения. По мере удаления от экрана детали будут теряться, и изображение будет выглядеть более мягким. Если вы смотрите контент 4K на телевизоре 4K и сидите на оптимальном расстоянии для телевизора 1080p, на экране будет изображение 4K, но ваши глаза будут видеть 1080p.

Использование в эмуляторах игровых консолей[править | править код]

Благодаря мощной аппаратной составляющей современных компьютеров возможно использование алгоритмов масштабирования изображений в реальном времени для видеоигр. Высокооптимизированные алгоритмы дают чёткую и детальную картинку при минимальном эффекте размытия, при этом не требуют значительных ресурсов системы. Они используются во многих эмуляторах игровых приставок, таких как HqMAME, DOSBox и ScummVM.

Алгоритмы масштабирования изображений применяются в коммерческих эмуляторах Xbox Live, Virtual Console и PlayStation Network и позволяют геймерам, поклонникам игр 80-х и 90-х годов, созданных в низком разрешении, увидеть любимые игры с приемлемым качеством картинки на HD-экранах. Такие алгоритмы используются в Sonic's Ultimate Genesis Collection, Castlevania: The Dracula X Chronicles, Castlevania: Symphony of the Night и Akumajō Dracula X Chi no Rondo.

Проблемы масштабирования изображений[править | править код]

Пример сглаживания — изображение слева не сглажено, к изображению справа применено сглаживание 4x

При масштабировании изображений наиболее частой проблемой становится эффект «зубчатости», для устранения которого используются алгоритмы сглаживания. В этом случае пиксели, соседние с граничным пикселем изображения, принимают промежуточное значение между цветом изображения и цветом фона, создавая градиент и размывая границу.

Масштабирование изображения со сглаживанием зависит от цветовой модели, принятой в нём. Стандартной под экран считается модель sRGB с кусочно-полиномиальной кривой отклика, которая неплохо приближается степенной кривой $I=x^{2{,}2}$ . Однако большинство графических библиотек считают sRGB линейным пространством. Проблема менее заметна для фото и более — для чертежей.

Существует простой алгоритм увеличения пиксельной графики («продвинутый ближайший сосед») с дробным коэффициентом 2 и более, но нет похожего алгоритма с коэффициентом от 1 до 2. Потому современные (2010-е годы) игры с пиксельной графикой стараются делать с разрешением как минимум вдвое меньшим, чем целевая машина^[2].

Историки всерьёз озабочены нейросетевыми алгоритмами, автоматически придумывающими детали — ведь они придумывают то, чего не было на исходном изображении. И может оказаться, что самым ходовым будет изображение технически более высокого качества — но неаутентичное. Или после прогона через подобный сервис владелец удалит «некачественный» оригинал^[3].

См. также[править | править код]

Примечания[править | править код]

↑ Basics of Image Resampling (неопр.). Дата обращения: 11 мая 2020. Архивировано 23 января 2022 года.
↑ ¹ ² Gamasutra: Lars Doucet's Blog - Doing an HD Remake the Right Way (неопр.). Дата обращения: 3 марта 2020. Архивировано 3 марта 2020 года.
↑ Когда я слышу слова «нейросеть восстановила», я лезу проверять бэкапы / Хабр (неопр.). Дата обращения: 3 марта 2020. Архивировано 2 марта 2020 года.

Литература[править | править код]

Маркелов К. С. Модель повышения информативности цифровых изображений на базе метода суперразрешения // Инженерный вестник. — МГТУ им. Н. Э. Баумана, 2013. — № 03.
Freedman, Gilad and Fattal, Raanan. Image and Video Upscaling from Local Self-examples (англ.) // ACM Trans. Graph.. — 2011. — Vol. 30, no. 2. — P. 12:1--12:11. — doi:10.1145/1944846.1944852.
Kopf, Johannes and Lischinski, Dani. Depixelizing Pixel Art (англ.) // ACM Trans. Graph.. — 2011. — Vol. 30, no. 4. — P. 99:1--99:8. — doi:10.1145/2010324.1964994.
Giachetti, Andrea and Asuni, Nicola. Real-Time Artifact-Free Image Upscaling (англ.) // Trans. Img. Proc.. — 2011. — Vol. 20, no. 10. — P. 2760—2768. — doi:10.1109/TIP.2011.2136352.

Ссылки[править | править код]

2D-Image and Texture Filter Бесплатная программа на code.google.com, включающая подборку фильтров изображения для увеличения масштаба A collection of image filters, some especially suited to scale-up low res computer graphics.

including Hqnx-family, SaI, Eagle, EPX, XBR, XBRz, Lanczos, etc.

Апскейлинг и 4k против 1080p – на tvrate

Sebastian Anthony. Depixelizing Pixel Art: Upscaling Retro 8-bit Games, ExtremeTech, May 24, 2011
xBRZ Scaler Comparison and Testing Tool на SourceForge
C Library implementing the xBR pixel art scaling algorithm на GitHub
AVIR image resizing algorithm на GitHub

[1] Basics of Image Resampling (неопр.). Дата обращения: 11 мая 2020. Архивировано 23 января 2022 года.

[автоссылка1-2] ¹ ² Gamasutra: Lars Doucet's Blog - Doing an HD Remake the Right Way (неопр.). Дата обращения: 3 марта 2020. Архивировано 3 марта 2020 года.

[3] Когда я слышу слова «нейросеть восстановила», я лезу проверять бэкапы / Хабр (неопр.). Дата обращения: 3 марта 2020. Архивировано 2 марта 2020 года.

[1]

[2]

[3]

Масштабирование изображения

Содержание