Байт

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Байт (англ. byte) — единица хранения и обработки цифровой информации; совокупность битов, обрабатываемая компьютером одномоментно. В современных вычислительных системах байт состоит из восьми битов и, соответственно, может принимать одно из 256 (28) различных значений (состояний, кодов). Однако в истории компьютерной техники существовали решения с иными размерами байта (например, 6, 32 или 36 битов), поэтому иногда в компьютерных стандартах и официальных документах для однозначного обозначения группы из 8 битов используется термин «октет» (лат. octet).

В большинстве вычислительных архитектур байт — это минимальный независимо адресуемый набор данных.

История[править | править вики-текст]

Название «байт» (слово byte представляет собой сокращение словосочетания BinarY TErm — «двоичный терм»[источник не указан 134 дня]) было впервые использовано в 1956 году В. Бухгольцем (англ. Werner Buchholz) при проектировании первого суперкомпьютера IBM 7030 Stretch для пучка одновременно передаваемых в устройствах ввода-вывода шести битов. Позже, в рамках того же проекта, байт был расширен до восьми бит.

Ряд ЭВМ 1950-х и 1960-х годов (БЭСМ-6, М-220) использовали 6-битовые символы в 48-битовых или 60-битовых машинных словах. В некоторых моделях ЭВМ производства Burroughs Corporation (ныне Unisys) размер символа был равен 9 битам. В советской ЭВМ Минск-32 использовался 7-битный байт.

Байтовая адресация памяти была впервые применена в системе IBM System/360. В более ранних компьютерах адресовать можно было только целиком машинное слово, состоявшее из нескольких байтов, что затрудняло обработку текстовых данных.

8-битные байты были приняты в System/360, вероятно, из-за использования BCD-формата представления чисел: одна десятичная цифра (0-9) требует 4 бита (тетраду) для хранения; один 8-битный байт может представлять две десятичные цифры. 6-битные байты могут хранить только по одной десятичной цифре, два бита остаются незадействованными.

По другой версии, 8-битный размер байта связан с 8-битным же числовым представлением символов в кодировке EBCDIC.

По третьей версии, из-за двоичной системы кодирования в компьютерах наиболее выгодными для аппаратной реализации и удобными для обработки данных являются длины слов кратные степеням 2, в том числе и 1 байт = 23 = 8 битов, системы и компьютеры с длинами слов не кратными числу 2 отпали из-за невыгодности и неудобства.

Постепенно 8-битные байты стали стандартом де-факто; с начала 1970-х в большинстве компьютеров байты состоят из 8 бит, а размер машинного слова кратен 8 битам.

Из соображений удобства единицы нетекстовых типов данных также делают кратными восьми битам, например:

  • размер одного семпла в звуковых файлах равен 8, 16 или 24 битам
  • цвет пикселя в системе RGB обычно задается 24 битами (по 8 битов на цвет), и 32 бита в системе RGBA (R+G+B=24 бита на цвет + 8 бит на прозрачность = 32 бита)

Количество состояний (кодов) в байте[править | править вики-текст]

Количество состояний (кодов, значений), которое может принимать 1 восьмибитный байт с позиционным кодированием, определяется в комбинаторике, равно количеству размещений с повторениями и вычисляется по формуле:

N_p=\bar{A}(n,k)= \bar{A}_n^k =n^k=2^8=256 возможных состояний (кодов, значений), где
  • N_p — количество состояний (кодов, значений) в одном байте.
  • \bar{A}(n,k)= \bar{A}_n^k — количество размещений с повторениями.
  • n — количество состояний (кодов, значений) в одном бите; в бите 2 состояния (n=2).
  • k — количество битов в байте; в 8-битном байте k=8 и в нём может быть от 0 до 8 одинаковых битов (повторений).

Производные единицы[править | править вики-текст]

Измерения в байтах
ГОСТ 8.417-2002 Приставки СИ приставки МЭК
Название Символ Степень Название Степень Название Символ Степень
байт Б 100 - 100 байт B Б 20
килобайт кБ 103 кило- 103 кибибайт KiB КиБ 210
мегабайт МБ 106 мега- 106 мебибайт MiB МиБ 220
гигабайт ГБ 109 гига- 109 гибибайт GiB ГиБ 230
терабайт ТБ 1012 тера- 1012 тебибайт TiB ТиБ 240
петабайт ПБ 1015 пета- 1015 пебибайт PiB ПиБ 250
эксабайт ЭБ 1018 экса- 1018 эксбибайт EiB ЭиБ 260
зеттабайт ЗБ 1021 зетта- 1021 зебибайт ZiB ЗиБ 270
йоттабайт ЙБ 1024 йотта- 1024 йобибайт YiB ЙиБ 280

Кратные приставки для образования производных единиц для байта применяются не как обычно: уменьшительные приставки не используются совсем, а единицы измерения информации, меньшие, чем байт, называются специальными словами (ниббл и бит); увеличительные приставки кратны 1024=210, то есть 1 килобайт равен 1024 байтам, 1 мегабайт — 1024 килобайтам или 1 048 576 байтам и т. д. для гиби-, тера- и пебибайтов. Разница между ёмкостями (объёмами), выраженными в кило = 103 = 1000 и выраженными в киби = 210 = 1024, возрастает с ростом веса приставки. МЭК рекомендует использовать двоичные приставки, но на практике они пока не применяются, возможно, из-за неблагозвучности — кибибайт, мебибайт, йобибайт и т. п.[источник не указан 995 дней].

Иногда десятичные приставки используются и в прямом смысле, например, при указании ёмкости жёстких дисков: у них гигабайт может обозначать не 1 073 741 824=1024^3 байтов, а миллион килобайтов (то есть 1 024 000 000 байтов), а то и просто миллиард байтов.

Обозначение[править | править вики-текст]

Межгосударственный (СНГ) стандарт ГОСТ 8.417-2002[1] («Единицы величин») в «Приложении А» для обозначения байта регламентирует использование русской прописной буквы «Б». Кроме того, констатируется традиция использования приставок СИ вместе с наименованием «байт» для указания множителей, являющихся степенями двойки (1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т. д., причём вместо строчной «к» используется прописная «К»), и упоминается, что подобное использование приставок СИ не является корректным.

Использование прописной буквы «Б» для обозначения байта соответствует требованиям ГОСТ и позволяет избежать путаницы между сокращениями от байт и бит. Однако следует учитывать, что в стандарте нет сокращения для «бит», поэтому использование записи вроде «Гб» как синонима для «Гбит» недопустимо.

В международном стандарте МЭК IEC 60027-2 2005 года[2], для применения в электротехнической и электронной областях, рекомендуются обозначения:

  • bit — для бита;
  • o, B — для октета, байта. Причём о — единственное указанное обозначение во французском языке.

Склонение[править | править вики-текст]

Согласно рекомендации Института русского языка имени В. В. Виноградова Российской Академии Наук байт, как и бит, склонять необходимо[источник не указан 1081 день].

Кроме обычной формы родительного падежа (битов, байтов, килобайтов) существует счетная форма, которая используется в сочетании с числительными: 8 байт, 16 килобайт. Счетная форма является разговорной. Точно так же, например, с килограммами: обычная форма родительного падежа употребляется, если нет числительного, а в сочетании с числительным могут быть варианты: 16 килограммов (стилистически нейтральная обычная форма) и 16 килограмм (разговорная счетная форма)[3].

См. также[править | править вики-текст]

Примечания[править | править вики-текст]

  1. Справочник по ГОСТ-ам :: Справочник :: Прибор. Инфо
  2. фр. NORME INTERNATIONALE CEI, Troisième édition, англ. INTERNATIONAL STANDARD IEC, Third edition — 60027-2, от 2005-08, стр. 5, 112 −117.
  3. Русский орфографический словарь: около 180 000 слов [Электронная версия] / О. Е. Иванова, В. В. Лопатин (отв. ред.), И. В. Нечаева, Л. К. Чельцова. — 2-е изд., испр. и доп. — М.: Российская академия наук. Институт русского языка им. В. В. Виноградова, 2004. — 960 с. — ISBN 5-88744-052-X.

Ссылки[править | править вики-текст]

Логотип Викисловаря
В Викисловаре есть статья «байт»