Пробел
Пробел | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
|
||||||||||||
Характеристики | ||||||||||||
Название | space | |||||||||||
Юникод | U+0020 | |||||||||||
HTML-код |
  или   |
|||||||||||
UTF-16 | 0x20 | |||||||||||
URL-код | %20 |
Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Пробел не относится к знакам препинания.
ГОСТ[1] определяет пробел следующим образом: «литера, воспроизводимая отсутствием начертания».
Пробел — сравнительно позднее изобретение. В финикийском и первоначальных вариантах древнееврейского и арамейского письма пробел не использовался. В греческом письме он используется более тысячи лет. В латыни пробел иногда встречался в древности, потом исчезал и вернулся тоже около тысячи лет назад. В древнейших славянских памятниках пробел также отсутствует (как в глаголице, так и в кириллице); регулярно и в нынешнем смысле используется в кириллице только с XVII века. В арабском письме практически не использовался до XX века. В современном китайском и японском языках пробел также может не использоваться.
Для указания словораздела в письменностях, не имеющих или редко использующих пробелы, применялись и применяются различные приемы, например:
- особые формы букв для начала и (или) конца слова;
- использование диакритических знаков, ставящихся при первой и (или) последней букве слов, либо добавление к началу (концу) слова особых непроизносимых букв;
- разделение слов вместо пробелов другими знаками (чаще всего точкой или двоеточием, иногда вертикальной чертой и т. п.);
- слитное начертание знаков, входящих в одно слово, либо обозначение принадлежности знаков к слову графически (например, чертой).
В старинных письменностях пробелами (или иным способом разделения) могли отделяться не отдельные слова, а более крупные единицы текста (словосочетания) или более мелкие (слоги). Во вьетнамской письменности пробел разделяет слоги и сейчас.
Слитное и раздельное написание сочетаний полных слов со служебными элементами (предлогами, частицами и т. п.) представляет собой одну из самых сложных для учащихся и нестабильную часть орфографии многих языков, в том числе и русского.
Обычный пробел
[править | править код]Выглядит | Юникод | HTML | ||
---|---|---|---|---|
Название | Код | Десятичное | Шестнадцатеричное | |
« » | SPACE | U+0020 |   |   |
Правила постановки пробела рядом со знаками препинания в русском языке
[править | править код]В русскоязычном наборе пробел ставится:
- после запятой, точки (в том числе и обозначающей сокращения и инициалы), точки с запятой, двоеточия, вопросительного и восклицательного знака, многоточия (кроме многоточий, начинающих предложение);
- перед многоточием, стоящим в начале предложения (если этим предложением не начинается абзац);
- с внешней стороны скобок и кавычек;
- с обеих сторон тире, за исключением тире между цифровыми обозначениями неотрицательных целых чисел (по типографским правилам, вокруг тире ставятся не обычные пробелы, а укороченные (двухпунктовые), но из-за ограничений стандартных раскладок клавиатуры, на которых нет укороченных пробелов, часто ставят полные пробелы: неразрывный слева и обычный справа).
Однако пробел не ставится:
- перед запятой, точкой, точкой с запятой, двоеточием, вопросительным и восклицательным знаками, многоточием (кроме многоточия, стоящего в начале предложения);
- после многоточия, стоящего в начале предложения;
- с внутренней стороны скобок и кавычек;
- с обеих сторон дефиса (за исключением односторонних дефисов, то есть случаев вроде «одно- и двухэтажный») и апострофа.
В случае одновременной применимости обоих вышеприведённых правил (например, если точка стоит перед закрывающей скобкой, или перед запятой) пробел не ставится.
В некоторых руководствах по типографскому набору также указывается, что пробел не ставится, если тире следует за точкой или запятой, но при работе с большинством современных шрифтов этот совет скорее вреден[источник не указан 4164 дня].
В случае, когда двоеточие используется в качестве знака деления, оно отбивается с обеих сторон полукегельными шпациями.
Применение в типографике других стран
[править | править код]В американской типографике (в отличие от британской и австралийской) пробел не ставится до и после длинного тире (как во фразе «A dash indicates a sudden break in thought—a parenthetical statement like this one—or an open range», где длинные тире выделяют вставную конструкцию[2][3]).
Во французской типографике после открывающей кавычки и перед закрывающей ставится ¼ М-пробела (пример: « Son explication n’est qu’un mensonge », s’indigna le député.)
Пробел между предложениями
[править | править код]Пробел между предложениями[англ.]) — горизонтальное расстояние между соседними предложениями в печатном тексте. В разные периоды со времени изобретения наборного шрифта использовались пробелы различной длины по отношению к пробелам между словами — обычный, полуторный, двойной[4]. Длина пробела между предложениями также могла меняться в заданном интервале для возможности выравнивания текста по ширине страницы или для избежания появления коридоров.
Появление печатных машинок в конце XIX века привело к появлению двух чётко обособленных стилей разделения предложений — английского, при котором между предложениями используется двойной пробел, и французского, предполагающего использование одинарного[5]. К середине XX века французский стиль стал преобладать и превратился в стандарт де факто после появления компьютеров.
Неразрывный пробел
[править | править код]Неразрывный пробел — символ, отображающийся внутри строки подобно обычному пробелу, но не позволяющий программам отображения и печати разорвать в этом месте строку. Используется для автоматизации вёрстки, правила которой предписывают избегать разрыва строк в известных случаях (большей частью для удобочитаемости), например, между инициалами и фамилией. Во многих программах неразрывный пробел отличается от обычного также тем, что не изменяет размер при разгоне строки по ширине. В Юникоде имеет шестнадцатеричный код U+00A0.
Другие пробелы в Юникоде
[править | править код]Название в Юникоде |
Код в Юникоде | Выглядит | Мнемоника в HTML 4 |
Пояснения | |
---|---|---|---|---|---|
шестнадцатеричный | десятичный | ||||
EN QUAD | 2000 | 8192 | «» | канонически эквивалентен символу U+2002 EN SPACE[6] | |
EM QUAD | 2001 | 8193 | «» | канонически эквивалентен символу U+2003 EM SPACE[6] | |
EN SPACE | 2002 | 8194 | « » |   | равен половине кегля шрифта (исторически происходит от ширины заглавной буквы «N») |
EM SPACE | 2003 | 8195 | « » |   | равен кеглю шрифта (исторически происходит от ширины заглавной буквы «M») |
THREE-PER-EM SPACE | 2004 | 8196 | « » | ближе всех к обычному пробелу, втрое меньше, чем EM-SPACE | |
FOUR-PER-EM SPACE | 2005 | 8197 | « » | в четыре раза меньше, чем EM-SPACE | |
SIX-PER-EM SPACE | 2006 | 8198 | « » | в шесть раз меньше, чем EM-SPACE | |
FIGURE SPACE | 2007 | 8199 | « » | имеет такую же ширину, что и цифры в данном шрифте, и предназначен для набора таблиц. Неразрывный. | |
PUNCTUATION SPACE | 2008 | 8200 | « » | ширина равна ширине точки | |
THIN SPACE | 2009 | 8201 | « » |   | обычно имеет ширину в 1⁄5 (реже — в 1⁄6) кегля. По пропорциям соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов. |
HAIR SPACE | 200A | 8202 | « » | самый узкий пробел, соответствует самой тонкой шпации в кассе наборщика | |
ZERO-WIDTH SPACE | 200B | 8203 | «» | Пробел нулевой ширины показывает места, в которых можно разрывать строку, не добавляя знак переноса; ширина его нулевая. Применяется в языках, в которых пробелов нет. При выравнивании текста по ширине может расширяться, как и любой другой пробел. | |
NARROW NO-BREAK SPACE | 202F | 8239 | « » | узкий неразрывный пробел | |
MEDIUM MATHEMATICAL SPACE | 205F | 8287 | « » | узкий пробел, применяемый в математических формулах | |
WORD JOINER | 2060 | 8288 | «» | аналогичен ZERO-WIDTH SPACE, но неразрывный | |
IDEOGRAPHIC SPACE | 3000 | 12288 | « » | используется в восточных языках, равняется ширине одного иероглифа. См. CJK |
Пробел при типографском наборе
[править | править код]В разделе не хватает ссылок на источники (см. рекомендации по поиску). |
При типографском наборе пробелы между словами не имели фиксированной ширины. Для книжных изданий традиционно применяются приведённые ниже правила.
Без шпаций набираются такие комбинации:
- знак препинания и предшествующий текст;
- многоточие в начале предложения и последующий текст;
- тире после точки или запятой;
- тире между границами промежутка, включая границы, описываемые словами (например, «5—8 лет», «три—семь дней»[источник не указан 3697 дней] или «поезд Москва—Берлин»);
- тире между фамилиями авторов результата (например, «метод Гаусса—Зейделя»);
- точка или запятая перед знаком сноски;
- кавычки или скобки и заключенный в них текст;
- кавычки или скобки и знаки препинания;
- двойные знаки номера и параграфа;
- число перед знаком градуса, минуты, секунды или терции;
- дефис и смежные элементы;
- буквенно-цифровые обозначения.
С 2-пунктовыми шпациями набираются такие комбинации:
- тире и смежные элементы (кроме случаев, указанных выше);
- слово перед знаком сноски;
- классы цифр в многозначных числах.
С 3-пунктовыми шпациями набираются такие комбинации:
- числа после знака номера или параграфа, если они разделены запятыми;
- части сокращения с точкой («и т. д.»).
С полукегельными шпациями такие комбинации:
- знак номера или параграфа перед числом;
- числа после знака номера или параграфа, если они не разделены запятыми;
- число и относящееся к нему слово;
- части сокращения без точки («и т. д.»);
- инициалы и фамилия.
Запрещается перенос таких комбинаций:
- диапазон (числа, соединённые тире);
- сокращения, подобные «и т. д.»;
- фамилия и инициалы;
- число и относящееся к нему слово;
- знак номера или параграфа и число;
- обозначение пункта списка и последующий текст.
Ранее пробел не ставился после числа перед знаком процента или промилле, а также перед знаком градуса Цельсия: (0 °C)[7]. С 2002 года в Российской Федерации ГОСТ 8.417—2002, а затем Постановление Правительства РФ от 31 октября 2009 г. № 879 «Об утверждении положения о единицах величин, допускаемых к применению в Российской Федерации» предписывают ставить пробел между числовым значением и обозначением единицы величины, за исключением обозначения единиц величин в виде знака, размещенного над строкой, перед которым пробел не ставится (например, величина плоского угла 30°; обозначение градуса Цельсия — °C, поэтому правильный вариант t = 20 °C)[8].
В связи с ограниченностью возможностей компьютерных программ[9] и стандартной клавиатуры и различиями в традициях типографского набора разных стран в компьютерном наборе de facto используются упрощённые правила. При этом для предотвращения переноса текста зачастую используется неразрывный пробел[10].
В текстах, предназначенных для набора с бумаги и требующих особой точности при наборе (например, в текстах компьютерных программ), место пробела иногда обозначается знаком ␢ (от англ. blank, U+2422 blank symbol) или ␣ (U+2423 open box).
См. также
[править | править код]- Trim — часто используемое в программировании название для функции, удаляющей пробелы в начале и/или конце строк
- Десятичный разделитель
- Управляющие символы
Примечания
[править | править код]- ↑ ГОСТ 19781-90. Единая система программной документации. Обеспечение систем обработки информации программное Архивная копия от 17 октября 2007 на Wayback Machine.
- ↑ Вставная конструкция. Архивная копия от 23 марта 2013 на Wayback Machine // Энциклопедия русского языка.
- ↑ 85. Вставные конструкции Архивная копия от 24 июля 2013 на Wayback Machine // Валгина Н. С. Синтаксис современного русского языка. Учебник. — Московский государственный университет печати.
- ↑ Речь идёт в первую очередь о текстах, использующих латиницу, а не кириллицу.
- ↑ Imprimerie nationale (1993). Lexique des règles typographiques en usage à l’Imprimerie nationale (фр.).
- ↑ 1 2 Unicode Consortium. The Unicode Standard, Version 7: General Punctuation, Range 2000–206F . Дата обращения: 21 ноября 2014. Архивировано 17 сентября 2011 года.
- ↑ Гиленсон П. Г. Справочник художественного и технического редакторов. — М. : Книга, 1988. — 528 с.
- ↑ Постановление Правительства Российской Федерации от 31 октября 2009 г. № 879 «Об утверждении положения о единицах величин, допускаемых к применению в Российской Федерации» Архивная копия от 17 апреля 2021 на Wayback Machine.
- ↑ В настоящее время практически все издательские и офисные программы имеют поддержку Unicode, за счёт которой ограничения снимаются.
- ↑ Современные издательские программы имеют встроенные средства автоматизации, и на их основе существуют готовые решения, позволяющие без существенных затрат труда и времени расставлять в наборе пробелы, предусмотренные полной версией правил.
Литература
[править | править код]- Мильчин А. Э., Чельцова Л. К. Справочник издателя и автора. Редакционно-издательское оформление издания. — 2-е изд., испр. и доп. — М. : ОЛМА-Пресс, 2003. — Гл. 6.1.3. — ISBN 5-224-04565-7.
- Добиаш-Рождественская О. А. История письма в средние века. — М. : Книга, 1987. (Книга о латинской палеографии.)
- Фридрих И. История письма. — М. : Наука, 1979.
- Глаголическое письмо // Энциклопедия славянской филологии. Вып. 3 / под ред. И. В. Ягича. — Санкт-Петербург, 1911. — С. 51—262 и 36 листов снимков. (Существуют как минимум два современных репринта.)
- Groningen, B. A. van. Short manual of Greek Palaeography. — Leyden : A. W. Sijthoff’s Uitgeversmaatschappij N. V., 1955.
Ссылки
[править | править код]- на сайте Scriptsource.org (англ.)
- Ростислав Чебыкин. Неразрывные участки текста.
- Всё (или почти всё) о пробеле.