recode

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
recode
Тип

перекодировка текста

Разработчик

Франсуа Пинар (François Pinard)

Операционная система

UNIX‐подобные

Последняя версия

3.6 (2001)

Лицензия

GNU GPL

recodeутилита для преобразования текста. Предназначена главным образом для перевода текстовых файлов в другую кодировку, может при этом также изменять формат переводов строки. Поставляется со многими системами на основе Linux.

Особенности[править | править вики-текст]

Не использует обычные библиотеки преобразования текста, а основан на собственной логике. В отличие от таких утилит (и библиотек) как iconv, recode умеет преобразовывать символы, точный эквивалент которых в выходном наборе символов отсутствует.

Синтаксис[править | править вики-текст]

Параметры перекодировки указываются как

recode входная_кодировка..выходная_кодировка

Если указано имя файла (или несколько имён), то файл(ы) подвергаются перекодировке. Если имя файла не указано, то читается стандартный ввод, а результат записывается на стандартный вывод.

Примеры[править | править вики-текст]

Изменяет кодировку списка файлов из UTF-8 (Linux) в CP1251 (Windows), корректирует перевод строки

find * | recode UTF-8..CP1251/CR-LF > list.txt

Дамп[править | править вики-текст]

Если вместо имени выходной кодировки задать слово dump, то выводится список всех поданных на вход символов, по одному на каждой строке. Для каждого символа указывается код в Unicode, двухбуквенная мнемоника (если существует) и название символа.

Ссылки[править | править вики-текст]

Кодировки символов
Основы алфавиттекст (файлданные) • набор символовконверсия
Исторические кодировки Докомп.: семафорная (Макарова)МорзеБодоМТК-2
Комп.: 6-битнаяУППRADIX-50EBCDIC (ДКОИ-8) • КОИ-7ISO 646
современное
8-битное
представление
символы ASCII (управляющиепечатные) • не-ASCII (псевдографика)
8-битные код.стр. Кириллица: КОИ-8Основная кодировкаMacCyrillic
ISO 8859 1 (лат.)2345 (кир.)6789101112131415 (€)16
Windows 12501251 (кир.)1252125312541255125612571258WGL4
IBM & DOS 437850852855866 «альт.»МИКНИИ ЭВМ
Многобайтные Традиционные DBCS (GB2312) • HTML
Unicode UTF-32UTF-16UTF-8список символов (кириллица)
Связанные темы интерфейс пользователяраскладка клавиатурылокальперевод строкишрифттранслитнестандартные шрифты
Утилиты iconvrecode