Обсуждение:Двоичный файл

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Пожалуйста, добавляйте новые темы снизу


двоичный файл или "хвост крутит собакой"[править код]

Хотел бы поднять вот какой вопрос. В некоторых статьях употребляются термины "двоичный файл", "двоичные данные" для обозначения данных с произвольной структурой и содержанием, иногда противопоставляемых "текстовым" (см. введение в Двоичный файл и третий абзац в Текстовый файл). Это совершенно некорректно, точно так же, как некорректно называть все копиры ксероксами, самолёты планерами и т.п. "Двоичность" - это всего лишь (1) форма отображения (причём всякие дампы показываются отнюдь не в двоичной форме, а в шестнадцатиричной), а также (2) основание многих (но отнюдь не всех) компьютеров. Что, если я перенесу некоторое данное с двоичного на двоично-десятичный или, не дай бог, на троичный компьютер - данные от этого изменятся? Поэтому, я хотел бы дать разъяснение этой несуразице в Двоичный файл и, где возможно, исправить использование этого сочетания. Но эта правка довольно серьёзная, поэтому хочу вначале поинтересоваться мнением других по этому поводу. -- AVBtalk 20:54, 1 августа 2008 (UTC)[ответить]

(аргументы скопированы Berserkerus с общего форума)

Кстати, а почему вам не нравиться определение «бинарные данные — файлы не являющиеся текстовыми». Эмпирически лично у меня это так. Вообще термин «двоичный файл» уместен как раз только как антоним «текстовому файлу». Сам по себе термин бессмыслен, как верно замечает AVB. --A.I. 19:45, 2 августа 2008 (UTC)[ответить]
Однако, участник AVB оспаривает не определение, а вообще уместность использования термина двоичный. Я согласен, что термин довольно странный, но название исторически сложилось, АИ куча и отказаться от статьи о нём в Википедии уже нельзя. Так в чём проблема? --A.I. 19:45, 2 августа 2008 (UTC)[ответить]
  • (отвечате сами себе? :) ) Проблема в том, что, как минимум, этот артефакт (неверная привязка названия к одному из возможных представлений), нужно явно объяснить в статье, а как максимум - найти более адекватный термин (хотя и не уверен, что это возможно, особенно с учётом традиции). -- AVBtalk 01:19, 17 августа 2008 (UTC)[ответить]
один и тот-же файл можно рассматривать и как текстовый, и как двоичный файл. упор должен быть именно на рассмотрении, как ,например, в анг. версии. разумеется , хорошо бы найти академ. АИ в этом спорном вопросе.//Berserkerus 21:53, 2 августа 2008 (UTC)[ответить]
Разве мы можем рассматривать то так, то так? XML — это всегда текстовой, а Zip — это всегда бинарный. --A.I. 05:46, 3 августа 2008 (UTC)[ответить]
  • проблемы в многозначности термина. Иногда говорят "бинарный", чтобы подчеркнуть, что там не "только печатные знаки" (т.е. содержимое не подпадает под определение текстовых данных). Иногда так говорят, когда подчёркивают, что файл может содержать всё, что угодно - и текстовые данные, и нетекстовые данные. Иногда же это характеристика того, что высказывающийся не имеет информации о структуре содержимого. И, кстати, в этой статье опять же слиты три разных термина - "данные", "формат" и "файл", причём даже без объяснения, что это разные вещи. Для текстового файла я начал разделение (хотя никак не закончу, особенно с учётом начавшейся войны), а тут ещё конь не валялся. -- AVBtalk 01:19, 17 августа 2008 (UTC)[ответить]
Давайте не будем решать, что корректно, а что не корректно. Википедия описывает то, что есть, а не то, что «должно быть». Термин «двоичный файл» используется для файлов произвольной структуры и часто как противопоставление текстовым. Статья должна описывать существующее значение термина, а не навязывать новое, «более правильное». --SergV 03:36, 3 августа 2008 (UTC)[ответить]
[Binary File]. --SergV 03:46, 3 августа 2008 (UTC)[ответить]
по порядку. определение: вы говорите "«двоичный файл» - файл произвольной структуры", а в статье написано "Двоичный (бинарный) файл — последовательность произвольных байтов." т.е. просто последовательность?! даже не Файл?//Berserkerus 15:22, 3 августа 2008 (UTC)[ответить]
Написав «именованная последовательность байт» мы не сделает статью понятной. Может сделать определение, как антоним текстовому файлу? --A.I. 17:38, 3 августа 2008 (UTC)[ответить]
Файл и есть последовательность байтов. И я, кстати, не уверен, что имя является необходимым атрибутом файла. В статье написано правильно: последовательность произвольных байтов, то есть без тех ограничений, которые накладываются на текстовые. В то же время, в двоичном файле не должны обязательно присутствовать байты со всеми возможными значениями, поэтому любой текстовый файл тоже двоичный. Скажем, если есть алгоритм для обработки двоичных (читай - любых) файлов, то ясно, что он не хуже справится и с текстовым. Другое дело, если программа предназначена для текстовых файлов - если ей подсунуть произвольный то может произойти ошибка. Вот в этих случаях их и противопоставляют. Например, программа может сказать: «файл двоичный (а не текстовый), продолжить?» --SergV 18:01, 3 августа 2008 (UTC)[ответить]
  • В статье написано правильно - скажите это, допустим, сетвеым протоколам, которые работаю не с файлами, а с данными. Во-вторых, исходный вопрос в корректности использования слова двоичный, а не в корректности определений понятий "файл", "данные" и "формат". Корректность смешивания этих понятий можно и должно пустить отдельной веткой. -- AVBtalk 01:42, 17 августа 2008 (UTC)[ответить]
Если я не ошибаюсь, но официальное определение файла (читаемое в ВУЗах) — «именованная последовательность байт». --A.I. 02:55, 5 августа 2008 (UTC)[ответить]
Из высказываний AVB не видно конструктива. Двоичность является отнюдь не средством отображения, а способом организации данных. Не столько файлы делятся на такие и сякие, сколько их форматы. Что касается других оснований, то значимы ли понятия «троичный файл», «десятичный файл» и т.д.? По-моему незначимы. Incnis Mrsi 22:48, 10 августа 2008 (UTC)[ответить]
  • Двоичность - один из способов хранения. Если мы перенесём файл с диска на магнитную ленту, суть файла от этого не поменяется. Если мы перенесём файл на троичный или квантовый компьютер (хотя квантовые компьютеры сейчас только двоичные), суть файла от этого не поменяется. Понятие "троичный файл" действительно не значимо, поскольку такого понятия не существует. Точно также, понятие "двоичный файл" - это артефакт, вызванный путаницей содержимого с (одной из) форм хранения. -- AVBtalk 01:42, 17 августа 2008 (UTC)[ответить]
"Разве мы можем рассматривать то так, то так? XML — это всегда текстовой, а Zip — это всегда бинарный." A.I. - Конечно, можем! 1) Создайте на Вашем PC файл test.zip, переименуйте в test.txt и откройте его, например, в программе Блокнот - увидите абракадабру - которая будет отображением байтов бинарного файла на используемую в данный момент таблицу кодировки. 2) Скопируйте этот текст (который сейчас читаете) в Блокнот, сохраните под именем test2.txt, переименуйте в test2.exe и дважды нажмите мышью - ОС попытается запустить файл как исполняемый двоичный (бинарный) файл. Естественно, он не запустится, поскольку его формат, прежде всего заголовок, не соответствует соглашениям (правилам), принятым в системе, о чем система Вам и сообщит. Когда говорят "двоичный файл", "текстовой файл", обычно имеют в виду, как этот файл интерпретируется программным обеспечением (прикладным или системным) или пользователем. Например, "будем рассматривать документ test.doc как двоичный файл". При этом с точки зрения устройства хранения файла - любой файл двоичный, т.е. набор нулей и единиц. Если Вы построите устройство, хранящее файл в виде набора нулей, единиц и двоек - можете говорить о троичном файле, сделаете процессор, логические элементы которого будут пребывать в трех устойчивых состояниях - можете говорить о троичной машине, такие были в 1960 гг. Кстати, переименование test.zip в test.txt и обратно позволяет обойти дурацкую защиту, которая установлена сейчас на некоторых сайтах и не позволяющую выкладывать на них архивы. Надеюсь, ответ исчерпывающий, в статье в принципе все верно, но улучшать, конечно, можно. А вот с устоявшимися терминами нам, конечно же, бороться не надо --tim2 14:37, 16 августа 2008 (UTC)[ответить]
  • переименуйте в test2.exe - кстати, хочу напомнить о существовании вируса, который внутри имел сигнатуру и структуру zip-файла. (Хотя в качестве инструкций сигнатура zip-а и бессмысленна, но формально валидна и никто не запрещает её подавать на вход процу). Те антивирусы, которые не анализировали контекст (в данном случае расширение файла) считали этот вирус безобидным архивом. с устоявшимися терминами бороться не надо - ну это ещё как посмотреть. Сравните, к примеру, кэш и кеш. Да и в любом случае, нужно как минимум объяснить, что "двоичный в названии - это результат безграмотного смешивания содержимого и формы представления". Точно так же, как есть дизамбиг ксерокс и есть объяснение в статье Копировальный аппарат (хотя там почему-то сделан акцент на эвфемизме; сейчас исправим). -- AVBtalk 01:42, 17 августа 2008 (UTC)[ответить]