Определи какие из файлов сжимаются лучше всего
Перейти к содержимому

Определи какие из файлов сжимаются лучше всего

  • автор:

Сжатие данных

В сегодняшней статье я хочу поговорить про такие программы как архиваторы. На самом деле, я уже один раз писал про бесплатный архиватор 7zip, но тогда акцент ставился на том, как установить эту конкретную программу. Сейчас же я хочу поговорить об архиваторах вообще, об их истории и принципах работы.

Идея архиваторов

data compression

Архиватор — это программа, которая сжимает данные. Так, что они становятся меньшего размера. Зачем это нужно? Раньше это было нужно очень часто, особенно, когда данные передавались на дискетах размера 1.44MB. Сейчас, конечно, места на диске становится все больше и больше, но слишком много его не бывает никогда. А если вы посылаете документы по электронной почте, то и сейчас часто можете сталкиваться с ограничениями, накладываемыми на размер пересылаемых файлов. Так что, прежде чем посылать документ, возможно, стоит его сжать.

У вас не возникает странного ощущения? Все файлы под действием сжимаются. А потом их можно снова распаковать. Такого же не может быть! Ведь более длинных файлов больше, и если все файлы уменьшаются в размере, то найдутся отличающиеся друг от друга файлы, совпадающие после сжатия! И как тогда их распаковывать? Получается, что операция неоднозначна, сжали один файл, а при распаковке можем получить совсем другой.

На самом деле, никаких противоречий нет. Идея арзиваторов очень проста. Просто архиватор сжимает не все файлы, он сжимает все «нормальные» файлы. А большинство файлов при применении к ним архиватора, наоборот, немного увеличиваются в размере. Но просто, скорей всего, вам никогда не будут попадаться такие файлы.

Логика архиваторов

Почему так происходит? А потому что все, создаваемое человеком, имеет какую-то логику. И именно эту логику и ищут архиваторы. Могут быть варианты:

  • В этом тексте часто встречается слово «архиватор». Если текст хочется сжать, можно где-нибудь определить сокращения, и дальше обозначать архиватор черех «арх». Или вообще через какой-нибудь специальный символ. Текст от этого сократится.
  • Вообще текст для компьютера слабо насыщен информацией. Мы используем порядка 60 символов (маленькие, большие буквы). Давайте сейчас для упрощения скажем, что используется не больше 64 различных символов. 64 — это 2 в шестой степени. А для хранения символа используется байт, принимающий различные 256 значений — 2 в восьмой степени. Тем самым, в случае текста 2 бита из 8 «простаивают». Если учесть это в алгоритмах сжатия данных, то сразу можно начать использовать 6 байтов на 8 символов, сокращая размер файла на четверть.
  • Аналогично, на рисунках могут быть однотонные зоны. Тогда эффективней не хранить цвета «попиксельно», а как-то описать границы зон, имеющих одинаковый цвет.

Это были лишь простые идеи, естественно, что современные архиваторы используют намного более сложные алгоритмы.

Типы архиваторов

Сначала их было очень много. Ведь программистам хотелось придумывать свои архиваторы, а стандартов не было. ZIP, ARJ, LZH, RAR, UC2, CAB, ACE, это лишь малая часть из встречавшихся архиваторов. И пользователи часто имели на своих компьютерах кучу программ для архивации — ведь никогда не было известно, в каком еще формате можно получить файл.

Потом более продвинутые разработчики стали вставлять в свои архиваторы возможность открывать архивы других типов. Тем самым необходимость иметь кучу программ пропала. А заодно некоторые типы архиваторов стали более популярными. На сегодняшний день активно используется лишь малое количество типов:

  • zip: поддержка zip встроена в windows уже достаточно давно. Пользователь может, в принципе, и не знать, что он пользуется архиватором — объект может называться как «сжатая папка», работа с ней может особо не отличаться от работы с папками обычными.
  • gzip: архиватор, используемый чаще всего под Линуксом Также, как и под Windows, современные графические оболочки работают с архивами практически как с обычными папками.
  • rar: независимый и до сих пор достаточно распространенный архиватор. Особенностью rar является то, что это — коммерческий алгоритм. Публичным является только алгоритм распаковки, а вот для сжатия данных может использоваться только официальная платная программа winrar. Поэтому в windows отсутствует поддержка rar, требуется установка чего-либо. Некоторое время я уже писал о бесплатном архиваторе 7zip, умеющем открывать rar. А под Линуксом проще всего установить пакет unrar; например, под Ubuntu это делается выполнением команды sudo apt-get install unrar.

Есть и другие типы, но я не буду на них останавливаться.

Эффект от архиваторов

Разные файлы сжимаются по-разному, так что и эффект от архифаторов может быть разный. Тексты — отлично, а вот, например, картинки большинства форматов — очень плохо, поскольку в них уже используется свое собственное сжатие, я уже писал об этом в статье про форматы изображений.

Я хотел в этой статье добраться и до использования архивов с паролями для защиты секретных данных, но статья получилась уже достаточно длинной, так что об этом — в другой раз!

  • Основы интернета (11)
  • Настройки интернета (17)
  • Настройки Windows (17)
  • Программы для Windows (12)
  • Интересное в интернете (33)
  • Настройка сайта (18)
  • Развлечения в интернете (13)
  • Опасный интернет (23)
  • Развитие интернета (18)
  • Интернет сервисы (29)
  • Линукс для начинающих (8)
  • Деньги в интернете (11)
  • Цифровая фотография (12)

Файл: что такое, его имя, свойства, формат, части. Информатика

Статья ознакомит с понятием файловой системы (ФС), файла в среде Windows, их свойствами и характеристиками. Кратко рассмотрим принципы хранения, адресации информации на компьютере, разберёмся, из чего состоит имя файла (документа), с правилами написания их имён.

Файловая система в информатике: что это

Долговременно информация на компьютере хранится на энергонезависимых элементах памяти – твердотельных и жёстких дисках. Физически она представляет собой последовательность единиц и ноликов. На накопителе они хранятся в виде электрических или магнитных зарядов.

Для хранения информации на накопителе его необходимо отформатировать – сформировать файловую систему – это в информатике порядок, методика организации хранения данных на цифровых носителях. От неё зависит формат файлов, их атрибуты, способ записи на накопитель, порядок обращения, свойства, возможности (работа с архивными версиями, разделение прав доступа).

Файловая система в информатике: что это

На устройствах с ОС Windows наиболее распространены ФС FAT32 (старая) и NTFS.

Что такое файл, путь к нему

Данные на цифровых носителях хранятся в виде документов – это адресуемая область памяти на накопителе, единица, базовый объект при работе программного обеспечения с данными. В графическом интерфейсе (Проводнике) выглядит как объект с именем и разрешением. Разберёмся, из каких двух частей состоит имя файла.

Что такое файл, путь к нему

Физически файл – это контейнер, внутри которого определённым образом сосредоточена информация. Способ её размещения, позволяющий считывать и записывать данные внутрь контейнера называется форматом. Программы и ОС для работы с данными обращаются к файлам как элементарным единицам цифрового объекта. Информацию об адресах ячеек, последовательности обращения к ним для считывания содержимого контейнера им сообщает драйвер ФС.

В ОС UNIX документами являются даже порты и периферийные устройства.

Имена и адреса

  • Название диска.
  • Наименование каталога с подкаталогами (если такие имеются).
  • Имени самого объекта.
  • Его разрешения – идентификатора, указывающего на внутреннюю структуру, формат данных.

В операционных системах Windows полное имя файла любого типа (графического, исполняемого, мультимедийного) состоит из нескольких частей. Например, C:\Windows\system32\calc.exe:

  • C:\ – устройство хранения, диск – буква английского алфавита. После неё ставится двоеточие.
  • Windows\system32 – иерархия каталогов, путь в папке с объектом.
  • Calc.exe – имя файла, состоит из двух частей: название – calc и указанного через точку расширения – exe.

Имена и адреса

Имена документам дают приложения, в которых они создаются, или пользователи. Для экономии дискового пространства и трафика во время передачи по сети файлы архивируют – сжимают. Видео, установщики, аудио, многие графические документы сжаты по умолчанию, текстовые (txt, docx) и несжатые типы (bmp, aiff, wav, raw – исходники фото с цифровых камер) архивируются лучше всего.

Расширение – не обязательная часть документа. Оно служит для идентификации объектов пользователем, операционной системой и программами, указывает на формат файла. ОС устанавливает взаимосвязь, ассоциацию между разрешением и приложениями. При открытии пользователем документа он автоматически загружается в привязанную к разрешению программу. Если это file.docx – открывается через Word, mp3 – загрузится в аудиоплеер, а mp4 – воспроизводит мультимедийный проигрыватель.

Расширение – не обязательная часть документа

Если объект хранится в сети, перед его полным путём указывают:

  • Метод доставки, протокол: https, ftp.
  • Адрес хоста или узла сети: bingoschool.ru.

В одной директории не могут размещаться два объекта с одинаковыми именами и расширениями. В распространённых в Windows ФС строчные и заглавные буквы идентичны: File.avi, FILE.mp3 и file.mp3 – одно имя.

Длина участков имени (названия каждого каталога в пути) для NTFS ограничена 255 символами, общая длина пути – 32 000 знаками. Файл с названием длиной 255 символов может храниться в 124 подкаталогах с максимальной длиной наименования.

В имени допустимо использование символов Unicode за исключением ряда специальных знаков: двойной кавычки, черты и косой черты, вертикальной линии, вопросительного знака, звёздочки, двоеточия, знаков «больше» и «меньше».

Для документов в Windows предусмотрены атрибуты – метаданные, дополнительная информация, описывающая их. В Windows предусмотрено четыре атрибута со значением «Активно» либо «Отключено». Это:

  • Архивный – применяется в резервном копировании, значит, что объект подвергался изменению со времени последнего резервирования.
  • Скрытый – не отображается в Проводнике и файловых менеджерах до включения специального режима.
  • Системный – критически важный для функционирования ОС.
  • Только чтение – запрет на изменение документа.

Устанавливаются и снимаются атрибуты в свойствах документа (вызываются правой клавишей мыши).

Устанавливаются и снимаются атрибуты в свойствах документа (вызываются правой клавишей мыши).

Тесты

  1. Приложение, где он создаётся.
  2. Программа или пользователь.
  3. Юзер вручную.
  4. Операционная система.

Определите, какие из файлов сжимаются лучше всего:

Что такое полное имя файла:

  1. Путь к нему, включающий название диска и подкаталогов.
  2. Название с расширением.
  3. Путь к документу с именем и расширением.
  4. Имя до точки.

Формат данных в информатике это:

  1. Полный путь.
  2. Способ организации информации на накопителе.
  3. Методика описания структуры данных на носителе.
  4. Часть имени, расположенная после точки.

Укажите допустимые имена файлов:

  1. E:\Films\7_shagov_1968.mp4.
  2. D:/Music/Hit!/Avtor – track.mp3.
  3. E:\Video\Этот мир исчез? (2019).mp4
  4. C:\Program Files\Antivirus: Comodo Security.

Определи, какие из файлов сжимаются лучше всего.

1)disk.txt
2)archive.gif
3)disk
4)money.ms
5)archive
6)money
Несколько нужно выбрать.

Голосование за лучший ответ

тхт наверное

Где больше всего избыточных данных, там и сжимать можно больше. BMP в PNG охрененно сжимается, а в jpeg еще больше.

Похожие вопросы

Ваш браузер устарел

Мы постоянно добавляем новый функционал в основной интерфейс проекта. К сожалению, старые браузеры не в состоянии качественно работать с современными программными продуктами. Для корректной работы используйте последние версии браузеров Chrome, Mozilla Firefox, Opera, Microsoft Edge или установите браузер Atom.

Лучшие архиваторы. Часть 1

Объем используемых цифровых носителей неуклонно растет. Количество данных, которые переносятся с одного компьютера на другой, исчисляются уже не мегабайтами, как это было еще несколько лет назад, а гигабайтами и даже терабайтами.

Казалось бы, при таком большом объеме информации, проблема нехватки свободного пространства на носителе должна была бы полностью исчезнуть. Однако и сегодня нередко можно попасть в ситуацию, когда ваш любимый Неро отказывается записывать DVD-диск, ссылаясь на нехватку свободного места на лазерном диске. В этом случае приходится прибегать к архивации файлов и подбирать оптимальный формат с максимальной степенью сжатия.

Архивирование файлов используется также при резервном копировании данных. Программы для бекапа в последнее время получили широкое распространение именно по причине того, что объем жестких дисков возрос. При выходе носителя информации из строя теряется огромное количество данных, поэтому создание резервной копии — это уже такая же привычная мера предосторожности, как и использование антивируса.

Архивируют файлы обычно еще и для того, чтобы они занимали меньше места на жестком диске. Также сжатие необходимо при пересылке файлов по электронной почте, копировании информации на другие компьютеры и т.д.

Для архивирования файлов используются специальные программы — архиваторы. Это программы, предназначены для упаковки файлов путем сжатия хранимой в них информации. Сжатие — это процесс преобразования информации, которая содержится в файле, к виду, при котором убирается все лишнее, в результате чего уменьшается размер файла. Такими «лишними» данными в файлах могут быть повторяющиеся символы, постоянные биты и т.д. Соответственно, и методы сжатия могут быть разными.

  • Во-первых, большое значение имеет тип сжимаемых данных. Лучше всего сжимаются графические, текстовые файлы. Для них степень сжатия может быть от пяти до сорока процентов. Хуже сжимаются файлы исполняемых программ, загрузочных модулей, файлы мультимедиа.
  • Во-вторых, большое значение имеет метод сжатия.
  • В-третьих, немаловажно и то, какой архиватор используется. При выборе типа архиватора обычно руководствуются следующими соображениями: чтобы степень сжатия была как можно выше, а времени на упаковку и распаковку файлов уходило как можно меньше.

На сегодняшний день наиболее распространенными являются четыре архиватора — WinRar, WinAce, 7Zip и WinZip. Что касается последней программы, она не выдерживает никакой критики.

Несмотря на широкую известность и громкую рекламную кампанию, благодаря которой программа перекочевала на сотни тысяч компьютеров, WinZip проигрывает конкурентам по всем параметрам. Поэтому в рамках этого обзора мы рассматривать его не будем.

 WinZip

WinRar 3.50 Beta 1

WinRar может ассоциироваться со следующими типами файлов: RAR, ZIP, CAB, ARJ, LZH, ACE, 7-Zip, TAR, GZip, UUE, BZ2, JAR, ISO, Z.

 WinRar

Программа поддерживает файлы практически неограниченного размера (до 8,589,934,591 Гб). Правда, для работы с файлами размером более 4 Гб вам необходимо работать в файловой системе NTFS.

  • Несмотря на то, что WinRAR поддерживает формат ZIP, в большинстве случаев рекомендуется выбирать RAR. Это обеспечит более высокий уровень сжатия. Вы можете сжать файлы в ZIP, если вы не уверены, что на компьютере, на котором будут распакованы файлы, будет установлена программа, с помощью которой можно будет распаковать файлы в формате RAR.
  • Необходимо определиться, какой метод компрессии лучше всего использовать. Чем выше степень сжатия, тем больше времени уйдет на архивацию, поэтому тут нужно учитывать, для каких целей архивируются данные. Если это долгосрочное хранение, конечно же, имеет смысл подождать и получить архив с максимальной степенью сжатия, если же вам просто необходимо отослать несколько документов по почте, вам подойдет и обычная (Normal) степень сжатия.

Если вам необходимо достичь максимальной степени сжатия файлов, используйте опцию Create solid archive (Создать непрерывный архив). Однако, она имеет и свои недостатки. Во-первых, для распаковки таких файлов понадобится больше времени, чем для извлечения из обычного архива. Представьте себе, что в вашем архиве две стони файлов. Если он создан обычным способом, вы без труда можете извлечь один из файлов. Если же вы использовали solid archive, тот тут будет иметь значение, каким по счету бы заархивирован нужный вам файл. Если он был в середине второй сотни, то для его распаковки программе будет нужно распаковать 150 файлов, пока она доберется до него. Создание архивов таким способом также может повлечь за собой большие утраты, ведь если архив окажется поврежден, вы потеряете все файлы, которые в нем находились. В случае же запаковки обычным способом вы сможете извлечь из поврежденного архива пусть не все, но большинство файлов.

Если необходимо создать большой архив, на это может уйти довольно много времени. WinRar позволяет определить, сколько примерно времени уйдет на выполнение того или иного задания. Для этого предназначена опция Benchmark and hardware test. Еще одна причина, по которой можно использовать эту опцию — определение возможных ошибок, которые могут возникнуть при архивации на компьютере той или иной конфигурации по причине аппаратного сбоя.

Среди других настроек WinRar’a можно отметить возможность создания самораспаковывающихся архивов с указанием пути распаковки. Такие файлы не требуют наличия на компьютере, на котором их планируется разархивировать, программы-архиватора. Подобные архивы получили название SFX-archives. Их недостатком по сравнению с обычными архивными файлами является больший размер, так как они, кроме собственно запакованных файлов, содержат также исполнительный EXE-модуль.

Cодержимое RAR-архива можно сделать невидимым. Для этого в настройках программы, в окне Archiving with Password нужно установить флажок напротив строки Encrypt File Names.

 WinRar

Можно также установить пароль на открытие архива.

В результате ошибки передачи архива по локальной сети или скачивания его из Интернета, а также по причине аппаратного сбоя или вирусной атаки архив может быть поврежден. WinRar позволяет определить целостность данных, протестировав архив с помощью опции Test Archived Files.

Для того чтобы свести к минимуму вероятность потери данных, при создании архивов WinRar рекомендуется использовать опцию Put Recovery Record (этот флажок можно найти на вкладке General окна создания архива).

 WinRar

Если это было сделано, то в случае повреждения архива его можно будет восстановить.

Кроме этого в WinRar, можно уменьшить вероятность повреждения RAR-архива, указав при его создании размер информации для восстановления. Для этого нужно выполнить команду Commands > Protect Archive From Damage в окне Winrar. При этом объем Recovery Record не может превышать десяти процентов от общего размера архива.

Для восстановления поврежденных RAR-архивов необходимо выбрать нужный файл в окне WinRar и выполнить команду Tools > Repair.

WinRAR умеет встраиваться в контекстное меню, причем поддерживает не только меню Проводника, но и других программ, например популярного файлового менеджера Total Commander. Это дает возможность быстро архивировать файлы, используя настройки по умолчанию и не открывая для этого окно программы. Кстати, настройки по умолчанию можно изменить, в соответствии с тем, какие требования вы предъявляете к своим архивам. Сделать это можно, открыв окно WinRar и выполнив команду Options > Settings. В этом окне нужно перейти на вкладку Compression и нажать кнопку Create Default. Настройки, заданные в этом окне и будут использоваться для быстрой архивации.

Если же требуется изменить настройки архивации, это тоже можно сделать при помощи контекстного меню. Для этого нужно выбрать команду Add to Archive… Тут можно установить формат и степень сжатия, указать имя архива и выбрать другие параметры архивации.

WinRar позволяет сохранять установленные пользователем настройки в файл с расширением Reg. Позднее этот файл можно импортировать в программу, чтобы повторно использовать заданную конфигурацию. В этом файле хранится такая информация, как история архивов, которые недавно создавались, параметры сжатия по умолчанию и пр.

Еще одна удобная опция Winrar — возможность создания собственных закладок — Favorities. Очень часто бывает необходимо производить регулярное архивирование одних и тех же папок на жестком диске. Добавив в закладки информацию о месторасположении этих папок, можно быстро переходить в них в окне программы и производить архивацию необходимых файлов и вложенных директорий.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *