Какие бывают коды в информатике
Перейти к содержимому

Какие бывают коды в информатике

  • автор:

1. Кодирование информации

Информация, которую мы получаем из окружающего мира, поступает к нам в виде условных знаков или сигналов самой разной физической природы.

Это свет, звук, запах, касания; это слова, значки, символы и т. п.
При передаче информации необходимо принять и расшифровать сигнал.

Услышав гудок поезда, мы понимаем, что скоро вблизи будет проезжать железнодорожный состав. Школьный звонок сообщает о начале/конце урока.

Для правильного восприятия разных сигналов требуется разработка кода, или кодирование.
Код — это система условных знаков для представления информации.

Кодирование — это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода.

Обратный процесс называется декодированием.
Декодирование — это процесс восстановления содержания закодированной информации.
Способы кодирования информации:

  • при помощи чисел — числовой .
  • Кодирование при помощи знаков того же алфавита, что и исходный текст — символьный .
  • Кодирование при помощи рисунков и значков — графический .

Множество кодов очень прочно вошло в нашу жизнь. Так,

  • числовая информация кодируется арабскими, римскими цифрами и др.
  • Для общения и письма мы используем код — русский язык, в Китае — китайский и т. д.
  • С помощью нотных знаков кодируется любое музыкальное произведение, а на экране проигрывателя вы можете увидеть громкий или тихий звук, закодированный с помощью графика.
  • Часто бывает так, что информацию надо сжать и представить в краткой, но понятной форме. Тогда применяют пиктограммы, например на двери магазина, на столбах в парке, на дороге.

Для передачи информации людьми были придуманы специальные коды, к ним относятся:

  • азбука Брайля,
  • азбука Морзе,
  • семафорная азбука и др.

Кодирование информации

В разных отраслях науки, культуры и техники разработаны специальные формы для записи информации.

Код — это группа обозначений, которую можно использовать для отображения информации.

Процесс преобразования сообщения в комбинацию символов в соответствии с кодом называется кодированием .

Существует три основных способа кодирования информации:

  • Числовой способ — с помощью чисел.
  • Символьный способ — информация кодируется с помощью символов того же алфавита, что и исходящий текст.
  • Графический способ — информация кодируется с помощью рисунков или значков.

Примеры кодирования информации:

— для отображения звуков русского алфавита используют буквы (АБВГДЕЁЖ…ЭЮЯ);

— для отображения чисел используют цифры (0123456789);

— звуки записывают нотами и другими символами;

— слепые используют азбуку Брайля, где буква состоит из шести элементов: дырочек и бугорков.

Азбука Брайля

Надо учитывать, что не зная принципы кодирования информации, один и тот же код, можно понять по-разному, например, число 300522005 можно посчитать за число, номер телефона или за количество населения.

В компьютере кодируют введённую информацию: текст, изображения и звуки. В закодированном виде компьютер обрабатывает, хранит и пересылает информацию. Чтобы вывести информацию из компьютера в понятной для человека форме, её надо декодировать .

Методами шифрования занимается специальная наука — криптография .

В компьютере для кодирования любой информации используются только два символа: 0 и 1 , так как компьютерной технике проще реализовывать два состояния:

0 — сигнала нет (нету напряжения или не течёт ток);

1 — сигнал есть (есть напряжение или течёт ток).

Создание кода.

Одним битов можно кодировать два состояния: 0 и 1 (да и нет, чёрный и белый). При увеличении количества битов на один получится в два раза больше кодов.

Пример:

Два бита создают 4 разных кода: 00, 01, 10 и 11;

три бита создают 8 разных кодов: 000, 001, 010, 011, 100, 101, 110, и 111.

Кодирование различных видов информации

Кодирование текстов

При кодировании текста каждому символу присваивается какое-то значение, например, порядковый номер.

Первый популярный компьютерный стандарт кодирования текста имеет название ASCII (American Standart Code for Information Interchange), в котором для кодирования каждого символа используются 7 бит.

7-ю битами можно закодировать 128 символов: большие и маленькие латинские буквы, цифры, знаки препинания, а так же специальные символы, например, «§».

Стандарту создавали разные варианты, дополняя код до 8 бит (256 символов), чтобы можно было кодировать национальные символы, например, латышскую букву ā.

Но 256 символов не хватило, чтобы кодировать все символы разных алфавитов, поэтому создали новые стандарты. Один из самых популярных в наше время, это UNICODE. В котором каждый символ кодируют 2-мя байтами, получается в итоге 62536 разных кодов.

Кодирования графических данных

Почти все созданные и обработанные изображения, хранящиеся в компьютере, можно поделить на две группы:

Любое изображение созданное в растровой графике состоит их цветных точек. Эти точки называют пикселями (pixel) .

Пример увеличенной линии

Код пикселя содержит информацию о его цвете. Например, два цвета (чёрный — 0, белый — 1) на предыдущей картинке выглядят так в виде двоичного кода.

Для кодирования не цветных изображений обычно используют 256 оттенков серого, начиная от белого, заканчивая чёрным. Для кодирования всех цветов надо 8 битов (1 байт).

Для кодирования цветных изображений обычно используют три цвета: красный, зелёный и синий. Цветной тон получается при смешивании этих трёх цветов.

Размер изображения можно посчитать, умножив его ширину на длину в пикселях. Например, изображение размером 200⋅100 пикселей, занимает 60000 байт.

Кодирование звуков

Звуки появляются из-за колебаний воздуха. У звука есть две величины:

амплитуда колебания, которая указывает на громкость звука;

частота колебания, которая указывает на тональность звука.

Звук можно переделать в электрический сигнал, например, микрофоном.

Звук кодируют, после точного интервала времени измеряя размер сигнала и присваивая ему бинарную величину. Чем чаще проводятся эти измерения, тем лучше качество звука.

Пример:

На одном компакт диске, с объемом 700 Мб, может вместиться 80 минут звука CD качества.

Кодирование видео

Фильм состоит из кадров, которые быстро меняются. Кодированный фильм содержит информацию о размере кадра, используемых цветах, и количество кадров в секунду (обычно 30), как и способ записи звука — каждому кадру отдельно или всему фильму сразу.

Полезные ссылки

  • Виды знаков по способу восприятия
  • Использование символов для живых существ
  • Пиктограммы
  • Сигналы
  • Символы
  • Один и тот же символ может обозначать различную информацию
  • Практикум «Простейшие методы шифрования текста»
  • «АЛФАВИТНЫЙ ПОДХОД К ИЗМЕРЕНИЮ ИНФОРМАЦИИ»
  • Плакат «КОДИРОВАНИЕ ТЕКСТА. ТАБЛИЦА КОДИРОВКИ»
  • «Язык жестов»
  • Flash-ролик «Понятие код» (ЦОР)
  • Flash-ролик «Длина кода» (ЦОР)
  • Flash-ролик «Примеры кодов» (ЦОР)
  • Flash-ролик «Таблица перекодировки» (ЦОР)
  • Flash-ролик «Кодирование информации при устном общении» (ЦОР)
  • Flash-ролик «Кодирование информации при переписке» (ЦОР)
  • Flash-ролик «Перекодирование информации» (ЦОР)
  • Flash-ролик «Помехи при передаче информации» (ЦОР)
  1. Задание «Шифрование букв при помощи цифр» (ЦОР)
  2. Задание «Декодируйте пословицы» — №1, №2, №3 (ЦОР)
  3. Задание «Определение типа алфавита и алфавитное кодирование» (ЦОР)
  4. ЯКласс задания «В мире кодов»
  5. ЯКласс задания «Способы кодирования информации»

Кодирование информации

Обычно в процессе кодирования информация преобразуется из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической обработки. В более узком смысле кодированием информации называют представление информации в виде кода. Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Код

Определение:
Пусть [math]U[/math] — множество исходных символов, [math]Z[/math] — кодовый алфавит, [math]Z^*[/math] — множество всех строк конечной длины из [math]Z[/math] .
Код (англ. code) — отображение [math]c : U \rightarrow Z^*[/math] и [math]c^* : U^* \rightarrow Z^*[/math] так, что [math]c^*(x_1 x_2 . x_n) = c(x_1)c(x_2)..c(x_n)[/math]
Виды кодов
  • Код фиксированной длины (англ. fixed-length code) — кодирование каждого символа производится с помощью строк одинаковой длины. Также он называется равномерным или блоковым кодом.
  • Код переменной длины (англ. variable-length code) — кодирование производится с помощью строк переменной длины. Также называется неравномерным кодом.
    • Префиксный код — код, в котором, никакое кодовое слово не является началом другого. Аналогично, можно определить постфиксный код — это код, в котором никакое кодовое слово не является концом другого.

    Все вышеперечисленные коды являются однозначно декодируемыми — для такого кода любое слово, составленное из кодовых слов, можно декодировать только единственным способом.

    Примеры кодов
    • ASCII — блочный.
    • Код Хаффмана (англ. Huffman code) — префиксный.
    • Азбука Морзе — не является ни блочным, ни префиксным, тем не менее, однозначно декодируемый засчет использования пауз.

    Однозначно декодируемый код

    Определение:
    Однозначно декодируемый код (англ. uniquely decodable code) — код, в котором любое слово составленное из кодовых слов можно декодировать только единственным способом.

    Пусть есть код заданный следующей кодовой таблицей:

    [math]a_1 \rightarrow b_1[/math]

    [math]a_2 \rightarrow b_2[/math]

    [math]a_k \rightarrow b_k[/math]

    Код является однозначно декодируемым, только тогда, когда для любых строк, составленных из кодовых слов, вида:

    Всегда выполняются равенства:

    Заметим, что если среди кодовых слов будут одинаковые, то однозначно декодировать этот код мы уже не сможем.

    Префиксный код

    Определение:
    Префиксный код (англ. prefix code) — код, в котором никакое кодовое слово не является префиксом какого-то другого кодового слова.

    Предпочтение префиксным кодам отдается из-за того, что они упрощают декодирование. Поскольку никакое кодовое слово не выступает в роли префикса другого, кодовое слово, с которого начинается файл, определяется однозначно, как и все последующие кодовые слова.

    Пример кодирования

    [math] c(a) = 00 [/math]

    [math] c(b) = 01 [/math]

    [math] c(c) = 1 [/math]

    Закодируем строку [math]abacaba[/math] :

    Такой код можно однозначно разбить на слова:

    [math]00\ 01\ 00\ 1\ 00\ 01\ 00[/math]

    Преимущества префиксных кодов

    • Однозначно декодируемый и разделимый
    • Удается получить более короткие коды, чем с помощью кода фиксированной длины.
    • Возможности декодировки сообщения, не получая его целиком, а по мере его поступления.

    Недостатки префиксных кодов

    • При появлении ошибок в кодовой комбинации, при определенных обстоятельствах, может привести к неправильному декодированию не только данной, но и последующей кодовой комбинации, в отличии от равномерных кодов, где ошибка в кодовой комбинации приводит к неправильному декодированию только ее.

    Пример неудачного декодирования

    Предположим, что последовательность [math]abacaba[/math] из примера передалась неверно и стала:

    [math]c^<**>(abacaba) = 0001001\ 1\ 00100[/math]

    Разобьем ее согласно словарю:

    [math] 00\ 01\ 00\ 1\ 1\ 00\ 1\ 00[/math]

    [math]a\quad b\quad a\ c\ c\quad a\ c\ a[/math]

    Полученная строка совпадает только в битах, которые находились до ошибочного, поэтому декодирование неравномерного кода, содержащего ошибки, может дать абсолютно неверные результаты.

    Не префиксный однозначно декодируемый код

    Как уже было сказано, префиксный код всегда однозначно декодируем. Обратное в общем случае неверно:

    [math] c(a) = 1 [/math]

    [math] c(b) = 12 [/math]

    [math] c(c) = 31 [/math]

    Закодируем [math]abbca[/math] , получим кодовую строку: [math]11212311[/math]

    Мы можем ее однозначно декодировать, так как знаем, что слева от двойки и справа от тройки всегда стоит единица.

    После декодирования получаем: [math]abbca[/math]

    См. также

    • Представление символов, таблицы кодировок
    • Неравенство Крафта
    • Неравенство Макмиллана

    Источники информации

    • Wikipedia — Prefix code
    • Томас Кормен, Чарльз Лейзерсон, Рональд Ривест, Клиффорд Штайн. «Алгоритмы. Построение и анализ» — «Вильямс», 2011 г. — 1296 стр. — ISBN 978-5-8459-0857-5, 5-8459-0857-4, 0-07-013151-1
    • Джеймс Андерсон. «Дискретная математика и комбинаторика» — «Вильямс», 2004 г. — 960 стр. — ISBN 978-0-13-086998-2
    • Новиков. Ф.А. «Дискретная математика для программистов» — «Питер», 2001 г. — 304 стр. — ISBN 5-94723-741-5 978-5-94723-741-2
    • Алексеев В.Б. «Дискретная математика (II семестр)»
    • Дискретная математика и алгоритмы
    • Представление информации

    Кодирование информации: виды и способы кодирования

    Справочник

    Информация может быть разного вида, характера: вкус, запах, звук, видео, текстовая, символьная, выраженная в знаках. В отраслях науки, техники и производстве применяются разные варианты кодирования информации, специальные методы и формы.

    Определение 1

    Кодирование информации — это трансформация информации из одной формы в другую, более удобную для ее передачи, обработки, хранения с помощью некоторого кода.

    Системы кодирования информации

    Определения 2 — 5

    Существуют разные системы кодирования информации — это комплекс правил и закономерностей, обозначения данных в виде определенного кода.

    Код — это система знаков, символов, которые необходимы для передачи данных, это закономерность отражения одного комплекта знаков в другом.

    Двоичный код — это вариант передачи, хранения, представления информации с применением 2 вариантов знаков — 0 и 1, который применяется в вычислительной технике.

    Двоичное кодирование информации возможно с помощью кода различной длины, при этом число знаков в коде зависит от представленной закодированной информации.

    Информация в двоичной системе кодируется с помощью бита.

    Бит — это символ кодирования информации, цифра в двоичной системе: 0 или 1.

    Один бит может закодировать только два варианта значений: 0 или 1.

    Два бита могут быть кодом уже для четырех вариантов: 01, 10, 00, 11.

    Три бита могут кодировать 8 значений: 001, 010, 100, 101, 111, 110, 011.

    И так далее. Увеличение количества битов соответственно увеличивает количество вариантов значений, которые можно закодировать.

    Виды и способы кодирования информации

    Современная компьютерная техника может обрабатывать графическую, числовую, текстовую, звуковую информацию, видеоматериалы. Компьютер может хранить и обрабатывать только один вариант представления данных — числовой. Техническому устройству легче распознавать только 2 варианта сигнала, поэтому вся информация, которая вносится в компьютер должна переводиться в цифровой вид.

    Выделяют следующие средства и способы кодирования информации:

    • числовой — это кодирование данных при помощи чисел
    • графический способ — это запись информации на устройстве при помощи значков, рисунков, линий
    • символьный — данные кодируются при помощи символов, которые использованы для написания исходного текста.

    К основным видам кодирования данных относят:

    1. Кодирование цвета.
    2. Кодировка текстовой информации.
    3. Кодировка числовых данных.
    4. Кодировка графики.
    5. Кодирование видеозаписи.
    6. Кодирование звуковой информации.

    Кодирование цвета

    Процесс кодирования информации в цветном изображении с использованием двоичной системы происходит следующим образом. Изначально фото разделяется на огромное число мелких цветных точек — пикселей. Затем цвет каждого пикселя при помощи бинарного кода записывается на устройстве.

    Например, если размер фото 325×325, то оно представится в виде матрицы в 105625 байт, которое получим путем умножения числа точек по вертикали на число точек по горизонтали.

    Раскладка изображения на точки возможна при помощи любого современного фото- или видео- прибора. Например, если в описании камеры указано, что она на 12 Mega Pixels, то это означает, что камера раскладывает полученное изображение на 12 миллионов пикселей для записи в двоичной системе кодирования информации. Чем больше количество пикселей, на которое прибор делит фото для передачи данных, тем более реалистичное, яркое, четкое изображение получится после раскодировки, при воспроизведении на экране или после печати фото.

    При этом следует отметить, что качество кодирования изображения с помощью бинарного кода определяется количеством точек, на которое оно бьется, а также цветовым разнообразием пикселей при кодировке. Способов записи цвета при двоичном кодировании несколько, самый популярный вариант — это система RGB (по первым буквам цветов на английском языке: Red — красный, Green — зеленый, Blue — синий). При смешивании этих 3 цветов в разных соотношениях образуются различные цвета и оттенки при кодировке изображений. Алгоритм записи RGB состоит в том, что каждый пиксель фиксируется в двоичном коде с указанием количества красного, зеленого и синего цвета в его составе.

    Чем больше количество битов, с помощью которых кодируется каждый пиксель, тем больше вариантов оттенков можно передать с помощью кода, а значит тем больше вариантов цветовой насыщенности фото, тем больше глубина цвета изображения.

    Полученное изображение называется растровым, что значит изображение, полученное с помощью сетки, мозаики пикселей на экране, бумаге, другом устройстве. Эта техника формирования изображения самая распространенная.

    Кодирование текстовой информации

    Любой вариант текстовой информации представлен с помощью последовательности определенных символов: цифр, букв, схем, диаграмм, таблиц, знаков математических действий и т.п.

    В компьютерной технике текстовое кодирование информации и ее хранение осуществляется с использованием двоичного кода. Для этого каждому символу присваивается определенное неотрицательное число, или код символа, которое записывается в память вычислительной аппаратуры с помощью двоичного кода. При этом соотношение между символами и знаками их кодировки называется системой кодировки. В компьютерной технике применяется система кодировки ASCII. В данной системе применяется для кодирования одного символа 7 бит, с помощью которых можно закодировать 128 символов, но этого было недостаточно.

    При разработке программного обеспечения ПК был создан 8-битный стандарт кодировки текстов, что дало возможность увеличить диапазон кодирования информации до 256 символов. При этом первые 128 символов соответствуют стандартам ASCII, а остальная половина имеет свои специфику, связанную с языковыми региональными особенностями.

    Но и 256 символов не хватило, поэтому разрабатывали новые стандарты, так появился стандарт UNICODE, при кодировке в этой системе каждому символу соответствует 2 байтами, в итоге получается 62536 разных кодировок.

    Кодировка числовых данных

    Для кодирования чисел имеет значение цель, с которой проводится кодирование: арифметические вычисления или для ввода данных. Все числовые данные кодируются при помощи бинарного кода, состоящего из 0 и 1, эти символы имеют название — биты.

    Этот метод кодирования самый популярный, он легко может быть реализован, прост в технологическом плане: если сигнал есть — значит 1, отсутствие сигнала — это 0.

    Единственный недостаток бинарной системы кодирования — это длинный код, но с технической точки зрения, это удобнее, так как длинный код из простых однотипных компонентов легче передать, чем короткий из сложных и запутанных символов.

    Целые числа кодируются при помощи перевода их в другую систему счисления, с использованием 80-разрядного кодирования.

    Кодирование графической информации

    Для кодировки изображения, кроме растровой техники, широко применяется векторная техника передачи изображения.

    Изображения, полученные с помощью векторной графики, представляют собой не точки, а формируются их графических элементов: линий, окружностей, фигур и т.п.

    Определение 6

    Векторная техника передачи изображения — это графика с применением чертежных элементов, она создается при помощи компьютерной техники, активно применяется в создании дизайн-проектов, графическом оформлении и создании макетов, схем, рекламных изображений, плакатов и т. п.

    Векторное изображение записывается в двоичной системе кодирования информации при помощи графических примитивов, с указанием их точных размеров, форм, цвета заливки, расположения элементов относительно друг друга и других свойств.

    Например, для кодирования с применением двоичного кода круга с помощью векторной техники, ПК достаточно закодировать вариант объекта (круг), центр объекта, радиус, толщину, цвет линий, вариант заливки. А для кодирования этого круга при помощи растровой графики необходимо было бы шифровать в двоичной системе каждый пиксель изображения, для чего необходимо значительно больше места в памяти устройства.

    Следует отметить, что векторная графика не дает возможность записывать в двоичном коде фото близкие к реальному изображению, поэтому вся фото- видео аппаратура работает только при помощи растровой графической системы.

    Нет времени решать самому?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *