Сколько байт занимает 1 символ в ascii

С помощью кодов ASCII невозможно представить все нужные символы. Для того чтобы охватить все символы существующих в мире приблизительно 6800 языков, возникла потребность в создании новой схемы кодирования. В результате появился UNICODE (произносится как «юникод»). В разработке этой системы кодирования приняли участие языковеды и компьютерщики многих стран мира. В UNICODE каждый символ представлен 16-значным числом, то есть каждый символ занимает два байта. Этот способ позволяет закодировать 65 536 различных символов.

Строка символов	Объем
Информатика	В кодировке ASCII занимает 88 бит, или 11 байт.
Информатика	В кодировке UNICODE занимает 176 бит, или 22 байта.

Следует помнить, что пробел между словами в тексте является символом, и он также вводится с клавиатуры и сохраняется в памяти.

Изучим сами

Соберите информацию из Интернета о стандартах кодирования ASCII и UNICODE.

Выясните значения каждого из сокращений.
Узнайте UNICODE-коды букв «Э» и «э».
Определите, сколько места в памяти в кодировках ASCII и UNICODE занимает сообщение «Верблюда спросили: «Что тебе нравится больше – подъем или спуск?» Он сказал: «Есть еще и третья мерзость – грязь».

Проверьте себя

Какой объем в кодировке UNICODE занимает предложение «Лгуна по глазам видно»?
Сколько раз поместится пословица «Терпение и труд все перетрут» в памяти объемом 1 Кбайт, если ее задать в кодировке ASCII?
Шахматная доска состоит из 8 строк и 8 столбцов. Какое наименьшее количество бит необходимо для того, чтобы закодировать все ячейки доски? A) 4 B) 5 C) 6 D) 7

Почему для кодирования одного символа нужен именно 1 байт?

Почему для кодирования 1-го символа нужен именно 1 байт? Я прекрасно понимаю, что минимальная единица информации — 1 бит и чтобы выразить 255 символов в двоичном коде надо использовать 8 бит. И по таблице брать двоичный код и по нему находить нужный символ, но почему каждый символ обязательно занимает 1 байт? Зачем записывать число именно вот так 0000001 , а не просто 1 , тем самым заняв всего 1 бит информации и по таблице взять ему соответствующий символ.

Отслеживать
51.6k 199 199 золотых знаков 59 59 серебряных знаков 242 242 бронзовых знака
задан 1 авг 2018 в 17:23
Никита Антонов Никита Антонов
125 1 1 серебряный знак 9 9 бронзовых знаков

Байт — минимальная адресуемая единица информации. Хранить каждый символ меньше чем в одном байте неэффективно по скорости доступа. А для длительного хранения (при сохранении в файл, например) никто не мешает применить сжатие.

1 авг 2018 в 17:27
@insolor, Use the answer form, Luke!
– user207618
1 авг 2018 в 17:34
Символы не хранят в одном байте уже лет тридцать 🙂
1 авг 2018 в 17:36

А вообще теоретически использовать один бит не разрешает, только вот 11111111 — это один символ (число 255) или восемь символов 1 ? Придётся добавлять дополнительную информацию, поясняющую, как правильно интерпретировать эти единицы. Ну и да, использовать число битов меньшее чем «минимальная адресуемая единица информации» банально неудобно, ибо именно под восьмибитный байт спроектированы все современные компьютеры

1 авг 2018 в 17:39

@andreymal, о спасибо большое! Теперь дошло! Только вот еще вопрос тоесть большие последовательности в зависимости от кодировки делятся на определенное количество байт (1, 2 и тд) и уже по таблице находится определенные символы ?

1 авг 2018 в 17:42

1 ответ 1

Сортировка: Сброс на вариант по умолчанию

Не обязательно 1 ..есть кодировки (например utf-16, utf-32 ) где символы по 2 , по 4 байта. тут еще многое зависит от количества кодируемых символов. не всегда хватает 256 вариантов. часто нужно больше.то есть битность напрямую зависит от числа символов в таблице символов. Если влезть в ассемблер, то можно сделать свою таблицу символов. проблема будет только в том что твою кодировку будет понимать только твоя программа. А так просто принятый стандарт, и все. по поводу же адресации, да — опять же стандарт. хотя есть системы , которые работают и 9-ю битами ( старые советские системы связи) , где 9-й бит был или контрольным или знак передавал.

Отслеживать
ответ дан 1 авг 2018 в 17:35
Сергей Петрашко Сергей Петрашко
1,493 7 7 серебряных знаков 15 15 бронзовых знаков

Я наверное неправильно задал вопрос имею в виду почему все символы имеют 1 и тот же размер(тоесть 2 байта или 1), а не так чтобы 1 символ весит больше, а другой меньше, если все равно старшие разряды заполнены нулями (00000001 к примеру)

1 авг 2018 в 17:38

@НикитаАнтонов в кодировке UTF-8 длина одного символа может быть 1, 2, 3 или 4 байта 🙂 А использовать число бит, не кратное восьми, неудобно из-за архитектуры современных компьютеров, заточенных именно на 8 бит

1 авг 2018 в 17:40

будут проблемы с синхронизацией. такая проблема есть в азбуке морзе. то есть трудно понять где закончился один символ и начался второй. поэтому и принято использовать такие битности.

Сколько байт занимает 1 символ в ascii