Сколько байт занимает 1 символ в ascii

С помощью кодов ASCII невозможно представить все нужные символы. Для того чтобы охватить все символы существующих в мире приблизительно 6800 языков, возникла потребность в создании новой схемы кодирования. В результате появился UNICODE (произносится как «юникод»). В разработке этой системы кодирования приняли участие языковеды и компьютерщики многих стран мира. В UNICODE каждый символ представлен 16-значным числом, то есть каждый символ занимает два байта. Этот способ позволяет закодировать 65 536 различных символов.
| Строка символов | Объем |
| Информатика | В кодировке ASCII занимает 88 бит, или 11 байт. |
| В кодировке UNICODE занимает 176 бит, или 22 байта. |
Следует помнить, что пробел между словами в тексте является символом, и он также вводится с клавиатуры и сохраняется в памяти.
Изучим сами
Соберите информацию из Интернета о стандартах кодирования ASCII и UNICODE.
- Выясните значения каждого из сокращений.
- Узнайте UNICODE-коды букв «Э» и «э».
- Определите, сколько места в памяти в кодировках ASCII и UNICODE занимает сообщение «Верблюда спросили: «Что тебе нравится больше – подъем или спуск?» Он сказал: «Есть еще и третья мерзость – грязь».
Проверьте себя
- Какой объем в кодировке UNICODE занимает предложение «Лгуна по глазам видно»?
- Сколько раз поместится пословица «Терпение и труд все перетрут» в памяти объемом 1 Кбайт, если ее задать в кодировке ASCII?
- Шахматная доска состоит из 8 строк и 8 столбцов. Какое наименьшее количество бит необходимо для того, чтобы закодировать все ячейки доски? A) 4 B) 5 C) 6 D) 7
Почему для кодирования одного символа нужен именно 1 байт?
Почему для кодирования 1-го символа нужен именно 1 байт? Я прекрасно понимаю, что минимальная единица информации — 1 бит и чтобы выразить 255 символов в двоичном коде надо использовать 8 бит. И по таблице брать двоичный код и по нему находить нужный символ, но почему каждый символ обязательно занимает 1 байт? Зачем записывать число именно вот так 0000001 , а не просто 1 , тем самым заняв всего 1 бит информации и по таблице взять ему соответствующий символ.
Отслеживать
51.6k 199 199 золотых знаков 59 59 серебряных знаков 242 242 бронзовых знака
задан 1 авг 2018 в 17:23
Никита Антонов Никита Антонов
125 1 1 серебряный знак 9 9 бронзовых знаков
Байт — минимальная адресуемая единица информации. Хранить каждый символ меньше чем в одном байте неэффективно по скорости доступа. А для длительного хранения (при сохранении в файл, например) никто не мешает применить сжатие.
1 авг 2018 в 17:27
@insolor, Use the answer form, Luke!
– user207618
1 авг 2018 в 17:34
Символы не хранят в одном байте уже лет тридцать 🙂
1 авг 2018 в 17:36
А вообще теоретически использовать один бит не разрешает, только вот 11111111 — это один символ (число 255) или восемь символов 1 ? Придётся добавлять дополнительную информацию, поясняющую, как правильно интерпретировать эти единицы. Ну и да, использовать число битов меньшее чем «минимальная адресуемая единица информации» банально неудобно, ибо именно под восьмибитный байт спроектированы все современные компьютеры
1 авг 2018 в 17:39
@andreymal, о спасибо большое! Теперь дошло! Только вот еще вопрос тоесть большие последовательности в зависимости от кодировки делятся на определенное количество байт (1, 2 и тд) и уже по таблице находится определенные символы ?
1 авг 2018 в 17:42
1 ответ 1
Сортировка: Сброс на вариант по умолчанию
Не обязательно 1 ..есть кодировки (например utf-16, utf-32 ) где символы по 2 , по 4 байта. тут еще многое зависит от количества кодируемых символов. не всегда хватает 256 вариантов. часто нужно больше.то есть битность напрямую зависит от числа символов в таблице символов. Если влезть в ассемблер, то можно сделать свою таблицу символов. проблема будет только в том что твою кодировку будет понимать только твоя программа. А так просто принятый стандарт, и все. по поводу же адресации, да — опять же стандарт. хотя есть системы , которые работают и 9-ю битами ( старые советские системы связи) , где 9-й бит был или контрольным или знак передавал.
Отслеживать
ответ дан 1 авг 2018 в 17:35
Сергей Петрашко Сергей Петрашко
1,493 7 7 серебряных знаков 15 15 бронзовых знаков
Я наверное неправильно задал вопрос имею в виду почему все символы имеют 1 и тот же размер(тоесть 2 байта или 1), а не так чтобы 1 символ весит больше, а другой меньше, если все равно старшие разряды заполнены нулями (00000001 к примеру)
1 авг 2018 в 17:38
@НикитаАнтонов в кодировке UTF-8 длина одного символа может быть 1, 2, 3 или 4 байта 🙂 А использовать число бит, не кратное восьми, неудобно из-за архитектуры современных компьютеров, заточенных именно на 8 бит
1 авг 2018 в 17:40
будут проблемы с синхронизацией. такая проблема есть в азбуке морзе. то есть трудно понять где закончился один символ и начался второй. поэтому и принято использовать такие битности.