2. Информационный объём сообщения
Каждый объект в компьютере (или любом другом электронном устройстве) имеет свой информационный объём, то есть то количество информации, которое он занимает в памяти устройства.
Например, текстовый документ на \(2\)–\(3\) страницы может иметь информационный объём \(150\) Кб.
Изображение в хорошем качестве — \(2\)–\(4\) Мб.
Аудиофайл с песней на \(3\) минуты — около \(6\) Мб.
Рассмотрим измерение текстовой информации в компьютере.
Размер текстового сообщения зависит от того, с помощью какого алфавита он был написан и сколько в нём символов.
Алфавит (N) — это количество символов в некотором языке.
Чем больше алфавит, тем больше информационный вес одного символа.
Информационный вес одного символа (i) — это количество информации, которое отводится на один символ.
Обрати внимание!
Они связаны формулой: N = 2 i .
Например, в русском алфавите \(33\) буквы, вычислим информационный вес одного символа по формуле: 33 = 2 i , i ≈ 6 бит. То есть вес одного символа (буквы) — \(6\) бит.
Представим, что в тетрадке записана следующая строка: «Мама сидела за столом».
Как посчитать, сколько информации несёт в себе это сообщение?
Нам известно, сколько весит один символ — \(6\) бит, можно подсчитать количество символов в данном сообщении — \(18\), соответственно, чтобы найти, сколько всего информации несёт в себе это сообщение, нужно перемножить информационный вес одного символа и количество символов в сообщении.
Измерение информации. Алфавитный подход к измерению информации. Мощность алфавита. Информационный объем текста

Алфавитный подход к измерению информации Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эталонные единицы. Для расстояния — это метр, для массы — килограмм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с эталонной единицей. Сколько раз эталонная единица укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя эталонная единица. Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.
Алфавит. Мощность алфавита
Под алфавитом мы будем понимать набор букв, знаков препинания, цифр, скобок и др. символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.
Полное число символов в алфавите принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54:33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.
Информационный вес символа
При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.
Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.
С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимвольного алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать следующее: все символы такого алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.
1. Алфавитный (объёмный) подход к измерению информации
С помощью алфавитного подхода можно определять количество информации в текстовом сообщении, которое состоит из символов определённого алфавита.
Алфавит — это набор символов, которые используются в некотором языке с целью представления информации.
В качестве символов могут быть использованы буквы, цифры, скобки, специальные знаки.
Мощность алфавита — это количество символов в алфавите, которое вычисляется по формуле:
N = 2 i , где \(i\) — информационный вес символа.
Например, мощность алфавита, состоящего из \(26\) латинских букв и дополнительных символов (скобки, пробел, знаки препинания (\(11\) шт.), \(10\) цифр), — \(47\).
Информационный вес \(1\) символа, \(i\) (бит)
Мощность алфавита, \(N\)
определи информационный объём сообщения (в Кбайтах), состоящего из 8192 символов, если используется алфавит из 128 символов.
Составим краткую запись условия задачи.
1. определим, какое количество бит необходимо для кодировки одного символа. Так как мощность используемого алфавита \(N\)\(=\) 128 , то \(i\) \(=\) 7 (использовали формулу N = 2 i ).
2. Вычислим информационный объём сообщения, которое состоит из 8192 символов, используя формулу I = K · i :
I = 8192 ⋅ 7 \(=\) 57344 бит.
3. Переведём биты в Кбайты.
Поскольку \(1\) байт \(=\) \(8\) бит, \(1\) Кбайт \(=\) \(1024\) байт, получим:
57344 бит \(=\) 57344 8 байт \(=\) 7168 байт \(=\) 7168 1024 Кбайт \(=\) 7 Кбайт.
Ответ: 7 Кбайт.
Единицы измерения информации
Любая компьютерная техника работает в двоичном коде, понимая только значения \(0\) — «сигнала нет» и \(1\) — «сигнал есть». Эти значения хранятся в бите — наименьшей единице измерения информации. Однако удобнее использовать более крупные единицы измерения информации, которые приведены в таблице.
| \(1\) байт | \(8\) бит \(=\) 2 3 бит |
| \(1\) Кбайт (килобайт) | 2 10 байт |
| \(1\) Мбайт (мегабайт) | 2 10 Кбайт |
| \(1\) Гбайт (гигабайт) | 2 10 Мбайт |
| \(1\) Тбайт (терабайт) | 2 10 Гбайт |
1) определить, сколько Мбайт информации содержится в \(512\) битах. Ответ дай в виде степени числа \(2\).
Как обозначается количество в информатике
Информация является одним из фундаментальных понятий современной науки наряду с такими понятиями, как «вещество» и «энергия».
Общее определение этому термину дать невозможно. Однако в раз-личных предметных областях даётся специализированное определение информации, подходящее для данной предметной области. В рамках этого задания мы будем говорить о математической теории информации и рассмотрим два подхода — содержательный (Клод Шеннон) и алфавитный (А.Н.Колмогоров). Начнём с определения понятия «инфор-мация» в каждом из этих подходов.
Определение 1
В содержательном подходе, информация — это снятая неопределённость. Неопределённость некоторого события — это количество возможных результатов (исходов) данного события.
Например, если мы подбрасываем вверх монету, то она может упасть двумя различными способами (орлом вверх или решкой вверх). Соответственно, у данного события два возможных исхода. Если же подбрасывать игральный кубик, то исходов будет шесть.
Определение 2
В алфавитном подходе информация — это сообщение (последовательность символов некоторого алфавита). Причём существенными являются только размер алфавита и количество символов в сообщении. Конкретное содержание сообщения интереса не представляет. Чаще всего алфавит является двоичным (состоит из `2` символов – «`0`» и «`1`»).
После таких определений понятия «информация» можно говорить об её измерении. Введём несколько основных единиц измерения информации.
Чаще всего в качестве основной единицы измерения информации используется бит. При алфавитном подходе один бит — это количество информации, которое можно передать в сообщении, состоящем из одного двоичного знака (`«0»` или `«1»`). С точки же зрения содержательного подхода один бит — это количество информации, уменьшающее неопределённость знания в два раза.
Наряду с битами можно использовать и другие единицы измерения информации, например, триты или диты. При алфавитном подходе один трит — это количество информации, которое можно передать в сообщении, состоящем из одного троичного знака `(«0»`, `«1»` или `«2»)`. С точки же зрения содержательного подхода один трит — это количество информации, уменьшающее неопределённость знания в три раза. Соответственно, один дит — это количество информации, уменьшаю-щее неопределённость знания в десять раз, и количество информации, которое можно передать в сообщении, состоящем из одного десятичного знака (арабской цифры). В некоторых задачах (например, в задаче взлома кодового замка) удобнее в качестве основной единицы измерения информации использовать не биты, а диты, поскольку угадывание каждой цифры из кода уменьшает количество комбинаций в `10` раз.
Для каждой основной единицы измерения информации существуют производные более крупные единицы измерения. Поскольку чаще всего мы будем использовать в качестве основной единицы бит, рассмотрим производны е единиц ы измерения для бита. На практике чаще всего используется не бит, а байт.
`1` байт (`1`B) `= 8` бит;
Далее существует две линейки производных единиц для байта – линейка десятичных приставок и линейка двоичных приставок. В случае десятичных приставок каждая следующая единица измерения равна `1000` предыдущих единиц. Обозначаются десятичные приставки латинскими буквами (буква префикса из системы СИ и заглавная «B», обозначающая «байт») Итак:
`1` килобайт (`1` kB) `= 1000` B (1000 байт);
`1` мегабайт (`1` MB) `= 1000` kB ;
`1` гигабайт (`1` GB) `= 1000` MB;
`1` терабайт (`1` TB) `= 1000` GB;
`1` петабайт (`1` PB) `= 1000` TB;
`1` эксабайт (`1` EB) `= 1000` PB;
`1` зеттабайт (`1` ZB) `= 1000` EB;
`1` йоттабайт(`1` YB) `= 1000` ZB.
Более крупных единиц на настоящий момент не введено.
При использовании двоичных приставок, каждая следующая едини-ца измерения равна 1024 предыдущих единиц. В России принято обозначать двоичные приставки, записывая префикс заглавной русской буквой и после него слово «байт» целиком и тоже русскими буквами. За рубежом для обозначения двоичных приставок между префиксом и «B» добавляется маленькая буква «i» (от слова «binary»). Кроме того, все префиксы записываются заглавными буквами. Итак:
`1` кибибайт (`1` Кбайт, `1` KiB) `=2^10` байт `= 1024` байт;
`1` мебибайт (`1` Мбайт, `1` MiB) `=2^20` байт `= 1024` Кбайт;
1 гибибайт (`1` Гбайт, `1` GiB) `=2^30` байт `= 1024` Мбайт;
1 тебибайт (`1` Тбайт, `1` TiB) `=2^40` байт `= 1024` Гбайт;
1 пебибайт (`1` Пбайт, `1` PiB) `=2^50` байт `= 1024` Тбайт;
1 эксбибайт (`1` Эбайт, `1`EiB) `=2^60` байт `= 1024` Пбайт;
1 зебибайт (`1` Збайт, `1` ZiB) `=2^70` байт `= 1024` Эбайт;
1 йобибайт (`1` Йбайт, `1` YiB) `=2^80` байт `= 1024` Збайт.