Что такое длина кода при кодировании

Что такое длина кода при кодировании

Понятие кодирования. Цели кодирования.

Код. Длина кода

Одну и ту же информацию можно выразить разными способами: проговорить, написать, выразить жестами и т.д. Для автоматизации работы с информацией, представленной в различных видах, очень важно унифицировать форму ее представления, т.е. выражать данные одного типа через данные другого типа. Для этого используют кодирование информации (данных). Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). История знает интересные попытки создания “универсальных” языков и азбук. Подобная проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и т.д.

При кодировании могут ставиться разные цели и, соответственно, применяться разные методы. Наиболее распространенными целями кодирования являются следующие [1, c.47]:

· экономность, т.е. уменьшение избыточности сообщения; повышение скорости передачи или обработки;

· надежность, т.е. защита от случайных искажений;

· сохранность, т.е. защита от нежелательного доступа к информации;

· удобство физической реализации (например, двоичное кодирование информации в ЭВМ);

Эти цели часто противоречат друг другу. Экономные сообщения могут оказаться ненадежными, так как они не содержат лишних символов, искажение любого символа может изменить смысл сообщения. Подробно исследует проблемы разумного сочетания экономности и надежности при передаче информации теория кодирования. В настоящее время немаловажным становится и защита информации от нежелательного доступа. Защита требует специальных способов обеспечения секретности (паролей, ключей и т.п.), что увеличивает объем хранимой информации и замедляет работу с ней.

На разных этапах сложного информационного процесса достигаются разные цели, поэтому информация неоднократно перекодируется, т.е. изменяет свое представление. Например, такая перекодировка происходит при передаче телеграмм. При решении задачи с помощью ЭВМ происходит превращение алгоритма решения задачи, написанного на естественном языке, в программу, записанную на языке программирования, далее происходят последовательно ввод, трансляция, работа программы и вывод результатов. На каждом из этапов происходит перекодирование информации.

Для того чтобы сообщение было передано отисточника к потребителю, оно должно быть каким-либо образом отображено, зафиксировано. Такое отображение осуществляется с помощью некоторых символов (знаков). “Знак – это элемент конечного множества отличных друг от друга элементов. Знак вместе с его смыслом называют символом. Набор знаков, в котором определен их порядок, называется алфавитом. Алфавит, состоящий из двух знаков, называется двоичным алфавитом.Кодированием называется процесс преобразования одного набора знаков в другой набор знаков” [1, c. 45]. Кодирование – способ хранения и передачи информации, форма представления ее на носителе. Шифрование – это тоже кодирование сообщения отправителем, но такое, чтобы оно было непонятно несанкционированному пользователю. Последовательность символов алфавита называется словом. Сообщение фиксируется как последовательность слов. Простой и всем понятный пример такого представления сообщения – его запись словами, составленными из букв русского алфавита. В канале связи способ представления сообщения может изменяться: один алфавит заменяться другим. Для того, чтобы закодировать информацию, необходимо выбрать код. “Кодом называется правило для преобразования одного набора знаков в другой набор знаков. Длиной кода называется такое количество знаков, которое используется при кодировании” [1, c. 45].

Количество символов в алфавите кодирования и длина кода – совершенно разные вещи. Например, в русском алфавите 33 буквы, а слова могут быть длиной в 1, 2, 3 и т.д. буквы. Код может быть постоянной и непостоянной длины. В технике коды различной длины встречаются довольно редко. Исключением является лишь код Морзе. В нем, например, буква Е обозначается одним символом – «.»; буква А двумя символами – «. — —»; буква D тремя символами – «— . .», буква J четырьмя символами «. — — —». Азбука Морзе – это троичный код с набором знаков: точка, тире, пауза. Пауза используется в качестве разделителя между буквами и словами, так как длина кода непостоянна. По общепринятому правилу радистов, продолжительность точки равна продолжительности паузы, продолжительность тире равна продолжительности трех точек, продолжительность пропуска (между буквами) равна трем продолжительностям паузы. В кодах с постоянной длиной закодированные символы могут следовать друг за другом непосредственно. Расположение этих символов устанавливается с помощью отсчета. В этом случае сообщение может быть раскодировано однозначно.

Применение кодов с постоянной длиной позволяет использовать для кодирования двоичный алфавит, как наиболее простой. Чем меньше букв в алфавите, которым кодируется информация, тем проще должно быть устройство для распознавания (дешифровки) информационного сообщения. Однако, чем меньше букв в этом алфавите, тем большее количество их (большая длина кода) может потребоваться для записи одной и той же информации.

Читайте также:  Как почистить кэш на айпаде мини

В вычислительной технике существует своя система кодирования. Она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. То есть, алфавит составляют две цифры 0 и 1. Эти знаки называются двоичными цифрами, по-английски – binary digit или сокращенно bit (бит).

Почему длина кода выбрана в два символа? Такая форма позволяет создавать достаточно простые технические устройства для представления (кодирования) и распознавания (дешифровки) информации. Двоичное кодирование выбрали для того, чтобы максимально упростить конструкцию декодирующей машины, ведь дешифратор должен уметь различать всего два состояния (например, 1 – есть ток в цепи, 0 – тока в цепи нет). Двоичные элементы самые надежные – трудно перепутать состояние “включено” с состоянием “выключено”. Троичное кодирование, несмотря на ряд технических попыток, успеха не имело. В Советском Союзе в 60-е годы выпускался малой серией компьютер с троичной системой счисления при кодировании, который назывался “Сетунь”, компьютеры с десятичной системой счисления так и не вышли из стен лабораторий.

Основным свойством двоичной системы является компактность упаковки данных, т.е. почти минимальный расход памяти на представление числа. Для подтверждения последнего вывода рассмотрим следующий пример [16, c. 44-45]: Пусть дано число 9999, необходимо представить это число в разных системах счисления (нижний индекс обозначает основание системы счисления). В единичной системе потребуется 9999 состояний (камешков, палочек и т.п.) для представления этого числа. В двоичной системе 999910 = 100111000011112 . Всего потребуется 14 разрядов, в каждом из которых возможны две цифры, т.е. всего 28 состояний. В троичной системе 999910 = 1112011003 – 27 состояний. По основанию 4 999910 = 21300334 – 28 состояний. По основанию 5 999910 = 3044445 – 30 состояний. Продолжая далее осуществлять перевод числа 9999 в системы счисления с основаниями больше 5 можно видеть, что количество состояний (оно равно произведению основания системы счисления на количество разрядов в числе) будет увеличиваться. Наиболее плотная упаковка обеспечивается, когда в качестве основания системы счисления выбрано число между 2 и 3. Подсчитано, что оно равно 2,718 – знаменитое число е– основание натурального логарифма. Таким образом, для представления чисел в компьютере можно выбрать либо двоичную, либо троичную систему счисления. Выбор пал на двоичную. Двоичное представление числа требует примерно в 3,3 раза большего числа разрядов, чем его десятичное представление. Тем не менее применение двоичной системы счисления создает большие удобства для работы ЭВМ, так как технически оказалось проще реализовать два состояния “включено” или “выключено”. Кроме того, в двоичной системе счисления таблицы сложения и умножения, необходимые для того, чтобы считать, очень просты: 0 + 0 = 0, 0 + 1 = 1, 1 + 0 = 1, 1 + 1 = 10, 0 ´ 0 = 0, 0 ´ 1 = 0, 1 ´ 0 = 0, 1 ´ 1 = 1.

Одним битом, как уже упоминалось, могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т.п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия: 00 01 10 11. Тремя битами можно закодировать восемь различных значений: 000 001 010 011 100 101 110 111. Увеличивая на единицу количество разрядов в системе двоичного кодирования, увеличиваем в два раза количество значений, которое может быть выражено в данной системе, т.е. общая формула имеет вид: N = 2 m , где N – количество независимых кодируемых значений; m – разрядность двоичного кодирования, принятая в данной системе.

Рассмотрим, как в ЭВМ кодируются символьная или текстовая информация, целые и вещественные числа, графическая и звуковая информация.

Последнее изменение этой страницы: 2016-12-15; Нарушение авторского права страницы

Количество символов в алфавите кодирования и длина кода — совершенно разные вещи. Например, в русском алфавите 33 буквы, а слова могут быть длиной в 1, 2, 3 и т.д. буквы.

Код может быть постоянной и непостоянной длины. Коды различной (непостоянной) длины в технике используются довольно редко. Исключением является лишь троичный код Морзе. В вычислительной технике в настоящее время широко используется двоичное кодирование с алфавитом (0, 1). Наиболее распространенными кодами являются ASCII (American standart code for information interchange — американский стандартный код для обмена информацией) и КОИ-8 (код обмена информации длиной 8 бит).

Стандартная часть кодировочной таблицы ASCII

Номер Символ Номер Символ Номер Символ Номер Символ
P h
! Q i
: R j
# ; S k
$ V n
? W o
( @ X p
) A Y q
* B Z r
+ C [ s
, D t
E ] u
. F ^ v
/ G _ w
H ` x
I a y
J b z
K c <
L d |
M e >
N f

Также разработан международный стандарт Unicode, в котором каждому символу отводится не один байт, а два. С его помощью можно закодировать все существующие алфавиты.

Кодировка изображений (цвета)

Изображения на экране компьютера разбиваются на маленькие квадратики – пикселы. Чем больше пикселов, тем качественнее изображение. На мониторах обычно бывает 800х600 или 1024х768 пикселов и выше.

Читайте также:  Лучшая программа для ssd диска

Аддитивная модель RGB

Каждый пиксел имеет свой цвет, который складывается путем смешивания трех основных цветов: Красный Red R Зеленый Green G Синий Blue B.

Различаются 256 оттенков каждого цвета: по номерам от 0 до 255. Значит, всего из 256 оттенков трех основных цветов можно образовать 2 * 2 * 2 = 256 *256 *256 ≈16,7 млн. цветов.

Каждый оттенок основного цвета хранится в одном байте. Число 255 в двоичном виде представляется восемью единицами. Значит, цвет пиксела хранится в трех байтах. В графическом редакторе Paint цвет пиксела обычно задается тройкой чисел:

(0,0,0) — черный, в двоичном виде: 00000000, 00000000, 00000000

(255,255,255) — белый, в двоичном виде: 11111111, 11111111, 11111111

(255,0,0) — красный, в двоичном виде: 11111111, 00000000, 00000000

(0,128,128) — бирюзовый, в двоичном виде: 00000000, 10000000, 10000000

Кодировка чисел

Кодировка числовой информации в компьютере производится на основе представления привычных нам десятичных чисел в так называемой двоичной системе счисления. В компьютерах также используют шестнадцатеричную систему счисления.

Общие понятия

Кодирование — это преобразование информации из одной ее формы представления в другую, наиболее удобную для её хранения, передачи или обработки.

Кодом называют правило отображения одного набора знаков в другом.

Двоичный код – это способ представления информации с помощью двух символов — $0$ и $1$.

Длина кода – количество знаков, используемых для представления кодируемой информации.

Бит — это одна двоичная цифра $0$ или $1$. Одним битом можно закодировать два значения: $1$ или $0$. Двумя битами можно закодировать уже четыре значения: $00$, $01$, $10$, $11$. Тремя битами кодируются $8$ разных значений. Добавление одного бита удваивает количество значений, которое можно закодировать.

Виды кодирования информации

Различают кодирование информации следующих видов:

Попробуй обратиться за помощью к преподавателям

Кодирование текстовой информации

Любой текст состоит из последовательности символов. Символами могут быть буквы, цифры, знаки препинания, знаки математических действий, круглые и квадратные скобки и т.д.

Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому ставится в соответствии некоторое неотрицательное число, называемое кодом символа, и это число записывается в память ЭВМ в двоичном виде. Конкретное соотношение между символами и их кодами называется системой кодировки. В персональных компьютерах обычно используется система кодировки ASCII (American Standard Code for Informational Interchange – Американский стандартный код для информационного обмена).

Разработчики программного обеспечения создали собственные $8$-битные стандарты кодировки текста. За счет дополнительного бита диапазон кодирования в них был расширен до $256$ символов. Чтобы не было путаницы, первые $128$ символов в таких кодировках, как правило, соответствуют стандарту ASCII. Оставшиеся $128$ — реализуют региональные языковые особенности.

Задай вопрос специалистам и получи
ответ уже через 15 минут!

Восьмибитными кодировками, распространенными в нашей стране, являются KOI8, UTF8, Windows-1251 и некоторые другие.

Кодирование цвета

Чтобы сохранить в двоичном коде фотографию, ее сначала виртуально разделяют на множество мелких цветных точек, называемых пикселями (что-то на подобии мозаики). После разбивки на точки цвет каждого пикселя кодируется в бинарный код и записывается на запоминающем устройстве.

Если говорят, что размер изображения составляет, например, $512 х 512$ точек, это значит, что оно представляет собой матрицу, сформированную из $262144$ пикселей (количество пикселей по вертикали, умноженное на количество пикселей по горизонтали).

Прибором, "разбивающим" изображения на пиксели, является любая современная фотокамера (в том числе веб-камера, камера телефона) или сканер. И если в характеристиках камеры значится, например, "$10$ Mega Pixels", значит количество пикселей, на которые эта камера разбивает изображение для записи в двоичном коде, — 10 миллионов. Чем на большее количество пикселей разделено изображение, тем реалистичнее выглядит фотография в декодированном виде (на мониторе или после распечатывания).

Однако качество кодирования фотографий в бинарный код зависит не только от количества пикселей, но также и от их цветового разнообразия. Алгоритмов записи цвета в двоичном коде существует несколько. Самым распространенным из них является RGB. Эта аббревиатура – первые буквы названий трех основных цветов: красного – англ.Red, зеленого – англ. Green, синего – англ. Blue. Смешивая эти три цвета в разных пропорциях, можно получить любой другой цвет или оттенок.

На этом и построен алгоритм RGB. Каждый пиксель записывается в двоичном коде путем указания количества красного, зеленого и синего цвета, участвующего в его формировании.

Чем больше битов выделяется для кодирования пикселя, тем больше вариантов смешивания этих трех каналов можно использовать и тем значительнее будет цветовая насыщенность изображения.

Читайте также:  Как перекинуть контакты с телефона на симку

Цветовое разнообразие пикселей, из которых состоит изображение, называется глубиной цвета.

Кодирование графической информации

Описанная выше техника формирования изображений из мелких точек является наиболее распространенной и называется растровой. Но кроме растровой графики, в компьютерах используется еще и так называемая векторная графика.

Векторные изображения создаются только при помощи компьютера и формируются не из пикселей, а из графических примитивов (линий, многоугольников, окружностей и др.).

Векторная графика — это чертежная графика. Она очень удобна для компьютерного «рисования» и широко используется дизайнерами при графическом оформлении печатной продукции, в том числе создании огромных рекламных плакатов, а также в других подобных ситуациях. Векторное изображение в двоичном коде записывается как совокупность примитивов с указанием их размеров, цвета заливки, места расположения на холсте и некоторых других свойств.

Чтобы записать на запоминающем устройстве векторное изображение круга, компьютеру достаточно в двоичный код закодировать тип объекта (окружность), координаты его центра на холсте, длину радиуса, толщину и цвет линии, цвет заливки.

В растровой системе пришлось бы кодировать цвет каждого пикселя. И если размер изображения большой, для его хранения понадобилось бы значительно больше места на запоминающем устройстве.

Тем не менее, векторный способ кодирования не позволяет записывать в двоичном коде реалистичные фото. Поэтому все фотокамеры работают только по принципу растровой графики. Рядовому пользователю иметь дело с векторной графикой в повседневной жизни приходится не часто.

Кодирование числовой информации

При кодировании чисел учитывается цель, с которой цифра была введена в систему: для арифметических вычислений или просто для вывода. Все данные, кодируемые в двоичной системе, шифруются с помощью единиц и нолей. Эти символы еще называют битами. Этот метод кодировки является наиболее популярным, ведь его легче всего организовать в технологическом плане: присутствие сигнала – $1$, отсутствие – $0$. У двоичного шифрования есть лишь один недостаток – это длина комбинаций из символов. Но с технической точки зрения легче орудовать кучей простых, однотипных компонентов, чем малым числом более сложных.

Целые числа кодируются просто переводом чисел из одной системы счисления в другую. Для кодирования действительных чисел используют $80$-разрядное кодирование. При этом число преобразуют в стандартный вид.

Кодирование звуковой информации

Любой звук, слышимый человеком, является колебанием воздуха, которое характеризируется двумя основными показателями: частотой и амплитудой. Амплитуда колебаний — это степень отклонения состояния воздуха от начального при каждом колебании. Она воспринимается нами как громкость звука. Частота колебаний — это количество отклонений состояний воздуха от начального за единицу времени. Она воспринимается как высота звука.

Так, тихий комариный писк — это звук с высокой частотой, но с небольшой амплитудой. Звук грозы наоборот имеет большую амплитуду, но низкую частоту.

Схему работы компьютера со звуком в общих чертах можно описать так. Микрофон превращает колебания воздуха в аналогичные по характеристикам электрических колебаний. Звуковая карта компьютера преобразовывает электрические колебания в двоичный код, который записывается на запоминающем устройстве. При воспроизведении такой записи происходит обратный процесс (декодирование) — двоичный код преобразуется в электрические колебания, которые поступают в аудиосистему или наушники. Динамики акустической системы или наушников имеют противоположное микрофону действие. Они превращают электрические колебания в колебания воздуха.

Принцип разделения звуковой волны на мелкие участки лежит в основе двоичного кодирования звука. Аудиокарта компьютера разделяет звук на очень мелкие временные участки и кодирует степень интенсивности каждого из них в двоичный код. Такое дробление звука на части называется дискретизацией. Чем выше частота дискретизации, тем точнее фиксируется геометрия звуковой волны и тем качественней получается запись.

Качество записи сильно зависит также от количества битов, используемых компьютером для кодирования каждого участка звука, полученного в результате дискретизации. Количество битов, используемых для кодирования каждого участка звука, полученного при дискретизации, называется глубиной звука.

Кодирование видеозаписи

Видеозапись состоит из двух компонентов: звукового и графического.

Кодирование звуковой дорожки видеофайла в двоичный код осуществляется по тем же алгоритмам, что и кодирование обычных звуковых данных. Принципы кодирования видеоизображения схожи с кодированием растровой графики (рассмотрено выше), хотя и имеют некоторые особенности. Как известно, видеозапись — это последовательность быстро меняющихся статических изображений (кадров). Одна секунда видео может состоять из $25$ и больше картинок. При этом, каждый следующий кадр лишь незначительно отличается от предыдущего.

Учитывая эту особенность, алгоритмы кодирования видео, как правило, предусматривают запись лишь первого (базового) кадра. Каждый же последующий кадр формируются путем записи его отличий от предыдущего.

Так и не нашли ответ
на свой вопрос?

Просто напиши с чем тебе
нужна помощь

Ссылка на основную публикацию
Что такое адрес сервера на телефоне
Блог о модемах, роутерах и gpon ont терминалах. Частенько пользователи планшетов и смартфонов на Андроид сталкиваются с тем, что подключившись...
Что значит загрузочная флешка
Что такое загрузочная флешка / 8 способов создать загрузочную флешку Что такое загрузочная флешка / 8 способов создать загрузочную флешку...
Что значит заблокировать сообщение в телефоне
Текстовые сообщения очень удобны – ведь с их помощью вы можете получить информацию от другого абонента даже в тот момент,...
Что такое аккумулятор слайдер
Кроме достоинств, у литий-ионных аккумуляторов имеется немало минусов: Не выносят перезаряда. Подача тока на элемент питания должна быть прекращена, когда...
Adblock detector