Кодирование текстовой информации в компьютере. Кодирование текстовой информации Конспект урока двоичное кодирование текстовой информации

Жаропонижающие средства для детей назначаются педиатром. Но бывают ситуации неотложной помощи при лихорадке, когда ребенку нужно дать лекарство немедленно. Тогда родители берут на себя ответственность и применяют жаропонижающие препараты. Что разрешено давать детям грудного возраста? Чем можно сбить температуру у детей постарше? Какие лекарства самые безопасные?

Разделы: Информатика

Цель: . познакомить учащихся со способом кодирования текстовой информации в компьютере.

Оборудование:

  1. Рабочее место учащихся ПК и теоретический стол.
  2. Рабочее место учителя
  3. Мультимедийное оборудование
  4. Презентация (Приложение 1)
  5. Электронные карточки
  6. Рабочие листы

Ход урока

Предлагается начать приветствие класса, использовав для примера «кирпичный язык» из детских игр «СИЗДРАВСИСТВУЙСИТЕ, СИРЕСИБЯСИТА» (здравствуйте ребята) .

Как вы думаете, что я сказала?

Мы в детстве очень любили играть в такую игру, для того чтобы нас не поняли, мы перед слогом вставляли предлог си.

Так что же я вам сказала. Сиздравсиствуйсите сиресибясита.

Молодцы.

А давайте посмотрим мультфильм (фрагмент из мультфильма Мумитроль) .

Как вы думаете, о чем Тосла и Висла говорили, кто-нибудь понял?

А почему мы их не поняли, потому что мы не знаем, на каком языке они говорят или как они засекретили свою информацию.

На самом деле если внимательно прислушаться то мы поймем, что Тосла и Висла говорят на нашем языке, только добавляют к каждому слову сла, чтобы засекретить свой разговор.

Как раз с появлением первой секретной информации люди стали зашифровывать текст. Одной из первых таких секретных информаций была переписка Юлия Цезаря со своими сенаторами.

Поэтому сегодня на уроке мы с вами познакомимся с темой «Кодирование текстовой информации» запишите тему в рабочие листы (Приложение 2).

Перед вами несколько приемов кодирования текста, которые были изобретены на различных этапах развития человеческой мысли.

Криптография – это тайнопись, система изменения письма с целью сделать текст непонятным для непросвещенных лиц.

Азбука Морзэ или неравномерный телеграфный код, в котором каждая буква или знак представляет своей комбинацией точек и тире.

Сурдожесты – язык жестов, используемый людьми с нарушениями слуха.

Какие примеры кодирования текстовой информации можете привести?

Один из самых первых известных методов кодирования носит имя римского императора Юлия Цезаря (I век до н.э.). Этот метод основан на замене каждой буквы кодируемого текста, на другую, путем смещения в алфавите от исходной буквы на фиксированное количество символов, причем алфавит читается по кругу, то есть после буквы Я рассматривается А .

Так слово БАЙТ при смещении на два символа вправо кодируется слово ГВЛФ. Давайте попробуем раскодировать фразу, если мы знаем, что ее закодировали при перемещении на 1 букву в право.

Расшифруйте фразу «Лпнрэяус епмзёо сбвпубуэ, фшёойлй епмзёоь ефнбуэ » В качестве опоры используйте буквы русского алфавита, расположенные на слайде и на ваших рабочих листах.

Что у вас получилось? (Компьютер должен работать, ученики должны думать)

Молодцы.

Ребят, а у нас кодируется текст в компьютере, кто-нибудь знает?

Правильно, в компьютере используется двоичное кодирование текстовой информации (запишите себе в рабочий лист).

Традиционно для кодирования одного символа в компьютере используется 1 байт информации (запишите в листах) .

Какое количество различных символов можно закодировать?

Достаточно ли этого для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры и другие символы?

Чтобы точно ответить на этот вопрос нам надо подсчитать строчные буквы русского алфавита и прописные, так же для английского алфавита и цифры.

Результаты записывайте в рабочий лист.

  1. Сколько всего символов у нас получилось.
  2. Какой вывод можно сделать?

Оставшиеся значения используются для обозначения знаков препинания, арифметических знаков, служебных операций (перевод строки, пробел и т.д.). Следовательно, нам 1-го байта достаточно для кодирования текстовой информации.

В компьютере каждый символ кодируется уникальным кодом. Принято интернациональное соглашение о присвоении каждому символу своего уникального кода. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange). Запишите в своих листах название кодовой таблицы. В этой таблице представлены коды от 0 до 127, куда входит с 0 до 32 функциональные клавиши, с 33 до 127 – английский алфавит, знаки математических операций, служебные символы. Отметьте у себя в листах

Коды с 128 до 255 выделены для национальных стандартов каждой страны. Это достаточно для большинства развитых стран. В наших кодировках, что будет закодировано с помощью кодов с 128 до 255

Для России были введены несколько различных стандартов кодовой таблицы (коды 128 по 255) .

Вот некоторые из них. Рассмотрим их и запишем их названия: КОИ8 -Р, СР1251, СР866, Мас, ISO.

Хронологически одним из первых стандартов кодирования русских букв на компьютере был КОИ8 («код обмена информации 8битовый), эта кодировка применялась в 70 годы прошлого века на компьютерах серии EC ЭВМ.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251 (Code page – кодовая страница).

От начала 90 годов времени господства ОС MS DOS, остается кодировка СР886.

Так же компьютеры фирмы Apple, работающие под своей операционной системой Мac OS, используют свою кодировку Mac.

Кроме того, Международная организация по стандартам (International Standards Organization, ISO) утвердили в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859.

Давайте рассмотрим пример кодировки текста в различных кодировочных таблицах, используя в качестве справочного материала рабочих листов

Закодируем при помощи двух кодовых таблиц слово «Бит»

Молодцы теперь мы сразу видим, что если текст написан в одной кодировке, то прочитать его в другой кодировки не возможно.

Сейчас мы с вами сделаем упражнения для глаз, перед тем как преступить к практической работе по теме «кодирование текстовой информации».

Вам необходимо будет выполнить 3 задания:

  1. В первом задании мы с вами раскодируем слово с помощью текстового процессора.
  2. Во втором задании вы будете выполнять парами, но каждый работает за своим компьютером. Вы будете закодировать понятие, которое вам дано, а в результате мы должны получить фразу.
  3. В третьем задание необходимо посчитать количество символов и с помощью текстового редактора Блокнот узнать, сколько весит данная фраза.

Если вопросы по практической работе?

Пересаживайтесь за компьютеры по номерам ваших листов и внимательно читайте задание.

Открываем текстовый процессор MS Word.

В первом задании вам необходимо удерживая, ALT и набирая номера на дополнительной клавиатуре раскодировать слово которое у вас на листочках.

146 165 138 145 146

Закройте файл без сохранения.

Дальнейшую работу вы продолжаете в парах, но каждый за своим компьютером.

Вы открываете карточки под номерами (Приложение 3 , Приложение 4 , Приложение 5 ), которые у вас указаны на листах и один из пары кодирует информацию по таблице кои8, а второй по ср1251 и после этого записываете результат в лист.

Кодовые номера записываются без пробелов.

Обратите внимание на строчные и прописные буквы.

В следующем задание выполняем в блокноте:

Так как каждый символ кодируется 1 байтом, то информационный объем текста можно узнать, умножив количество символов в тексте на 1 байт.

Сейчас вы перепечатываете выражение, которое вам дано на листах, считаете количество символов, учитывая все знаки препинания и пробел.

Проверим это на практике. Создайте текстовый документ в редакторе Блокнот и напечатайте в нём фразу “Компьютерная программа делает то, что вы приказали ей сделать, а не то, что вы хотели, чтобы она сделала”.

Сколько в ней символов?

Ответ: 105

Сохраните и закройте файл. Определите его объем в байтах. Каков он?

Ответ: 105 байт.

Пересаживаются за столы и начинаем проверять, то что получилось у вас.

Какое слово в первом задание у вас получилось?

Молодцы.

Назовите задуманные фразы.

Какие были трудности при выполнении этого задания

Какие основные ошибки у вас были?

В последнем задание вы считали количество символов в высказывание «Компьютерная программа делает, то что вы приказали ей сделать, а не то, что вы хотели, чтобы она сделала»

Сколько у вас получилось?

После этого мы проверили, какой информационный объем содержит файл с этим высказывание, каков объем?

И, хотелось бы подвести итог по практической работе высказыванием, что компьютерная программа делает то, что вы приказали, а не то, что вы хотели, чтобы она сделала.

В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать два байта (16 бит) => 65536.

Такая кодировка называется Unicode и обозначается как UCS-2. Этот код включает в себя все существующие алфавиты мира, а также множество математических, музыкальных, химических символов и многое другое. Существует кодировка и UCS-4, где для кодирования используют 4 байта, то есть можно кодировать более 4 млрд. символов.

В заключение нашего урока давайте ответим на вопросы и раскодируем самостоятельно последнюю фразу:

  1. Какой принцип кодирования текстовой информации используется в компьютере?
  2. Как называется международная таблица кодировки символов?
  3. Перечислите названия таблиц кодировок для русскоязычных символов.
  4. В какой системе счисления представлены коды в перечисленных вами таблицах кодировок?
  5. Самостоятельно расшифруйте фразу по таблице Unicode.

193 235 224 227 238 228 224 240 254 194 209 197 213 231 224 226 237 232 236 224.

Кодирование информации - процесс преобразования информации из формы, удобной для непосредственного использования, в форму, удобную для передачи, хранения или автоматической переработки.

Кодирование текстовой информации

Для записи текстовой (знаковой) информации всегда используется какой-либо язык (естественный или формальный).

Всё множество используемых в языке символов называется алфавитом . Полное число символов алфавита N называют его мощностью . При записи текста в каждой очередной позиции может появиться любой из N символов алфавита, т. е. может произойти N событий. Следовательно, каждый символ алфавита содержит i бит информации, где i определяется из неравенства (формула Хартли): 2 i N . Тогда общее количество информации в тексте определяется формулой:

V = k * i ,

где V – количество информации в тексте; k – число знаков в тексте (включая знаки препинания и даже пробелы), i - количество бит, выделенных на кодирование одного знака.

Так как каждый бит – это 0 или 1, то любой текст может быть представлен последовательностью нулей и единиц. Именно так текстовая информация хранится в памяти компьютера. Присвоение символу алфавита конкретного двоичного кода - это вопрос соглашения, зафиксированного в кодовой таблице. В настоящее время широкое распространение получили кодовые таблицы ASCII и Unicode .


ASCII (American Standart Code for Informational Interchange - Американский стандартный код информационного обмена) используется достаточно давно. Для хранения кода одного символа выделено 8 бит, следовательно, кодовая таблица поддерживает до 28 = 256 символов. Первая половина таблицы (128 символов) - управляющие символы, цифры и буквы латинского алфавита. Вторая половина отводится под символы национальных алфавитов. К сожалению, в настоящее время существует целых пять вариантов кодовых таблиц для русских букв (КОИ-8, Windows-1251, ISO, DOS, MAC), поэтому тексты созданные в одной кодировке неверно отображаются в другой. (Наверное, Вы встречали русскоязычные сайты, тексты которых выглядят как бессмысленный набор знаков?).

Unicode - получил распространение в последние годы. Для хранения кода одного символа выделено 16 бит, следовательно, кодовая таблица поддерживает до 216 = 65536 символов. Такого пространства достаточно, чтобы в одном стандарте объединить все "живые" официальные (государственные) письменности. Кстати, стандарт ASCII вошел в состав Unicode.

Если кодирование – это перевод информации с одного языка на другой (запись в другой системе символов, в другом алфавите), то декодирование – обратный перевод.

При кодировании один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот – несколько символов исходного сообщения заменяются одним символом в новом коде (китайские иероглифы обозначают целые слова и понятия), поэтому кодирование может быть равномерное и неравномерное. При равномерном кодировании все символы кодируются кодами равной длины, при неравномерном кодировании разные символы могут кодироваться кодами разной длины, что затрудняет декодирование.

декодировать с начала , если выполняется условие Фано : никакое кодовое слово не является началом другого кодового слова. Закодированное сообщение можно однозначно декодировать с конца , если выполняется обратное условие Фано : никакое кодовое слово не является окончанием другого кодового слова. Условие Фано – это достаточное, но не необходимое условие однозначного декодирования.

Решение задач на кодирование текстовой информации

1.Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 20 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения? В ответе запишите только число.

Решение:

1) при 16-битной кодировке объем сообщения – 16*20 бит

2) когда его перекодировали в 8-битный код, его объем стал равен– 8*20 бит

3) таким образом, сообщение уменьшилось на 16*20 – 8*20 = 8*20 = 160 бит

Ответ: 160

2. Определите информационный объем текста в битах

Бамбарбия! Кергуду!

Решение:

1) в этом тексте 19 символов (обязательно считать пробелы и знаки препинания)

2) если нет дополнительной информации, считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка 8- или 16-битная), поэтому в сообщении 19*8 = 152 бита информации

Ответ: 152

3. В таблице ниже представлена часть кодовой таблицы ASCII:

Символ

Десятичный код

Шестнадцатеричный код

Каков шестнадцатеричный код символа «q»?


Решение:

1) в кодовой таблице ASCII все заглавные латинские буквы A-Z расставлены по алфавиту, начиная с символа с кодом 65=4116

2) все строчные латинские буквы a-z расставлены по алфавиту, начиная с символа с кодом 97=6116

3) отсюда следует, что разница кодов букв «q» и «a» равна разнице кодов букв «Q» и «A», то есть, 5116 – 4116=1016

4) тогда шестнадцатеричный код символа «q» равен коду буквы «a» плюс 1016

5) отсюда находим 6116 + 1016=7116.

Ответ: 71

4. Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А–00, Б–010, В–011, Г–101, Д–111. Можно ли сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно? Коды остальных букв меняться не должны. Выберите правильный вариант ответа.

1) для буквы Б –это невозможно

3) для буквы В –для буквы Г – 01

Решение (1 способ - проверка условий Фано) :

3) для однозначного декодирования достаточно, чтобы выполнялось одно из условий Фано: прямое или обратное условие Фано;

4) проверяем последовательно варианты 1, 3 и 4; если ни один из них не подойдет, придется выбрать вариант 2 («это невозможно»);

3) проверяем вариант 1: А–00, Б–01, В–011, Г–101, Д–111.

«прямое» условие Фано не выполняется (код буквы Б совпадает с началом кода буквы В);

«обратное» условие Фано не выполняется (код буквы Б совпадает с окончанием кода буквы Г); поэтому этот вариант не подходит;

4) проверяем вариант 3: А–00, Б–010, В–01, Г–101, Д–111.

«прямое» условие Фано не выполняется (код буквы В совпадает с началом кода буквы Б);

«обратное» условие Фано не выполняется (код буквы В совпадает с окончанием кода буквы Г); поэтому этот вариант не подходит;

5) проверяем вариант 4: А–00, Б–010, В–011, Г–01, Д–111.

«прямое» условие Фано не выполняется (код буквы Г совпадает с началом кодов букв Б и В); но «обратное» условие Фано выполняется (код буквы Г не совпадает с окончанием кодов остальных буквы); поэтому этот вариант подходит;

Ответ : 4

Решение (2 способ, дерево) :

1) построим двоичное дерево, в котором от каждого узла отходит две ветки, соответствующие выбору следующей цифры кода – 0 или 1; разместим на этом дереве буквы А, Б, В, Г и Д так, чтобы их код получался как последовательность чисел на рёбрах, составляющих путь от корня до данной буквы (красным цветом выделен код буквы В – 011):

https://pandia.ru/text/78/419/images/image003_52.gif" width="391" height="166">DIV_ADBLOCK100">

3) но бит четности нам совсем не нужен , важно другое: пятый бит в каждой пятерке можно отбросить !

4) разобъем заданную последовательность на группы по 5 бит в каждой:

01010, 10010, 01111, 00011.

5) отбросим пятый (последний) бит в каждой группе:

0101, 1001, 0111, 0001.

это и есть двоичные коды передаваемых чисел:

01012 = 5, 10012 = 9, 01112 = 7, 00012 = 1.

6) таким образом, были переданы числа 5, 9, 7, 1 или число 5971.

Ответ: 2

Задачи для тренировки:

1) Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode , в 8-битную кодировку
КОИ-8 . При этом информационное сообщение уменьшилось на 800 бит. Какова длина сообщения в символах?

2) В таблице ниже представлена часть кодовой таблицы ASCII:

Символ

Десятичный код

Шестнадцатеричный код

Каков шестнадцатеричный код символа «p» ?

3) Текстовый документ, состоящий из 3072 символов, хранился в 8-битной кодировке КОИ-8. Этот документ был преобразован в 16-битную кодировку Unicode. Укажите, какое дополнительное количество Кбайт потребуется для хранения документа. В ответе запишите только число.

4) Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов ГБАВ и записать результат в шестнадцатеричной системе счисления, то получится:

5) Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв - из двух бит, для некоторых - из трех). Эти коды представлены в таблице:

Определите, какой набор букв закодирован двоичной строкой

1) baade 2) badde 3) bacde 4) bacdb

6) Для кодирования букв А, В, С, D используются трехразрядные последовательные двоичные числа, начинающиеся с 1 (от 100 до 111 соответственно). Если таким способом закодировать последовательность символов CDAB и записать результат в шестнадцатеричном коде, то получится:

1) А5СD16 4) DE516

7) Для 6 букв латинского алфавита заданы их двоичные коды (для некоторых букв из двух бит, для некоторых – из трех). Эти коды представлены в таблице:

Определите, какая последовательность из 6 букв закодирована двоичной строкой.

8) Для кодирования сообщения, состоящего только из букв А, Б, В и Г, используется неравномерный по длине двоичный код:

Если таким способом закодировать последовательность символов ГАВБВГ и записать результат в шестнадцатеричном коде, то получится:

1) 62DD2) 6213316

9) Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=1, Б=01, В=001. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

10) Для передачи чисел по каналу с помехами используется код проверки четности. Каждая его цифра записывается в двоичном представлении, с добавлением ведущих нулей до длины 4, и к получившейся последовательности дописывается сумма её элементов по модулю 2 (например, если передаём 23, то получим последовательность). Определите, какое число передавалось по каналу в виде?

11) Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А–10, Б–11, В–000, Г–001, Д–011. Можно ли сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно? Коды остальных букв меняться не должны. Выберите правильный вариант ответа.

1) это невозможно 2) для буквы Б – 1

3) для буквы Г –для буквы Д – 01

12) Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приёмной стороне канала связи. Использовали код: А–111, Б–110, В–100, Г–101. Укажите, каким кодовым словом может быть закодирована буква Д. Код должен удовлетворять свойству однозначного декодирования. Если можно использовать более одного кодового слова, укажите кратчайшее из них.

13) Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=1, Б=000, В=001. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

Кодирование графической информации

Преобразование графической информации из аналоговой формы в дискретную производится путем дискретизации , т. е. разбиения непрерывного графического изображения на отдельные элементы. В процессе дискретизации производится кодирование, т. е. присвоение каждому элементу конкретного значения в форме кода.

Дискретизация это преобразование непрерывного изображения в набор дискретных значений в форме кода.

В процессе кодирования изображения производится пространственная дискретизация . Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики. Изображение разбивается на отдельные мелкие фрагменты (точки), каждому из которых присваивается код цвета.

В результате пространственной дискретизации графическая информация представляется в виде растрового изображения . Растровое изображение состоит из определённого количества строк, каждая из которых содержит определённое количество точек (пиксел).

Качество изображения зависит от разрешающей способности.

Разрешающая способность растрового изображения определяется количеством точек по горизонтали (X) и количеством точек по вертикали (Y ) на единицу длины изображения.

Чем меньше размер точки, тем больше разрешающая способность (больше строк растра и точек в строке) и, соответственно, выше качество изображения.
Величина разрешающей способности выражается в (dot per inch - точек на дюйм), т. е. в количестве точек в полоске изображения длиной в 1 дюйм (1дюйм = 2,54 см). Оцифровка графических изображений с бумаги или плёнок производится с помощью сканера. Сканирование производится путём перемещения светочувствительных элементов вдоль изображения. Характеристики сканера выражаются двумя числами, например 1200х2400 dpi. Первое число определяет количество светочувствительных элементов на одном дюйме полоски и является оптическим разрешением. Второе - является аппаратным разрешением и определяет количество микрошагов при перемещении на один дюйм вдоль изображения.

В процессе дискретизации могут использоваться различные палитр цветов. Каждый цвет можно рассматривать как возможное состояние точки. Количество цветов N в палитре и количество информации для кодирования цвета каждой точки связаны между собой известной формулой Хартли: N=2I, где I – глубина цвета, а N – количество цветов (палитра).

Количество информации, которое используется для кодирования цвета точки изображения, называется глубиной цвета. Наиболее распространёнными значениями глубины цвета являются значения из таблицы:

Таблица. Глубина цвета и количество отображаемых цветов.

Глубина цвета (i)

Количество изображаемых цветов (N)

Качество изображения на экране монитора зависит от величины пространственного разрешения и глубины цвета. Пространственное разрешение экрана монитора определяется как произведение количества строк изображения на количество точек в строке. Разрешение может быть: 800х600, 1024х768, 1152х864 и выше. Количество отображаемых цветов может изменяться от 256 цветов до более чем 16 миллионов.

Видеопамять

№ точки

Двоичный код цвета точки

.........................................................................................

..........................................................................................

Рис. Формирование растрового изображения на экране.

Рассмотрим пример формирования на экране монитора растрового изображения, состоящего из 600 строк по 800 точек в каждой строке (всего точек) и глубиной цвета 8 битов. Двоичный код цвета всех точек хранится в видеопамяти компьютера, которая находится на видеокарте.

Периодически, с определённой частотой, коды цветов точек считываются из видеопамяти и точки отображаются на экране монитора. Частота считывания изображения влияет на стабильность изображения на экране. В современных мониторах обновление изображения происходит с частотой 75 и более раз в секунду, что обеспечивает комфортность восприятия пользователем.

Информационный объём требуемой видеопамяти можно рассчитать по формуле:

V =I · X · Y,

где V - информационный объём видеопамяти в битах;
X · Y - количество точек изображения (разрешение экрана);
I - глубина цвета в битах на точку.

Например, необходимый объём видеопамяти для графического режима с разрешением 800х600 точек и глубиной цвета 24 бита равен:

V =I · X · Y= 24 х 800 х 600 =бит = 1 байт.

Цветное изображение на экране монитора формируется за счет смешивания базовых цветов: красного, зеленого и синего (палитра RGB). Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности. Например, при глубине цвета в 24 бита на каждый из цветов, выделяется по 8 бит, т. е. для каждого из цветов возможны N=28=256 уровней интенсивности, заданные двоичными кодами от минимального до максимального.

Таблица. Формирование некоторых цветов при глубине цвета 24 бита.

Название

Интенсивность

Часто цвет записывается в виде - #RRGGBB, где RR – шестнадцатеричный код красной цветовой компоненты, GG - шестнадцатеричный код зеленой цветовой компоненты, BB - шестнадцатеричный код синей цветовой компоненты. Чем больше значение компоненты, тем больше интенсивность свечения соответствующего базового цвета. 00 – отсутствие свечения, FF – максимальное свечение (FF16=25510), 8016 – среднее значение яркости. Если компонента имеет интенсивность цвета <8016 , то это даст темный оттенок, а если >=8016 , то светлый.

Например,

#FF0000 – красный цвет (красная составляющая максимальная, а остальные равны нулю)

#000000 – черный цвет (ни одна компонента не светится)

#FFFFFF – белый цвет (все составляющие максимальны и одинаковы, наиболее яркий цвет)

#404040 – темно-серый цвет (все составляющие одинаковы и значения меньше среднего значения яркости)

#8080FF – светло-синий (максимальная яркость у синий составляющей, а яркости других компонент одинаковые и равны 8016).

Решение задач на кодирование графической информации

1. Для хранения растрового изображения размером 32×32 пикселя отвели 512 байтов памяти. Каково максимально возможное число цветов в палитре изображения?

Решение: При кодировании с палитрой количество бит на 1 пиксель (K ) зависит от количества цветов в палитре N , они связаны формулой: https://pandia.ru/text/78/419/images/image005_31.gif" width="71" height="21 src="> (2), где – число бит на пиксель, а – общее количество пикселей.

1) находим общее количество пикселей https://pandia.ru/text/78/419/images/image009_17.gif" width="61" height="19">байтбайтбитбит

3) определяем количество бит на пиксель: #ХХХХХХ", где в кавычках задаются шестнадцатеричные значения интенсивности цветовых компонент в 24-битной RGB-модели.

К какому цвету будет близок цвет страницы, заданный тэгом ?

1) белый 2) серый 3)желтый 4) фиолетовый

Решение: Самая высокая интенсивность цвета (99) у составляющих красного и синего цветов. Это дает фиолетовый цвет.

Ответ: 4

3. Какова ширина (в пикселях) прямоугольного 64-цветного неупакованного растрового изображения, занимающего на диске 1,5 Мбайт, если его высота вдвое меньше ширины?

Решение: Так как объем памяти на все изображение вычисляется по формуле (1), где – число бит на пиксель, а https://pandia.ru/text/78/419/images/image014_12.gif" width="36" height="41 src=">.

64=26 . Отсюда K = 6.

Подставим эти значения в формулу (1), получим:

*6=1.5*220*23. После сокращения: x 2 = 222. Отсюда: x = 211=2048.

О твет: 4

Задачи для тренировки:

1. Для хранения растрового изображения размером 128 x 128 пикселей отвели 4 килобайта памяти. Каково максимально возможное число цветов в палитре изображения?

2. Для кодирования цвета фона страницы Интернет используется атрибут bgcolor="#ХХХХХХ", где в кавычках задаются шестнадцатеричные значения интенсивности цветовых компонент в 24-битной RGB-модели. К какому цвету будет близок цвет страницы, заданной тэгом ?

1) желтый 2) розовый 3) светло-зеленый 4) светло-синий

3. Какова ширина (в пикселях) прямоугольного 16-цветного неупакованного растрового изображения, занимающего на диске 1 Мбайт, если его высота вдвое больше ширины?

Кодирование звуковой информации

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче, чем больше частота, тем выше тон. Для того, чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. При этом звуковая волна разбивается на мелкие временные участки, для каждого из которых устанавливается значение амплитуды.

Временная дискретизация – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук.

На графике (см. рис.) это выглядит как замена гладкой кривой на последовательность ”ступенек”, каждой из которых присваивается значение уровня громкости. Чем большее количество уровней громкости будет выделено в процессе кодирования, тем более качественным будет звучание.

Рис. Временная дискретизация звука

Глубина звука (глубина кодирования) - количество бит на кодировку звука.

Уровни громкости (уровни сигнала) - звук может иметь различные уровни громкости. Количество различных уровней громкости рассчитываем по формуле Хартли: N = 2 I где I – глубина звука, а N – уровни громкости .

Современные звуковые карты обеспечивают 16-битную глубину кодировки звука. Количество различных уровней сигнала можно рассчитать по формуле: N=216=65536. Т. о., современные звуковые карты обеспечивают кодирование 65536 уровней сигнала. Каждому значению амплитуды присваивается 16-ти битный код.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, т. е. частотой дискретизации. Чем большее количество измерений проводится в 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Частота дискретизации количество измерений уровня входного сигнала в единицу времени (за 1 сек). Чем больше частота дискретизации, тем точнее процедура двоичного кодирования. Частота измеряется в герцах (Гц).

1 измерение за 1 секунду -1 ГЦ, 1000 измерений за 1 секунду 1 кГц.

Обозначим частоту дискретизации буквой F . Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20 кГц .

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Частота дискретизации аналогового звукового сигнала может принимать значения от 8 кГц до 48 кГц. При частоте 8 кГц качество дискретизованного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц – качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стереорежимы.

Аудиоадаптер (звуковая плата) – устройство, преобразующее электрические колебания звуковой частоты в числовой двоичный код при вводе звука и обратно (из числового кода в электрические колебания) при воспроизведении звука.

Характеристики аудиоадаптера: частота дискретизации и разрядность регистра.

Разрядность регистра - число бит в регистре аудиоадаптера. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического тока в число и обратно. Если разрядность равна I , то при измерении входного сигнала может быть получено 2 I = N различных значений.

Размер цифрового моноаудиофайла (A ) измеряется по формуле:

A =F* T * I /8 ,

где F – частота дискретизации (Гц), T – время звучания или записи звука, I разрядность регистра (разрешение). По этой формуле размер измеряется в байтах.

Размер цифрового стереоаудиофайла (A ) измеряется по формуле:

A =2* F * T * I /8 ,

сигнал записан для двух колонок, так как раздельно кодируются левый и правый каналы звучания.

Пример. Попробуем оценить информационный объем стереоаудиофайла длительностью звучания 1 секунда при высоком качестве звука (16 бит, 48 кГц). Для этого количество битов нужно умножить на количество выборок в 1 секунду и умножить на 2 (стерео):

16 бит*48 000 *2 = 1 536 000 бит = 192 000 байт = 187,5 Кбайт

В таблице1 показано, сколько Мб будет занимать закодированная одна минута звуковой информации при разной частоте дискретизации:

Тип сигнала

Частота дискретизация, КГц

16 бит, стерео

16 бит, моно

8 бит, моно

Примеры задач:

1. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит. Файл сжатию не подвержен.

Решение:

Формула для расчета размера (в байтах) цифрового аудио-файла: A = F * T * I /8.

Для перевода в байты полученную величину надо разделить на 8 бит.

22,05 кГц =22,05 * 1000 Гц =22050 Гц

A = F * T * I /8 = 22050 х 10 х 8 / 8 = 220500 байт.

Ответ: 220500

2. В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность?

Решение:

Формула для расчета частоты дискретизации и разрядности: F* I =А/Т

(объем памяти в байтах) : (время звучания в секундах):

2, 6 Мбайт= 26 байт

F* I =А/Т= 26 байт: 60 = 45438,3 байт

F=45438,3 байт: I

Разрядность адаптера может быть 8 или 16 бит. (1 байт или 2 байта). Поэтому частота дискретизации может быть либо 45438,3 Гц = 45,4 кГц ≈ 44,1 кГц –стандартная характерная частота дискретизации, либо 22719,15 Гц = 22,7 кГц ≈ 22,05 кГц - стандартная характерная частота дискретизации

Ответ:

Частота дискретизации

Разрядность аудиоадаптера

1 вариант

2 вариант

3. Объем свободной памяти на диске - 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Решение:

Формула для расчета длительности звучания: T=A/F/I

(объем памяти в байтах) : (частота дискретизации в Гц) : (разрядность звуковой платы в байтах):

5,25 Мбайт = 5505024 байт

5505024 байт: 22050 Гц: 2 байта = 124,8 сек
Ответ: 124,8

4. Вычислить, сколько байт информации занимает на компакт-диске одна секунда стереозаписи (частота 44032 Гц, 16 бит на значение). Сколько занимает одна минута? Какова максимальная емкость диска (считая максимальную длительность равной 80 минутам)?

Решение:

Формула для расчета объема памяти A = F * T * I :
(время записи в секундах) * (разрядность звуковой платы в байтах) * (частота дискретизации). 16 бит -2 байта.
1) 1с х 2 х 44032 Гц = 88064 байт (1 секунда стереозаписи на компакт-диске)
2) 60с х 2 х 44032 Гц = 5283840 байт (1 минута стереозаписи на компакт-диске)
3) 4800с х 2 х 44032 Гц = байт=412800 Кбайт=403,125 Мбайт (80 минут)

Ответ: 88064 байт (1 секунда), 5283840 байт (1 минута), 403,125 Мбайт (80 минут)

Задачи для тренировки:

1) Производится одноканальная (моно) звукозапись с частотой дискретизации 22 кГц и глубиной кодирования 16 бит. Запись длится 2 минуты, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

2) Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и глубиной кодирования 24 бита. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

3) Проводилась одноканальная (моно) звукозапись с частотой дискретизации 16 кГц и 24-битным разрешением. В результате был получен файл размером 3 Мбайт, сжатие данных не производилось. Какая из приведенных ниже величин наиболее близка к времени, в течение которого проводилась запись?

1) 30 сексексексек

4) Производится одноканальная (моно) звукозапись с частотой дискретизации 128 Гц. При записи использовались 64 уровня дискретизации. Запись длится 6 минут 24 секунд, её результаты записываются в файл, причём каждый сигнал кодируется минимально возможным и одинаковым количеством битов. Какое из приведённых ниже чисел наиболее близко к размеру полученного файла, выраженному в килобайтах?

5) Производится двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и глубиной кодирования 32 бит. Запись длится 12 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

Класс: 10

Учебник : Н.Д.Угринович, 10 класс. Информатика и ИКТ. БИНОМ. 2010

Цели урока: - помочь учащимся усвоить понятие информации и способы кодирования информации в компьютере; - познакомить учащихся со способами кодирования и декодирования текстовой информации с помощью кодовых таблиц; - воспитание информационной культуры учащихся, внимательности, аккуратности, дисциплинированности, усидчивости.
- развитие мышления, познавательных интересов, навыков работы с мышью и клавиатурой, самоконтроля, умения конспектировать.
Оборудование:

Рабочее место ученика, ПК;

Интерактивная доска, мультимедийный проектор;

Интерактивная презентация;

Таблица самооценки знаний, умений

Задачи урока:

Формировать знания учащихся по теме “Кодирование и обработка текстовой информации”;

Содействовать формированию у школьников образного мышления;

Развить навыки анализа и самоанализа;

Формировать умения планировать свою деятельность.

План урока:

    Организационный момент (1 мин);

    Проверка знаний, домашнего задания (7-8 мин);

    Изучение нового материала (теоретическая часть) – (13 мин)

    Закрепление изученного (практическая работа) – (15 мин);

    Домашнее задание. (2 мин);

    Подведение итогов (2 мин);

Ход урока

1. Организационный момент:

Приветствие, проверка присутствующих. Слайд 2. ( Приложение 1 )

2. Проверка знаний, домашнего задания

Слайд 3

- На прошлом уроке мы с вами повторили понятие информации, о роли информации в живой и неживой природе. Я предлагаю всем проверить свои знания с помощь теста. (Учащиеся проверяют знания, усвоение ключевых понятий предыдущей темы с помощью программы MyTest. Результаты тестирования сообщают учителю и записывают в таблицу самоконтроля) ( Приложение 2 )

Тест

3. Изучение нового материала

Слайд 4 . Тема урока «Кодирование и обработка текстовой информации»

Сегодня на уроке вы узнаете, как представляется текстовая информация в компьютере. Научитесь кодировать и декодировать текстовую информацию с помощью кодовых таблиц и ПК. Но для начала мы должны вспомнить, что же такое «кодирование»?

Какой принцип кодирования информации используют в компьютере?

С развитием человечества появилась потребность обмениваться информацией. Но человеческий мозг не способен сохранять всю имеющуюся информацию. Так появилось гениальное изобретение – письменность. Возник набор условных обозначений для представления звуков, названный алфавитом. Алфавит мы сейчас рассматриваем как конечную совокупность символов, использующих для создания сообщений. Алфавит есть код человеческого языка. С созданием автоматических устройств возникла потребность создания таких языков, которые не имели бы множества толкований, т.е необходимо было формализовать человеческий язык. Огромное количество способов кодирования информации неизбежно привело пытливый человеческий ум к попыткам создать универсальный язык или азбуку для кодирования

Уже с 60-х годов прошлого столетия, компьютеры всё больше стали использовать для обработки текстовой информации. Для кодирования текстовой информации в компьютере применяется двоичное кодирование, т.е. представление текста в виде последовательности 0 и 1 (Эти два символа называются двоичными цифрами, по-английски – binary digit или сокращённо bit ).

Слайд 5.

Почему же двоичное кодирование используется в вычислительной технике?

Оказывается такой способ легко реализовать технически: 1 – есть сигнал, 0 – нет сигнала. Каждому символу алфавита сопоставили определённое количество и последовательность нулей и единиц.

Сколько же бит необходимо для кодирования символов?

Ограничений на количество символов не существует. Однако есть количество, которое можно назвать достаточным.

Слайд 6

Посчитаем примерное достаточное количество символов для внутреннего алфавита компьютера и по формуле вычислим необходимое количество бит.

33 русских прописных буквы + 33 русских строчных букв + 26 английских строчных букв + 26 прописных английских букв + 10 цифр + знаки препинания + скобки и знаки математических операций + специальные символы (@, #, $, %, &, *) + знаки псевдографики ≈ 256 символов. Вспомним формулу определения количества информации в двоичной знаковой системе (Тема предыдущего урока).

N = 2 I

256 = 2 8

Для количества такого количества символов достаточно 8 бит лил 1 байт. Итак, с помощью 1 байта можно закодировать 256 различных символов.

Слайд 7

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Т.О. человек различает символы по их начертанию, компьютер по их коду. При вводе в компьютер текстовой информации происходит двоичное кодирование, изображение символа преобразуется в двоичный код. Код символа хранится в одной ячейке оперативной памяти.

Слайд 8 – 12

Любой код – это своего рода соглашение между людьми, которые договариваются, что таким-то образом они будут обозначать то-то и то-то. Данное соглашение фиксируется в кодовой таблице. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange).

Первые 33 кода (с 0 по 33) этой таблице соответствует не символам, а операциям (ввод пробела, перевод строки и т.д.)

Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, т.е. в разных национальных кодировках одному и тму же коду соответствуют различные символы. Существует 5 кодировочных таблиц для русских букв (Windows , MS -DOS , Mac , ISO , КОИ – 8). Поэтому тексты созданные в одной кодировке не будут правильно отображаться в другой

Слайд 13 – 17

В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать два байта (16 бит).

Сколько символов можно закодировать двумя байтами?

Такая кодировка называется Unicode и обозначается как UCS-2. Этот код включает в себя все существующие алфавиты мира, а также множество математических, музыкальных, химических символов и многое другое. Существует кодировка и UCS-4, где для кодирования используют 4 байта, то есть можно кодировать более 4 млрд. символов.

4. Закрепление изученного. Практическая работа

Слайд 18 - 20

1. Задание: В Web -редакторе Компоновщик (приложение Sea -Monkey ) создать web -страницы, содержащие слово «информатика» в пяти различных кодировках: Windows , MS -DOS , Unicode , ISO , КОИ – 8. Просмотреть их в браузере в нужной кодировке.

(Ход выполнения практической работы: Учебник 10 класс Угринович Н.Д. стр 15 -17)

2. Задание. (Слайд) (Подготовка к ЕГЭ. Решение заданий А1 и А2. Раздаточный материал тренировочных тестов. Информатика. ЕГЭ. ТРИГОН Санкт-Петербург).

    А1. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Жан-Жака Руссо:

Тысячи путей ведут к заблуждению, к истине – только один.

1) 92 бита 2) 220 бит 3) 456 бит 4) 512 бит

Ответ: 3) 456 бит.

б) А2. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 16 символов. Второй текст в алфавите мощностью 256 символов. Во сколько раз количество информации во втором тексте больше, чем в первом?

1) 12 2) 2 3) 24 4) 4

Ответ: 2) 2.

5.Обобщение. Домашнее задание:

1. Какой принцип кодирования текстовой информации используется в компьютере?

2. Как называется международная таблица кодировки символов?

3. Перечислите названия таблиц кодировок для русскоязычных символов.

4. В какой системе счисления представлены коды в перечисленных вами таблицах кодировок?

Учебник Н.Д.Угринович 10 класс. § 1.1.1, ответить на вопрос.

Выполнить задание из Демонстрационного варианта контрольных измерительных материалов единого государственного экзамена 2011 года по информатике и ИКТ

А2. Автоматическое устройство осуществило перекодировку информационного

сообщения на русском языке длиной в 20 символов, первоначально

записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При

этом информационное сообщение уменьшилось на

1) 320 бит 2) 20 бит 3) 160 байт 4) 20 байт

6. Подведение итогов.

Сегодня мы с вами познакомились со способами кодирования и декодирования текстовой информации с помощью кодовых таблиц и компьютера; потренировались в решении задач из тестовых заданий ЕГЭ на данную тему. Давайте подведём итоги нашего урока. Оцените самостоятельно работу на уроке.

(Выставление оценок.)

Спасибо за урок.

Список используемых информационных источников

    Ровнягина Л.В. Кодирование текстовой (символьной) информации(2007 / 2008 учебный год) // http://festival.1september.ru/articles/502820 (дата обращения: 22 октября 2009 год).

    Угринович, Н. Д. Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений / Н. Д. Угринович, Л. Л. Босова, Н. И. Михайлова. - М. : БИНОМ. Лаборатория знаний, 2003. - 400 с. : ил.

    Угринович, Н.Д. Информатика и ИКТ. Базовый уровень: учебник для 10 класса/Н. Д. Угринович. - 6-е изд. - М. : БИНОМ. Лаборатория знаний, 2010.

    Демонстрационный вариант контрольных измерительных материалов единого государственного экзамена по информатике 2011 года (подготовлен Федеральным государственным научным учреждением «ФЕДЕРАЛЬНЫЙ ИНСТИТУТ ПЕДАГОГИЧЕСКИХ ИЗМЕРЕНИЙ»)

    Раздаточный материал тренировочных тестов по информатике. ЕГЭ И.Ю.Гусева. ТРИГОН Санкт-Петербург 2009г.

    Разработка урока Учитель: Митина Наталья Владимировна, учитель информатики НМОУ «Гимназия №44» города Новокузнецка Кемеровской области.

    Поурочные разработки по информатике 8-9 классы А.Х Шелепаева. Москва «ВАКО» 2005

Кодирование текстовой информации в компьютере - порой неотъемлемое условие корректной работы устройства или отображения того или иного фрагмента. Как происходит этот процесс в ходе работы компьютера с текстом и визуальной информацией, звуком - все это мы разберем в данной статье.

Вступление

Электронная вычислительная машина (которую мы в повседневной жизни называем компьютером) воспринимает текст весьма специфично. Для нее кодирование текстовой информации очень важно, поскольку она воспринимает каждый текстовый фрагмент в качестве группы обособленных друг от друга символов.

Какие бывают символы?

В роли символов для компьютера выступают не только русские, английские и другие буквы, но и еще знаки препинания, а также другие знаки. Даже пробел, которым мы разделяем слова при печатании на компьютере, устройство воспринимает как символ. Чем-то очень напоминает высшую математику, ведь там, по мнению многих профессоров, ноль имеет двойное значение: он и является числом, и одновременно ничего не обозначает. Даже для философов вопрос пробела в тексте может стать актуальной проблемой. Шутка, конечно, но, как говорится, в каждой шутке есть доля правды.

Какая бывает информация?

Итак, для восприятия информации компьютеру необходимо запустить процессы обработки. А какая вообще бывает информация? Темой этой статьи является кодирование текстовой информации. Мы уделим особенное внимание этой задаче, но разберемся и с другими микротемами.

Информация может быть текстовой, числовой, звуковой, графической. Компьютер должен запустить процессы, обеспечивающие кодирование текстовой информации, чтобы вывести на экран то, что мы, например, печатаем на клавиатуре. Мы будем видеть символы и буквы, это понятно. А что же видит машина? Она воспринимает абсолютно всю информацию - и речь сейчас идет не только о тексте - в качестве определенной последовательности нулей и единиц. Они составляют основу так называемого двоичного кода. Соответственно, процесс, который преобразует поступающую на устройство информацию в понятную ему, имеет название “двоичное кодирование текстовой информации”.

Краткий принцип действия двоичного кода

Почему наибольшее распространение в электронных машинах получило именно кодирование информации двоичным кодом? Текстовой основой, которая кодируется при помощи нулей и единиц, может быть абсолютно любая последовательность символов и знаков. Однако это не единственное преимущество, которое имеет двоичное текстовое кодирование информации. Все дело в том, что принцип, на котором устроен такой способ кодирования, очень прост, но в то же время достаточно функционален. Когда есть электрический импульс, его маркируют (условно, конечно) единицей. Нет импульса - маркируют нулем. То есть текстовое кодирование информации базируется на принципе построения последовательности электрических импульсов. Логическая последовательность, составленная из символов двоичного кода, называется машинным языком. В то же время кодирование и обработка текстовой информации при помощи двоичного кода позволяют осуществлять операции за достаточно краткий промежуток времени.

Биты и байты

Цифра, воспринимаемая машиной, кроет в себе некоторое количество информации. Оно равно одному биту. Это касается каждой единицы и каждого нуля, которые составляют ту или иную последовательность зашифрованной информации.

Соответственно, количество информации в любом случае можно определить, просто зная количество символов в последовательности двоичного кода. Они будут численно равны между собой. 2 цифры в коде несут в себе информацию объемом в 2 бита, 10 цифр - 10 бит и так далее. Принцип определения информационного объема, который кроется в том или ином фрагменте двоичного кода, достаточно прост, как вы видите.

Кодирование текстовой информации в компьютере

Вот сейчас вы читаете статью, которая состоит из последовательности, как мы считаем, букв алфавита русского языка. А компьютер, как говорилось ранее, воспринимает всю информацию (и в данном случае тоже) в качестве последовательности не букв, а нулей и единиц, обозначающих отсутствие и наличие электрического импульса.

Все дело в том, что закодировать один символ, который мы видим на экране, можно при помощи условной единицы измерения, называемой байтом. Как написано выше, у двоичного кода есть так называемая информационная нагрузка. Напомним, что численно она равняется суммарному количеству нулей и единиц в выбранном фрагменте кода. Так вот, 8 бит составляют 1 байт. Комбинации сигналов при этом могут быть самыми разными, как это легко можно заметить, нарисовав на бумаге прямоугольник, состоящий из 8 ячеек равного размера.

Выходит, что закодировать текстовую информацию можно при помощи алфавита, имеющего мощность 256 символов. В чем заключается суть? Смысл кроется в том, что каждый символ будет обладать своим двоичным кодом. Комбинации, “привязываемые” к определенным символам, начинаются от 00000000 и заканчиваются 11111111. Если переходить от двоичной к десятичной системе счисления, то кодировать информацию в такой системе можно от 0 до 255.

Не стоит забывать о том, что сейчас есть различные таблицы, которые используют кодировку букв русского алфавита. Это, например, ISO и КОИ-8, Mac и CP в двух вариациях: 1251 и 866. Легко убедиться в том, что текст, закодированный в одной из таких таблиц, не отобразится корректно в отличной от данной кодировке. Это происходит из-за того, что в разных таблицах к одному и тому же двоичному коду соответствуют различные символы.

Поначалу это было проблемой. Однако в настоящее время в программах уже встроены специальные алгоритмы, которые конвертируют текст, приводя его к корректному виду. 1997 год ознаменовался созданием кодировки под названием Unicode. В ней каждый символ имеет в своем распоряжении сразу 2 байта. Это позволяет закодировать текст, имеющий гораздо большее количество символов. 256 и 65536: есть ведь разница?

Кодирование графики

Кодирование текстовой и графической информации имеет некоторые схожие моменты. Как известно, для вывода графической информации используется периферийное устройство компьютера под названием “монитор”. Графика сейчас (речь идет сейчас именно о компьютерной графике) широко используется в самых разных сферах. Благо, аппаратные возможности персональных компьютеров позволяют решать достаточно сложные графические задачи.

Обрабатывать видеоинформацию стало возможным в последние годы. Но текст при этом значительно “легче” графики, что, в принципе, понятно. Из-за этого конечный размер файлов графики необходимо увеличивать. Преодолеть подобные проблемы можно, зная суть, в которой представляется графическая информация.

Давайте для начала разберемся, на какие группы подразделяется данный вид информации. Во-первых, это растровая. Во-вторых, векторная.

Растровые изображения достаточно схожи с клетчатой бумагой. Каждая клетка на такой бумаге закрашивается тем или иным цветом. Такой принцип чем-то напоминает мозаику. То есть получается, что в растровой графике изображение разбивается на отдельные элементарные части. Их именуют пикселями. В переводе на русский язык пиксели обозначают “точки”. Логично, что пиксели упорядочены относительно строк. Графическая сетка состоит как раз из определенного количества пикселей. Ее также называют растром. Принимая во внимание эти два определения, можно сказать, что растровое изображение является не чем иным, как набором пикселей, которые отображаются на сетке прямоугольного типа.

Растр монитора и размер пикселя влияют на качество изображения. Оно будет тем выше, чем больше растр у монитора. Размеры растра - это разрешение экрана, о котором наверняка слышал каждый пользователь. Одной из наиболее важных характеристик, которые имеют экраны компьютера, является разрешающая способность, а не только разрешение. Оно показывает, сколько пикселей приходится на ту или иную единицу длины. Обычно разрешающая способность монитора измеряется в пикселях на дюйм. Чем больше пикселей будет приходиться на единицу длины, тем выше будет качество, поскольку “зернистость” при этом снижается.

Обработка звукового потока

Кодирование текстовой и звуковой информации, как и другие виды кодирования, имеет некоторые особенности. Речь сейчас пойдет о последнем процессе: кодировании звуковой информации.

Представление звукового потока (как и отдельного звука) может быть произведено при помощи двух способов.

Аналоговая форма представления звуковой информации

При этом величина может принимать действительно огромное количество различных значений. Причем эти самые значения не остаются постоянными: они очень быстро изменяются, и этот процесс непрерывен.

Дискретная форма представления звуковой информации

Если же говорить о дискретном способе, то в этом случае величина может принимать только ограниченное количество значений. При этом изменение происходит скачкообразно. Закодировать дискретно можно не только звуковую, но и графическую информацию. Что касается и аналоговой формы, кстати.

Аналоговая звуковая информация хранится на виниловых пластинках, например. А вот компакт-диск уже является дискретным способом представления информации звукового характера.

В самом начале мы говорили о том, что компьютер воспринимает всю информацию на машинном языке. Для этого информация кодируется в форме последовательности электрических импульсов - нулей и единиц. Кодирование звуковой информации не является исключением из этого правила. Чтобы обработать на компьютере звук, его для начала нужно превратить в ту самую последовательность. Только после этого над потоком или единичным звуком могут совершаться операции.

Когда происходит процесс кодирования, поток подвергается временной дискретизации. Звуковая волна непрерывна, она развивается на малые участки времени. Значение амплитуды при этом устанавливается для каждого определенного интервала отдельно.

Заключение

Итак, что же мы выяснили в ходе данной статьи? Во-первых, абсолютно вся информация, которая выводится на монитор компьютера, прежде чем там появиться, подвергается кодированию. Во-вторых, это кодирование заключается в переводе информации на машинный язык. В-третьих, машинный язык представляет собой не что иное, как последовательность электрических импульсов - нулей и единиц. В-четвертых, для кодирования различных символов существуют отдельные таблицы. И, в-пятых, представить графическую и звуковую информацию можно в аналоговом и дискретном виде. Вот, пожалуй, основные моменты, которые мы разобрали. Одной из дисциплин, изучающей данную область, является информатика. Кодирование текстовой информации и его основы объясняются еще в школе, поскольку ничего сложного в этом нет.

План-конспект открытого урока по информатике.

Тема «Кодирование текстовой информации» 8 класс.

Цели:

Познакомить учащихся со способами кодирования информации в компьютере;

Рассмотреть примеры решения задач;

Способствовать развитию познавательных интересов учащихся.

Воспитывать выдержку и терпение в работе, чувства товарищества и взаимопонимания.

Задачи:

Формировать знания учащихся по теме “Кодирование текстовой (символьной) информации”;

Содействовать формированию у школьников образного мышления;

Развить навыки анализа и самоанализа;

Формировать умения планировать свою деятельность.

Ход урока:

Организационный момент (1 минута)

Проверка наличия учащихся.

Объявление темы урока (4 минуты)

Первый слайд презентации со словами «Тема урока». Самого названия темы нет. Учащимся предлагается самим назвать тему, используя слова, зашифрованные ребусами:

Объяснение нового материала (25 минут).

Учитель знакомит детей с понятием Криптография, рассказывает об одном из первых шифров - Шифре Цезаря, таким образом, проводя межпредметную связь с уроками истории Древнего мира.

Затем школьникам предлагается задание на кодирование (декодирование) текстовой информации с помощью шифра Цезаря.

Задание продублировано на слайде и в раздаточном материале (Приложение 1).

Связь с историей продолжается при объяснении детям еще одного способа кодирования текстовой информации - азбуки Морзе.

Затем учитель, обращая внимание на то, что в азбуке Морзе используются ДВА символа (точка и тире) подводит к современному способу кодирования текста в компьютере - двоичному кодированию.

Важной составляющей урока при изучении темы «Кодирование текстовой информации» является научить школьников решать задачи на определение информационного объема текстового сообщения. Таким образом, завершающей стадией этапа объяснения нового материала является пример решения подобной задачи.

Закрепление изученного материала (10 минут).

Учащимся предлагается решить самостоятельно задачи, подобные только что разобранной. Задача №3 является заданием с повышенной сложностью, предполагающая не только применение только что полученных знаний, но и умение находить основные условия задачи, отсекая второстепенную и неважную информацию.

Текст заданий продублирован на слайде презентации и в раздаточном материале (Приложение 1).

Итог урока. Домашнее задание. (5 минут)

Учащиеся говорят о теме урока, тех знаниях, которые они получили сегодня, о возникших сложностях при решении заданий. Наиболее активные школьники получают отметки. Учитель задает домашнее задание: записи в тетради, задание на карточке (Приложение 2)

Приложение 1.

Раздаточный материал к уроку

Расшифруйте фразу персидского поэта Джалаледдина Руми «кгнусм ёогкг фесл тцфхя фзужщз фхгрзх ёогксп» , закодированную кодом Цезаря

А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я

Условие: Определить информационный объем фразы

Оптимизм — это недостаток информации. (Текст записан в формате ASCII.)

Задача 1.

Текст в формате ASCII содержит 2 страницы по 64 строки, в каждой по 32 символа. Найдите информационный объем текста.

Задача 2.

Текст в формате Unicode (16 бит на символ) выглядит следующим образом: «Хочешь победить весь мир,то победи самого себя. Ф.М. Достоевский» Определите информационный объем фразы. (Кавычки не учитывать)

Задача 3.*

В алфавите племени Тумбу-Юмбу 16 букв. На этом языке записана конституция из 128 страниц законов и наставлений. Каждая страница - это 256 красочных и высокопарных строк о равенстве людей перед обедом и перед Законом. Строки всегда начинаются с заглавной буквы, а всего букв - 32. Флешку какого объема достаточно иметь вождю племени, чтобы хранить Тумбоюмбскую Конституцию?

P.S. Буквы бывают разные, помните об этом, иначе попадете на обед в качестве главного блюда.

Приложение 2.

Задание для домашней работы.

Текстовый файл в кодировке Unicode содержит 100 листов по 64 строки, по 32 символа в каждой. Каков информационный объем файла?

Текстовый файл в кодировке КОИ-8 содержит 128 листов по 64 строки, по 32 символа в каждой. Его передают за 4 минуты. Какова скорость соединения, по которому идет передача файла?

Поддержите проект — поделитесь ссылкой, спасибо!
Читайте также
Виртуальная реальность vs Дополненная реальность Что такое VR и AR Виртуальная реальность vs Дополненная реальность Что такое VR и AR Какой сервис даёт наибольшее бесплатное пространство на облаке Какой сервис даёт наибольшее бесплатное пространство на облаке Лучшая программа для обновления драйверов Лучшая программа для обновления драйверов