Скачать конспект урока кодирование текстовой информации. Разработка урока и презентация на тему "кодирование текстовой информации"

Скачать конспект урока кодирование текстовой информации. Разработка урока и презентация на тему
Скачать конспект урока кодирование текстовой информации. Разработка урока и презентация на тему "кодирование текстовой информации"
План-конспект урока

Предмет: Информатика.

Класс: 10

Тема урока: “Кодирование текстовой (символьной) информации”.

Тип урока: Обучающий.

Цели урока:


  • Познакомить учащихся со способами кодирования информации в компьютере;

  • Рассмотреть примеры решения задач;

  • Способствовать развитию познавательных интересов учащихся.

  • Воспитывать выдержку и терпение в работе, чувства товарищества и взаимопонимания.
Задачи урока:

  • Формировать знания учащихся по теме “Кодирование текстовой (символьной) информации”;

  • Содействовать формированию у школьников образного мышления;

  • Развить навыки анализа и самоанализа;

  • Формировать умения планировать свою деятельность.
Оборудование:

  • рабочие места учеников (персональный компьютер),

  • рабочее место учителя,

  • интерактивная доска,

  • практикум по информатике и информационным технологиям (авторы: Н. Угринович, Л. Босова, И. Михайлова),

  • мультимедийный проектор,

  • мультимедийная презентация,

  • электронные карточки zadachi.htm, kart_1(2,3).exe.
Ход урока

I. Организационный момент.

На интерактивной доске первый слайд мультимедийной презентации с темой урока.

Учитель: Здравствуйте, ребята. Садитесь. Дежурный, доложите об отсутствующих. (Доклад дежурного). Спасибо.

II. Работа над темой урока.

1. Объяснение нового материала.

Объяснение нового материала проходит в форме эвристической беседы с одновременным показом мультимедийной презентации на интерактивной доске (Приложение 1).

Учитель: Кодирование какой информации мы изучали на предыдущих занятиях?

Ответ : Кодирование числовой информации и представление чисел в компьютере.

Учитель : Перейдём к изучению нового материала. Запишите тему урока “Кодирование текстовой информации” (слайд 1). Рассматриваемые вопросы (слайд 2):

Исторический экскурс;

Двоичное кодирование текстовой информации;

Расчет количества текстовой информации.

Исторический экскурс

Человечество использует шифрование (кодировку) текста с того самого момента, когда появилась первая секретная информация. Перед вами несколько приёмов кодирования текста, которые были изобретены на различных этапах развития человеческой мысли (слайд 3) :

- криптография – это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц;

- азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире);

- сурдожесты – язык жестов, используемый людьми с нарушениями слуха.

Вопрос : Какие примеры кодирования текстовой информации можно привести еще?

Учащиеся приводят примеры.

Традиционно для кодирования одного символа используется 1 байт информации.

Вопрос : Какое количество различных символов можно закодировать?

Ответ учащихся : N = 2 I = 2 8 = 256.

Учитель : Верно. Достаточно ли этого для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры и другие символы?

Дети подсчитывают количество различных символов:

33 строчные буквы русского алфавита + 33 прописные буквы = 66;

Для английского алфавита 26 + 26 = 52;

Цифры от 0 до 9 и т.д.

Учитель : Ваш вывод?

Вывод учащихся : Получается, что нужно 127 символов. Остается еще 129 значений, которые можно использовать для обозначения знаков препинания, арифметических знаков, служебных операций (перевод строки, пробел и т.д.. Следовательно, одного байта вполне хватает, чтобы закодировать необходимые символы для кодирования текстовой информации.

Учитель : В компьютере каждый символ кодируется уникальным кодом.

Принято интернациональное соглашение о присвоении каждому символу своего уникального кода. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange) (слайд 7).

В этой таблице представлены коды от 0 до 127 (буквы английского алфавита, знаки математических операций, служебные символы и т.д.), причем коды от 0 до 32 отведены не символам, а функциональным клавишам. Запишите название этой кодовой таблицы и диапазон кодируемых символов.

Коды с 128 по 255 выделены для национальных стандартов каждой страны. Этого достаточно для большинства развитых стран.

Для России были введены несколько различных стандартов кодовой таблицы (коды с 128 по 255).

Какое слово получили?

Ответ : бит.

Учитель : Закройте файл без сохранения.

Понятие кодировки Unicode

СР1251: 208 232 236

КОИ8-Р:242 201 205

Переведем с помощью инженерного калькулятора последовательности кодов из десятичной системы счисления в шестнадцатеричную. Получим:

СР1251: D0 E8 EC

КОИ8-Р: F2 C9 CD

(Переход на режим просмотра презентации).

Работа в парах. (Класс делится на пары).

Учитель : Закодируем при помощи этих же таблиц кодировки слова, предложенные вам на карточках.

Прочитайте внимательно задание на слайде (слайд 13).

Задание: Все понятия употребляются в информатике или связаны с ней. Определите эти понятия и закодируйте их при помощи таблиц КОИ8-Р или CP1251. Переведите с помощью инженерного калькулятора последовательности кодов из десятичной системы счисления в шестнадцатеричную. Занесите полученный шестнадцатеричный код без пробелов в соответствующее Поле ввода. Нажмите кнопку Проверить и убедитесь в правильности решения. Понятия записывать заглавными буквами, кроме географических названий.


Карточка 1

Карточка 2

Карточка 3

Каким понятиям соответствуют приведенные ниже комментарии.

1. И в дневнике ученика, и в таблице базы банных.

2. И медицинская, и в компьютерной программе.


Перечисленные географические названия используются в понятиях, употребляемых в информатике, или связаны с ними.

1. Государство, столица которого Каир

2. Город в Узбекистане, с названием которого связано понятие “алгоритм”


Термины, соответствующие определениям, употребляются также в контексте устройства и работы автомобиля.

1. Часть двигателя внутреннего сгорания

2. Устройство в автомобиле для очистки топлива


Ответы

запись

процедура


Египет (египетский треугольник)

Хорезм (алгоритм от фамилии среднеазиатского математика аль-Хорезми)


цилиндр (совокупность дорожек с одинаковым номером на магнитных дисках)

фильтр (условие, по которому производится отбор записей в базе банных)


Коды

запись

СР1251: 231 224 239 232 241 252

E7 E0 EF E8 F1 FC


Египет

197 227 232 239 229 242

C5 E3 E8 EF E5 F2


цилиндр

246 232 235 232 237 228 240

F6 E8 EB E8 ED E4 F0


процедура

208 210 207 195 197 196 213 210 193

D0 D2 СF C3 C5 C4 D5 D2 C1


Хорезм

232 207 210 197 218 205

E8 CF D2 C5 DA CD


фильтр

198 201 204 216 212 210

C6 C9 CC D8 D4 D2


Учащиеся открывают карточки согласно номеру, названному учителем для каждой пары учащихся. (Приложение 2 , Приложение 3 , Приложение 4 )

(При подготовке электронных карточек следует учесть уровень сложности для различных групп учащихся).

Учитель : Назовите задуманные термины или понятия. Кто получил правильный код? У кого не получилось? В чем ваша ошибка, как вы считаете?

Учащиеся отвечают на вопросы в форме обсуждения.

(Переход на интерактивный режим работы доски).

Учитель : Теперь переходим к решению задач на количество текстовой информации и величин, связанных с определением количества текстовой информации.

Запишите условие задачи № 1. (На интерактивной доске – условие задачи № 1.) Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения:

Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.”

Решение : В данной фразе 108 символов, учитывая знаки препинания, кавычки и пробелы. Умножаем это количество на 8 бит. Получаем 108*8=864 бита. Есть ли вопросы по решению?

Учащиеся задают вопросы, если они возникают.

Учитель отвечает на вопросы или один ученик отвечает на вопрос другого.

Учитель : Рассмотрим задачу № 2. (Условие выводится на интерактивной доске). Запишите её условие: Лазерный принтер Canon LBP печатает со скоростью в среднем 6,3 Кбит в секунду. Сколько времени понадобится для распечатки 8-ми страничного документа, если известно, что на одной странице в среднем по 45 строк, в строке 70 символов (1 символ – 1 байт) (см. рис. 2).

Решение:

1) Находим количество информации, содержащейся на 1 странице:

45 * 70 * 8 бит = 25200 бит

2) Находим количество информации на 8 страницах:

25200 * 8 = 201600 бит

3) Приводим к единым единицам измерения. Для этого Мбиты переводим в биты:

6,3*1024=6451,2 бит/сек.

4) Находим время печати: 201600: 6451,2 ? 31 секунда.

Ваши вопросы.

Учащиеся задают вопросы, если они возникают.

Учитель отвечает на вопросы или один учащийся отвечает на вопрос другого.

Учитель : Теперь решим задачи на электронных карточках. Откройте файл zadachi.htm. (Приложение 5) (Учитель называет номер карточки, для каждого учащегося. Один ученик решает задачи у доски). Решите задачи и запишите ответ в соответствующее поле ввода.

В ходе выполнения задания учитель проверяет ответы учащихся.

III. Обобщение

1. Какой принцип кодирования текстовой информации используется в компьютере?

2. Как называется международная таблица кодировки символов?

3. Перечислите названия таблиц кодировок для русскоязычных символов.

4. В какой системе счисления представлены коды в перечисленных вами таблицах кодировок?

IV. Домашнее задание

(Слайд 15) По учебнику Угриновича § 2.10, практикум по информатике и информационным технологиям § 2.7, задания для самостоятельного выполнения 2.58-2.63 (для учащихся со слабой мотивацией к обучению) (2.58-2.66 для остальных учащихся).

Учитель подводит итог урока, выставляет оценки.

До свидания, спасибо за урок.

Тема урока: «Кодирование текстовой информации».

Предмет: Информатика и ИКТ .

Класс: 8

Учитель: Строкач Наталья Петровна

План-конспект урока

Оборудование : компьютер, мультимедийный проектор, доска, рабочие места учащихся (персональные компьютеры), учебник «Информатика и ИКТ. 9 класс» Н.Д. Угринович.

Тип урока : комбинированный.

Формы работы : фронтальная, коллективная, индивидуальная.

Материал к уроку: презентация, кодовые таблицы (ASCII , 5 кодовых таблиц русского языка: Windows , ISO , Mac , MS - DOS , КОИ-8), листы с заданиями практической работы.

Цели урока:

Обучающие:

    Ввести понятия текстовой информации ;

    формировать у учащихся представление о том, как текстовая информация кодируется в памяти компьютера;

    Научить определять код символа и символ по коду с использованием кодовых таблиц и текстового редактора. Научить кодировать и перекодировать текстовую информацию.

Развивающие:

    Развитие логического мышления, внимания, памяти;

    Развитие устойчивого познавательного интереса у учащихся;

Воспитательные:

    Формирование интереса к предмету, формирование мировоззрения;

    Воспитание культуры поведения на уроке, умения слушать.

Требования к знаниям и умениям:

Учащиеся должны знать:

    Принцип кодирования текстовой информации;

    Структуру таблицы кодировки ASCII.

Учащиеся должны уметь:

    Кодировать и декодировать символы с помощью таблицы кодов;

План урока:

    Организационный момент (3 мин)

    Актуализация знаний

    Изучение нового материала – ознакомиться с презентацией (15 мин)

    Закрепление материала. Выполнение заданий (17 мин)

    Проверка, выставление оценок, домашнее задание (5 мин)

Ход урока:

    Организационный момент.

    Постановка познавательной задачи

Вопрос:

    Какие виды информации может обрабатывать компьютер? (числовую, графическую, текстовую, аудио, видео)

Вопрос:

    В каком виде информация представлена в памяти компьютера? (в двоичном коде)

Вопрос:

    Каким образом происходит преобразование графической информации из аналоговой в дискретную?(путём пространственной дискретизации изображение разбивается на пиксели)

Вопрос:

    Как преобразуется звук в цифровую форму? (с помощью временной дискретизации)

Вопрос:

    Как вы думаете, какую информацию человек чаще всего обрабатывает с помощью компьютера?

В настоящее время большая часть персональных компьютеров в мире (и по количеству, и по времени) занято обработкой текстовой информации. (слайд 1,2)

3. Сообщение темы, передача целей урока

Сегодня тема нашего урока: «Кодирование текстовой информации» (слайд 3,4).

Цель урока (слайд 5)

    Познакомиться с понятиями кодирование текстовой информации, кодовая таблица.

    Научиться определять код символа и символ по коду с помощью текстовых редакторов.

4.Введение новых знаний.

Вопрос:

    Сколько символов необходимо для кодирования текстовой информации?

Воспользуемся методом «прикидки». Для этого нам необходимо вспомнить, какими символами мы пользуемся на письме.

33*2(заглавные и строчные) + 10(цифры) + 10(знаки препинания) =86 символов.

    Вопрос:

Все ли тексты русскоязычные? Какие символы следует добавить на клавиатуру?

Для английского алфавита 26 + 26 = 52;

Получается, что нужно 127 символов. Остается еще 129 значений, которые можно использовать для обозначения знаков препинания, арифметических знаков, служебных операций (перевод строки, пробел и т. д).

Множество всех символов с помощью, которого записывается текст, называется алфавитом.(слайд 6)

Число символов в алфавите называется его мощностью. (слайд7)

Итак, на клавиатуре 256 символов. Все перечисленные символы компьютер должен уметь распознавать и переводить в двоичный код. (слайд 8)

    Вопрос:

Каким образом компьютер различает символы?

Компьютер различает символы по комбинации электрических импульсов – двоичный код символа

Каким количеством бит информации можно закодировать 1 символ, если таких символов 256?

Вспомним формулу N =2 i . (слайд 9)

256=2 8 , следовательно, 1 символ кодируется 8 битами или 1 байтом. (слайды 10,11,12).

Двоичный код каждого символа можно записать в виде десятичного числа.

    )Вопрос:

Можете сказать, какие слова закодированы числами на доске? (слайд 13)

65; 112; 112; 108; 101

200; 216; 228; 224

Вопрос: Что нужно, чтобы можно было раскодировать эти слова? (Таблицы для перевода)

Возьмите с края стола таблицы и назовите, какое первое слово у вас получилось (Apple)

Какое второе слово? Возникла проблемная ситуация – таблиц с кодами, большими 127, пять. И по разным кодовым таблицам получаются разные слова. (Шифр – по таблице ISO)

Кодовая таблица – таблица, в которой устанавливается соответствие между числовыми кодами и символами. (Слайд №14)

Существует международная общепринятая кодовая таблица, называемая ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена. (Слайд №15)

Части кодовой таблицы ASCII:

0-32 – это команды и функциональные клавиши;

33-127 – интернациональная часть (латиница);

128-255 – национальная часть.

Исторически так сложилось, что национальная часть кодовых таблиц появилась несогласованно в разных странах и в разных операционных системах. Кодовые таблицы ISO и КОИ-8 появились в СССР. Кодовая таблица MS-DOS была разработана для операционной системы Microsoft DOS, кодовая таблица Windows – для операционной системы Microsoft Windows. Кодовая таблица Mac используется в операционных системах Mac OS.

В настоящее время существует 5 кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Русские кодировки (кириллица): (Слайд №16)

Windows,

MS - DOS ,

КОИ-8,

Mac ,

ISO .

Вопрос: Как вы думаете, почему последний символ в кодовой таблице имеет номер 255, а ранее было сказано, что кодов 256. (Потому что нумерация начинается с 0.)

Иногда возникает необходимость в одном текстовом документе использовать не два языка, а больше. Например, при печати текста по геометрии могут понадобиться символы русского языка, латинские буквы, греческие буквы. Как быть в такой ситуации?

В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, в 1991 году был предложен новый стандарт кодов, где на каждый символ выделялось 2 байта памяти.

Кодовую таблицу назвали Unicode(Слайд №17)

В кодовой таблице Unicode 65536 символов (Слайд №18)

Юникод включает практически все современные письменности, в том числе: арабскую, армянскую, бенгальскую, бирманскую, греческую, грузинскую, деванагари, иврит, кириллицу, коптскую, кхмерскую, латинскую, тамильскую, хангыль, хань (Китай, Япония, Корея), чероки, эфиопскую, японскую (катакана, хирагана, кандзи) и другие.

С академической целью добавлены многие исторические письменности, в том числе: древнегреческая, египетские иероглифы, клинопись, письменность майя, этрусский алфавит.

В Юникоде представлен широкий набор математических и музыкальных символов, а также пиктограмм.

Запись в тетради: (Слайд №19)

Кодовые таблицы:

ASCII

Unicode

Количество байт на 1 символ

1 байт

2 байта

Количество символов

256

65536

Итак, сделаем вывод: один и тот же код в разных кодовых таблицах дает разные символы.

5. Практическая работа

Вспомните цели урока.

Первая цель – познакомиться с понятием кодирование текстовой информации, кодовая таблица. Скажите, достигли мы данной цели? (Да )

Еще перед собой мы ставили цели, достигнуть которых нам поможет практическая работа «Кодирование текстовой информации». (Слайд №21)

Какие цели мы поставим перед собой в практической работе? (Научиться кодировать текстовую информацию, научиться определять код символа и символ по коду, используя кодовые таблицы и текстовый редактор )

Практическая работа состоит из двух частей:

Первая часть состоит из трех заданий и выполняется на компьютере:

Прочитайте задания, которые нужно выполнить на компьютере. Какую программу мы будем использовать при выполнении данных заданий? (Текстовые редакторы MS Word и Блокнот).

Сейчас перед вами на экране окно текстового редактора. (Слайд №22)

Мы будем определять код символа и находить символ по коду при помощи вставки специальных символов (Вставка →Символы).

Выбирая необходимый символ, мы видим его числовой код в нижнем правом углу окна. Все символы в таблице упорядочены по возрастанию числовых кодов, поэтому можно найти символ с заданным вам числовым кодом.

Все результаты вам нужно записать в тетрадь.

Есть вопросы по выполнению практической работы? (Нет).

Можно приступить к выполнению заданий на компьютерах. Возьмите тетради и ручки. Не забывайте о правилах техники безопасности, сохранения здоровья при работе за компьютером.

Учащиеся выполняют работу на компьютерах, учитель наблюдает, помогает, корректирует работу, следит за правильной посадкой за компьютером.

Учащиеся, справившиеся с выполнением первой части, выключают компьютеры, возвращаются за парты и выполняют вторую часть практической работы.

Учитель наблюдает за выполнением работы, помогает при возникновении трудностей.

Результат:

« WORD »

200 205 212 206 208 204 192 210 200 202 192- «ИНФОРМАТИКА» в « Windows »

УЧЕНИК

«Блокнот»: абвгдежий рстуфхцчшщ я хочу учиться

Вторая часть состоит из двух заданий и выполняется в тетрадях по кодовым таблицам:(слайд 23)

204 224 242 229 236 224 242 232 247 229 241 234 232 233 32 235 232 246 229 233

    Маша послала своей подруге Оле письмо, написанное в кодировке Windows, а Оля прочитала его в кодировке ISO. Получилась бессмысленная фраза «Яючф№ртыџў!». Помоги Оле прочитать письмо.

Для тех, кто справится с заданиями быстрее, в работе предложено дополнительное задание: Закодировать фразу «Пришел, увидел, победил» в кодировке ISO.

3. Дополнительное задание

С помощью кодовой таблицы Windows раскодируйте фразу:

205 229 32 246 226 229 242 251 130 224 32 226 255 237 243 242

205 229 32 235 224 228 238 248 232 130 32 224 32 232 236 232 245 235 238 239 224 254 242

205 229 32 225 229 235 252 184 130 32 224 32 232 245 32 240 224 231 226 229 248 232 226 224 254 242

205 224 32 237 232 245 32 236 238 230 237 238 32 226 229 248 224 242 252 32 235 224 239 248 243

Разбить ребят на 4 группы по 3 человека. Каждой группе выдать по 1 строке. Когда все учащиеся справляются с заданием, осуществляется проверка его выполнения. У каждого из четырех вариантов закодированы строчки из загадки.

Не цветы, а вянут,
Не ладоши, а ими хлопают,
Не белье, а их развешивают
На них можно вешать лапшу.

Учащиеся по очереди читают свои варианты текста. Отгадываем вместе!

6. Итоги урока

Подведем итог урока.

Ответьте на следующие вопросы по материалу урока: (Слайд №25)

    Что необходимо для кодирования текстовой информации на компьютере? (Кодовая таблица)

    Как называется международная кодовая таблица? (ASCII)

    Сколько существует кодировок русского языка? (Пять)

    С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов? (чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты).

Вспомним цели урока: (Слайд №26)

    Познакомиться с понятием кодирование текстовой информации, кодовая таблица.

    Научиться кодировать и перекодировать текстовую информацию с помощью кодовых таблиц.

    Научиться определять код символа и символ по коду с помощью текстового редактора.

Вопрос: Достигли мы данных целей? (Да, достигли)

Выставление оценок за урок.

7. Домашнее задание

Запись домашнего задания в дневниках или тетрадях: (Слайд №27)

    Учебник, стр. 49 – 52, п. 2.1.

    Контрольные вопросы на стр. 52

    Задания для самостоятельного выполнения № 2.1., 2.2.

8.Рефлексия

Учащимся дается индивидуальная карточка, в которой нужно подчеркнуть фразы, характеризующие работу ученика на уроке по трем направлениям.

Урок

Я на уроке

Итог

1. интересно

1. работал

1. понял материал

2. скучно

2. отдыхал

2. узнал больше, чем знал

3.безразлично

3.помогал другим

3.не понял

Кодирование текстовой информации

Цель работы: научиться определять числовые коды символов, вводить символы с помощью числовых кодов, используя кодировку Windows , Unicode (Юникод).

Порядок выполнения работы:

Задание1.

Определение числового кода символа с помощью текстового редактора Word .

    Запустить текстовый редактор Word командой [Программы/ Microsoft Word ]

    Ввести команду [вставка/символ]. На экране появится диалоговая панель Символ . Для определения числового кода символа в кодировке Windows из: выбрать тип кодировки кириллица (дес.).

    Код знака: появится десятичный числовой код символа (в данном случае 192).

    Для определения шестнадцатеричного числового кода символа в кодировке Unicode с помощью раскрывающегося списка из: выбрать тип кодировки Юникод(шестн.)

    В таблице символов выбрать символ (например, прописную букву «А»). В текстовом поле Код знака: появится шестнадцатеричный числовой код символа (в данном случае 0410).

Задание2.

Ввод символа с помощью числовых кодов в текстовом редакторе Блокнот

    Запустить стандартное приложение Блокнот командой [Программы/ Стандартные/ Блокнот]

    Alt } ввести число 0224, отпустить клавишу { Alt }, в документе появится символ «а». Повторить процедуру для числовых кодов от 0225 до 0233, в документе появится последовательность из 12 символов «абвгдежзий» в кодировке Windows .

    С помощью дополнительной цифровой клавиатуры при нажатой клавише { Alt } ввести число 224, в документе появится символ «р». Повторить процедуру для числовых кодов от 225 до 233, в документе появится последовательность из 12 символов «рстуфхцчшщ» в кодировке MS - DOS

Задание3:

    Используя кодировку Windows Microsoft Word закодировать слово ИНФОРМАТИКА

    Используя кодировку Unicode , расположенную в текстовом редакторе Microsoft Word декодируйте слово 0423 0427 0415 041 D 0418 041А

    Используя кодировку Windows , расположенную в приложении Блокнот декодируйте предложение:

0255 0032 0245 0238 0247 0243 0032 0243 0247 0232 0242 0252 0241 0255

Текстовую информацию кодируют двоичным кодом через обозначение каждого символа алфавита определенным целым числом. С помощью восьми двоичных разрядов возможно закодировать 256 различных символов. Данного количества символов достаточно для выражения всех символов английского и русского алфавитов.

В первые годы развития компьютерной техники трудности кодирования текстовой информации были вызваны отсутствием необходимых стандартов кодирования. В настоящее время, напротив, существующие трудности связаны с множеством одновременно действующих и зачастую противоречивых стандартов.

Для английского языка, который является неофициальным международным средством общения, эти трудности были решены. Институт стандартизации США выработал и ввел в обращение систему кодирования ASCII (American Standard Code for Information Interchange – стандартный код информационного обмена США).

Для кодировки русского алфавита были разработаны несколько вариантов кодировок:

1) Windows-1251 – введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение;

2) КОИ-8 (Код Обмена Информацией, восьмизначный) – другая популярная кодировка российского алфавита, распространенная в компьютерных сетях на территории Российской Федерации и в российском секторе Интернет;

3) ISO (International Standard Organization – Международный институт стандартизации) – международный стандарт кодирования символов русского языка. На практике эта кодировка используется редко.

Ограниченный набор кодов (256) создает трудности для разработчиков единой системы кодирования текстовой информации. Вследствие этого было предложено кодировать символы не 8-разрядными двоичными числами, а числами с большим разрядом, что вызвало расширение диапазона возможных значений кодов. Система 16-разрядного кодирования символов называется универсальной – UNICODE. Шестнадцать разрядов позволяет обеспечить уникальные коды для 65 536 символов, что вполне достаточно для размещения в одной таблице символов большинства языков.

Несмотря на простоту предложенного подхода, практический переход на данную систему кодировки очень долго не мог осуществиться из-за недостатков ресурсов средств вычислительной техники, так как в системе кодирования UNICODE все текстовые документы становятся автоматически вдвое больше. В конце 1990-х гг. технические средства достигли необходимого уровня, начался постепенный перевод документов и программных средств на систему кодирования UNICODE.

Кодирование текстовой информации в компьютере - порой неотъемлемое условие корректной работы устройства или отображения того или иного фрагмента. Как происходит этот процесс в ходе работы компьютера с текстом и визуальной информацией, звуком - все это мы разберем в данной статье.

Вступление

Электронная вычислительная машина (которую мы в повседневной жизни называем компьютером) воспринимает текст весьма специфично. Для нее кодирование текстовой информации очень важно, поскольку она воспринимает каждый текстовый фрагмент в качестве группы обособленных друг от друга символов.

Какие бывают символы?

В роли символов для компьютера выступают не только русские, английские и другие буквы, но и еще знаки препинания, а также другие знаки. Даже пробел, которым мы разделяем слова при печатании на компьютере, устройство воспринимает как символ. Чем-то очень напоминает высшую математику, ведь там, по мнению многих профессоров, ноль имеет двойное значение: он и является числом, и одновременно ничего не обозначает. Даже для философов вопрос пробела в тексте может стать актуальной проблемой. Шутка, конечно, но, как говорится, в каждой шутке есть доля правды.

Какая бывает информация?

Итак, для восприятия информации компьютеру необходимо запустить процессы обработки. А какая вообще бывает информация? Темой этой статьи является кодирование текстовой информации. Мы уделим особенное внимание этой задаче, но разберемся и с другими микротемами.

Информация может быть текстовой, числовой, звуковой, графической. Компьютер должен запустить процессы, обеспечивающие кодирование текстовой информации, чтобы вывести на экран то, что мы, например, печатаем на клавиатуре. Мы будем видеть символы и буквы, это понятно. А что же видит машина? Она воспринимает абсолютно всю информацию - и речь сейчас идет не только о тексте - в качестве определенной последовательности нулей и единиц. Они составляют основу так называемого двоичного кода. Соответственно, процесс, который преобразует поступающую на устройство информацию в понятную ему, имеет название “двоичное кодирование текстовой информации”.

Краткий принцип действия двоичного кода

Почему наибольшее распространение в электронных машинах получило именно кодирование информации двоичным кодом? Текстовой основой, которая кодируется при помощи нулей и единиц, может быть абсолютно любая последовательность символов и знаков. Однако это не единственное преимущество, которое имеет двоичное текстовое кодирование информации. Все дело в том, что принцип, на котором устроен такой способ кодирования, очень прост, но в то же время достаточно функционален. Когда есть электрический импульс, его маркируют (условно, конечно) единицей. Нет импульса - маркируют нулем. То есть текстовое кодирование информации базируется на принципе построения последовательности электрических импульсов. Логическая последовательность, составленная из символов двоичного кода, называется машинным языком. В то же время кодирование и обработка текстовой информации при помощи двоичного кода позволяют осуществлять операции за достаточно краткий промежуток времени.

Биты и байты

Цифра, воспринимаемая машиной, кроет в себе некоторое количество информации. Оно равно одному биту. Это касается каждой единицы и каждого нуля, которые составляют ту или иную последовательность зашифрованной информации.

Соответственно, количество информации в любом случае можно определить, просто зная количество символов в последовательности двоичного кода. Они будут численно равны между собой. 2 цифры в коде несут в себе информацию объемом в 2 бита, 10 цифр - 10 бит и так далее. Принцип определения информационного объема, который кроется в том или ином фрагменте двоичного кода, достаточно прост, как вы видите.

Кодирование текстовой информации в компьютере

Вот сейчас вы читаете статью, которая состоит из последовательности, как мы считаем, букв алфавита русского языка. А компьютер, как говорилось ранее, воспринимает всю информацию (и в данном случае тоже) в качестве последовательности не букв, а нулей и единиц, обозначающих отсутствие и наличие электрического импульса.

Все дело в том, что закодировать один символ, который мы видим на экране, можно при помощи условной единицы измерения, называемой байтом. Как написано выше, у двоичного кода есть так называемая информационная нагрузка. Напомним, что численно она равняется суммарному количеству нулей и единиц в выбранном фрагменте кода. Так вот, 8 бит составляют 1 байт. Комбинации сигналов при этом могут быть самыми разными, как это легко можно заметить, нарисовав на бумаге прямоугольник, состоящий из 8 ячеек равного размера.

Выходит, что закодировать текстовую информацию можно при помощи алфавита, имеющего мощность 256 символов. В чем заключается суть? Смысл кроется в том, что каждый символ будет обладать своим двоичным кодом. Комбинации, “привязываемые” к определенным символам, начинаются от 00000000 и заканчиваются 11111111. Если переходить от двоичной к десятичной системе счисления, то кодировать информацию в такой системе можно от 0 до 255.

Не стоит забывать о том, что сейчас есть различные таблицы, которые используют кодировку букв русского алфавита. Это, например, ISO и КОИ-8, Mac и CP в двух вариациях: 1251 и 866. Легко убедиться в том, что текст, закодированный в одной из таких таблиц, не отобразится корректно в отличной от данной кодировке. Это происходит из-за того, что в разных таблицах к одному и тому же двоичному коду соответствуют различные символы.

Поначалу это было проблемой. Однако в настоящее время в программах уже встроены специальные алгоритмы, которые конвертируют текст, приводя его к корректному виду. 1997 год ознаменовался созданием кодировки под названием Unicode. В ней каждый символ имеет в своем распоряжении сразу 2 байта. Это позволяет закодировать текст, имеющий гораздо большее количество символов. 256 и 65536: есть ведь разница?

Кодирование графики

Кодирование текстовой и графической информации имеет некоторые схожие моменты. Как известно, для вывода графической информации используется периферийное устройство компьютера под названием “монитор”. Графика сейчас (речь идет сейчас именно о компьютерной графике) широко используется в самых разных сферах. Благо, аппаратные возможности персональных компьютеров позволяют решать достаточно сложные графические задачи.

Обрабатывать видеоинформацию стало возможным в последние годы. Но текст при этом значительно “легче” графики, что, в принципе, понятно. Из-за этого конечный размер файлов графики необходимо увеличивать. Преодолеть подобные проблемы можно, зная суть, в которой представляется графическая информация.

Давайте для начала разберемся, на какие группы подразделяется данный вид информации. Во-первых, это растровая. Во-вторых, векторная.

Растровые изображения достаточно схожи с клетчатой бумагой. Каждая клетка на такой бумаге закрашивается тем или иным цветом. Такой принцип чем-то напоминает мозаику. То есть получается, что в растровой графике изображение разбивается на отдельные элементарные части. Их именуют пикселями. В переводе на русский язык пиксели обозначают “точки”. Логично, что пиксели упорядочены относительно строк. Графическая сетка состоит как раз из определенного количества пикселей. Ее также называют растром. Принимая во внимание эти два определения, можно сказать, что растровое изображение является не чем иным, как набором пикселей, которые отображаются на сетке прямоугольного типа.

Растр монитора и размер пикселя влияют на качество изображения. Оно будет тем выше, чем больше растр у монитора. Размеры растра - это разрешение экрана, о котором наверняка слышал каждый пользователь. Одной из наиболее важных характеристик, которые имеют экраны компьютера, является разрешающая способность, а не только разрешение. Оно показывает, сколько пикселей приходится на ту или иную единицу длины. Обычно разрешающая способность монитора измеряется в пикселях на дюйм. Чем больше пикселей будет приходиться на единицу длины, тем выше будет качество, поскольку “зернистость” при этом снижается.

Обработка звукового потока

Кодирование текстовой и звуковой информации, как и другие виды кодирования, имеет некоторые особенности. Речь сейчас пойдет о последнем процессе: кодировании звуковой информации.

Представление звукового потока (как и отдельного звука) может быть произведено при помощи двух способов.

Аналоговая форма представления звуковой информации

При этом величина может принимать действительно огромное количество различных значений. Причем эти самые значения не остаются постоянными: они очень быстро изменяются, и этот процесс непрерывен.

Дискретная форма представления звуковой информации

Если же говорить о дискретном способе, то в этом случае величина может принимать только ограниченное количество значений. При этом изменение происходит скачкообразно. Закодировать дискретно можно не только звуковую, но и графическую информацию. Что касается и аналоговой формы, кстати.

Аналоговая звуковая информация хранится на виниловых пластинках, например. А вот компакт-диск уже является дискретным способом представления информации звукового характера.

В самом начале мы говорили о том, что компьютер воспринимает всю информацию на машинном языке. Для этого информация кодируется в форме последовательности электрических импульсов - нулей и единиц. Кодирование звуковой информации не является исключением из этого правила. Чтобы обработать на компьютере звук, его для начала нужно превратить в ту самую последовательность. Только после этого над потоком или единичным звуком могут совершаться операции.

Когда происходит процесс кодирования, поток подвергается временной дискретизации. Звуковая волна непрерывна, она развивается на малые участки времени. Значение амплитуды при этом устанавливается для каждого определенного интервала отдельно.

Заключение

Итак, что же мы выяснили в ходе данной статьи? Во-первых, абсолютно вся информация, которая выводится на монитор компьютера, прежде чем там появиться, подвергается кодированию. Во-вторых, это кодирование заключается в переводе информации на машинный язык. В-третьих, машинный язык представляет собой не что иное, как последовательность электрических импульсов - нулей и единиц. В-четвертых, для кодирования различных символов существуют отдельные таблицы. И, в-пятых, представить графическую и звуковую информацию можно в аналоговом и дискретном виде. Вот, пожалуй, основные моменты, которые мы разобрали. Одной из дисциплин, изучающей данную область, является информатика. Кодирование текстовой информации и его основы объясняются еще в школе, поскольку ничего сложного в этом нет.

Текстовая информация состоит из символов: букв, цифр, знаков препинания и др. Одного байта достаточно для хранения 256 различных значений, что позволяет размещать в нем любой из алфавитно-цифровых символов. Первые 128 символов (занимающие семь младших бит) стандартизированы с помощью кодировки ASCII (American Standart Code for Information Interchange). Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255. Для кодировки русских букв используют различные кодовые таблицы (КОI-8R, СР1251, CP10007, ISO-8859-5):

KOI8 R - восьмибитовый стандарт кодирования букв кириллических алфавитов (для операционной системы UNIX). Разработчики KOI8 R поместили символы русского алфавита в верхней части расширенной таблицы ASCII таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что из текста написанного в KOI8 R , получается текст, написанный латинскими символами. Например, слова «дом высокий» приобретают форму «dom vysokiy»;

СР1251 – восьмибитовый стандарт кодирования, используемый в OS Windows;

CP10007 - восьмибитовый стандарт кодирования, используемый в кириллице операционной системы Macintosh (компьютеров фирмы Apple);

ISO -8859-5 – восьмибитовый код, утвержденный в качестве стандарта для кодирования русского языка.

Кодирование графической информации

Графическую информацию можно представлять в двух формах: аналоговой и дискретной . Живописное полотно , созданное художником, - это пример аналогового представления , а изображение, напечатанное при помощи принтера , состоящее из отдельных (элементов) точек разного цвета, - это дискретное представление .

Путем разбиения графического изображения (дискретизации) происходит преобразование графической информации из аналоговой формы в дискретную. При этом производится кодирование - присвоение каждому элементу графического изображения конкретного значения в форме кода. Создание и хранение графических объектов возможно в нескольких видах - в виде векторного , фрактального или растрового изображения. Отдельным предметом считается 3D (трехмерная) графика , в которой сочетаются векторный и растровый способы формирования изображений.

Векторная графика используется для представления таких графических изображений как рисунки, чертежи, схемы.

Они формируются из объектов - набора геометрических примитивов (точки, линии, окружности, прямоугольники), которым присваиваются некоторые характеристики, например, толщина линий, цвет заполнения.

Изображение в векторном формате упрощает процесс редактирования, так как изображение может без потерь масштабироваться, поворачиваться, деформироваться. При этом каждое преобразование уничтожает старое изображение (или фрагмент), и вместо него строится новое. Такой способ представления хорош для схем и деловой графики. При кодировании векторного изображения хранится не само изображение объекта, а координаты точек, используя которые программа каждый раз воссоздает изображение заново.

Основным недостатком векторной графики является невозможность изображения фотографического качества . В векторном формате изображение всегда будет выглядеть, как рисунок.

Растровая графика. Любую картинку можно разбить на квадраты, получая, таким образом, растр - двумерный массив квадратов. Сами квадраты - элементы растра или пиксели (picture"s element) - элементы картинки. Цвет каждого пикселя кодируется числом, что позволяет для описания картинки задавать порядок номеров цветов (слева направо или сверху вниз). В память записывается номер каждой ячейки, в которой хранится пиксель.

Рисунок в растровом формате

Каждому пикселю сопоставляются значения яркости, цвета, и прозрачности или комбинация этих значений. Растровый образ имеет некоторое число строк и столбцов. Этот способ хранения имеет свои недостатки: больший объём памяти, необходимый для работы с изображениями.

Объем растрового изображения определяется умножением количества пикселей на информационный объем одной точки, который зависит от количества возможных цветов. В современных компьютерах в основном используют следующие разрешающие способности экрана: 640 на 480, 800 на 600, 1024 на 768 и 1280 на 1024 точки. Яркость каждой точки и ее координаты можно выразить с помощью целых чисел, что позволяет использовать двоичный код для того чтобы обрабатывать графические данные.

В простейшем случае (черно-белое изображение без градаций серого цвета) каждая точка экрана может иметь одно из двух состояний - «черная» или «белая», то есть для хранения ее состояния необходим 1 бит. Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемым для кодирования цвета точки. Наиболее распространенными значениями глубины цвета являются 8, 16, 24, 32, 64 бита.

Для кодирования цветных графических изображений произвольный цвет делят на его составляющие. Используются следующие системы кодирования:

HSB (H - оттенок (hue), S - насыщенность (saturation), B - яркость (brightness)),

RGB (Red - красный , Green - зелёный , Blue - синий ) и

CMYK (C yan - голубой, Magenta – пурпурный, Yellow - желтый и Black – черный).

Первая система удобна для человека , вторая - для компьютерной обработки , а последняя - для типографий . Использование этих цветовых систем связано с тем, что световой поток может формироваться излучениями, представляющими собой комбинацию "чистых" спектральных цветов: красного, зеленого, синего или их производных.

Фрактал – это объект, отдельные элементы которого наследуют свойства родительских структур. Поскольку более детальное описание элементов меньшего масштаба происходит по простому алгоритму, описать такой объект можно всего лишь несколькими математическими уравнениями. Фракталы позволяют описывать изображения, для детального представления которых требуется относительно мало памяти.

Рисунок в фрактальном формате

Трёхмерная графика (3 D ) оперирует с объектами в трёхмерном пространстве. Трёхмерная компьютерная графика широко используется в кино, компьютерных играх, где все объекты представляются как набор поверхностей или частиц. Всеми визуальными преобразованиями в 3D-графике управляют с помощью операторов, имеющих матричное представление .

Кодирование звуковой информации

Музыка, как и любой звук, является не чем иным, как звуковыми колебаниями, зарегистрировав которые, её можно достаточно точно воспроизвести. Для представления звукового сигнала в памяти компьютера, необходимо поступившие акустические колебания представить в цифровом виде, то есть преобразовать в последовательность нулей и единиц. С помощью микрофона звук преобразуется в электрические колебания, после чего можно измерить амплитуду колебаний через равные промежутки времени (несколько десятков тысяч раз в секунду), используя специальное устройство - аналого-цифровой преобразователь (АЦП ). Для воспроизведения звука цифровой сигнал необходимо превратить в аналоговый с помощью цифро-аналогового преобразователя (ЦАП ). Оба эти устройства встроены в звуковую карту компьютера. Указанная последовательность превращений представлена на рис. 2.6..

Трансформация аналогового сигнала в цифровой и обратно

Каждое измерение звука записывается в двоичном коде. Этот процесс называется дискретизацией (семплированием), выполняемым с помощью АЦП.

Семпл (sample англ. образец) - это промежуток времени между двумя измерениями амплитуды аналогового сигнала. Кроме промежутка времени семплом называют также любую последовательность цифровых данных, которые получили путем аналого-цифрового преобразования. Важным параметром семплирования является частота - количество измерений амплитуды аналогового сигнала в секунду. Диапазон частоты дискретизации звука от 8000 до 48000 измерений за одну секунду.

Графическое представление процесса дискретизации

На качество воспроизведения влияют частота дискретизации и разрешение (размер ячейки, отведённой под запись значения амплитуды). Например, при записи музыки на компакт-диски используются 16-разрядные значения и частота дискретизации 44032 Гц.

На слух человек воспринимает звуковые волны, имеющие частоту в пределах от 16 Гц до 20 кГц (1 Гц - 1 колебание в секунду).

В формате компакт-дисков Audio DVD за одну секунду сигнал измеряется 96 000 раз, т.е. применяют частоту семплирования 96 кГц. Для экономии места на жестком диске в мультимедийных приложениях довольно часто применяют меньшие частоты: 11, 22, 32 кГц. Это приводит к уменьшению слышимого диапазона частот, а, значит, происходит искажение того, что слышно.