Формула вычисления информационного объема цифрового звукового файла. Кодирование и обработка звуковой информации

24.01.2021

Кодирование текстовой информации

n — количество символов

i — количество бит на 1 символ (кодировка)

Кодирование графической информации

Рассмотрим некоторые понятия и формулы, необходимые для решения ЕГЭ по информатике данной темы.

Пиксель – это наименьший элемент растрового изображения, который имеет определенный цвет.
Разрешение – это количество пикселей на дюйм размера изображения.
Глубина цвета - это количество битов, необходимое для кодирования цвета пикселя.
Если глубина кодирования составляет i битов на пиксель, код каждого пикселя выбирается из 2 i возможных вариантов, поэтому можно использовать не более 2 i различных цветов.

Формула для нахождения количества цветов в используемой палитре:

N — количество цветов
i — глубина цвета
В цветовой модели RGB (красный (R), зеленый (G), синий (B)): R (0..255) G (0..255) B (0..255) -> получаем 2 8 вариантов на каждый из трех цветов.
R G B: 24 бита = 3 байта — режим True Color (истинный цвет)

Найдем формулу объема памяти для хранения растрового изображения :

I — объем памяти, требуемый для хранения изображения
M — ширина изображения в пикселях
N — высота изображения в пикселях
i — глубина кодирования цвета или разрешение

Или можно формулу записать так:

I = N * i битов

где N – количество пикселей (M * N) и i – глубина кодирования цвета (разрядность кодирования)

* для указания объема выделенной памяти встречаются разные обозначения (V или I ).

Следует также помнить формулы преобразования:

1 Мбайт = 2 20 байт = 2 23 бит,
1 Кбайт = 2 10 байт = 2 13 бит

Кодирование звуковой информации

Познакомимся с понятиями и формулами, необходимыми для решения заданий 9 ЕГЭ по информатике.

Пример: при ƒ=8 кГц, глубине кодирования 16 бит на отсчёт и длительности звука 128 с . потребуется:

✍ Решение:

I = 8000*16*128 = 16384000 бит
I = 8000*16*128/8 = 2 3 * 1000 * 2 4 * 2 7 / 2 3 = 2 14 / 2 3 =2 11 =
= 2048000 байт

Определение скорости передачи информации

Канал связи всегда имеет ограниченную пропускную способность (скорость передачи информации), которая зависит от свойств аппаратуры и самой линии связи(кабеля)

Объем переданной информации I вычисляется по формуле:

I — объем информации
v — пропускная способность канала связи (измеряется в битах в секунду или подобных единицах)
t — время передачи

* Вместо обозначения скорости V иногда используется q
* Вместо обозначения объема сообщения I иногда используется Q

Скорость передачи данных определяется по формуле:

и измеряется в бит/с

Решение заданий 9 ЕГЭ по информатике

Тема: Кодирование изображений

9_1: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 1 (Крылов С.С., Чуркина Т.Е.):

Какой минимальный объем памяти (в Кбайт) нужно зарезервировать, чтобы можно было сохранить любое растровое изображение размером 160 х 160 пикселей при условии, что в изображении могут использоваться 256 различных цветов?

✍ Решение:

Используем формулу нахождения объема:
Подсчитаем каждый сомножитель в формуле, стараясь привести числа к степеням двойки:
M x N:

160 * 160 = 20 * 2³ * 20 * 2³ = 400 * 2 6 = = 25 * 2 4 * 2 6

Нахождение глубины кодирования i :

256 = 2 8 т.е. 8 бит на пиксель (из формулы кол-во цветов = 2 i)

Находим объем:

I = 25 * 2 4 * 2 6 * 2 3 = 25 * 2 13 - всего бит на всё изображение

Переводим в Кбайты:

(25 * 2 13) / 2 13 = 25 Кбайт

Результат: 25

Детальный разбор задания 9 ЕГЭ по информатике предлагаем посмотреть в видео:

ЕГЭ по информатике задание 9.2 (источник: вариант 11, К. Поляков):

Рисунок размером 128 на 256 пикселей занимает в памяти 24 Кбайт (без учёта сжатия). количество цветов в палитре изображения.

✍ Решение:

где M * N — общее количество пикселей. Найдем это значение, используя для удобства степени двойки:

128 * 256 = 2 7 * 2 8 = 2 15

В вышеуказанной формуле i — это глубина цвета, от которой зависит количество цветов в палитре:

Количество цветов = 2 i

Найдем i из той же формулы:

i = I / (M*N)

Учтем, что 24 Кбайт необходимо перевести в биты . Получим:

2 3 * 3 * 2 10 * 2 3: i = (2 3 * 3 * 2 10 * 2 3) / 2 15 = = 3 * 2 16 / 2 15 = 6 бит

Теперь найдем количество цветов в палитре:

2 6 = 64 вариантов цветов в цветовой палитре

Результат: 64

Смотрите видеоразбор задания:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.3 (источник: 9.1 вариант 24, К. Поляков):

После преобразования растрового 256-цветного графического файла в 4-цветный формат его размер уменьшился на 18 Кбайт . Каков был размер исходного файла в Кбайтах?

✍ Решение:

По формуле объема файла изображения имеем:

где N — общее количество пикселей,
а i

i можно найти, зная количество цветов в палитре:

количество цветов = 2 i

до преобразования: i = 8 (2 8 = 256) после преобразования: i = 2 (2 2 = 4)

Составим систему уравнений на основе имеющихся сведений, примем за x количество пикселей (разрешение):

I = x * 8 I - 18 = x * 2

Выразим x в первом уравнении:

x = I / 8

I (объем файла):

I - 18 = I / 4 4I - I = 72 3I = 72 I = 24

Результат: 24

Подробный разбор 9 задания ЕГЭ смотрите на видео:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.4 (источник: 9.1 вариант 28, К. Поляков, С. Логинова):

Цветное изображение было оцифровано и сохранено в виде файла без использования сжатия данных. Размер полученного файла – 42 Мбайт 2 раза меньше и глубиной кодирования цвета увеличили в 4 раза больше по сравнению с первоначальными параметрами. Сжатие данных не производилось. Укажите размер файла в Мбайт , полученного при повторной оцифровке.

✍ Решение:

По формуле объема файла изображения имеем:

где N
а i

В такого рода задачах необходимо учесть, что уменьшение разрешения в 2 раза, подразумевает уменьшение в 2 раза пикселей отдельно по ширине и по высоте. Т.е. в целом N уменьшается в 4 раза !
Составим систему уравнений на основе имеющихся сведений, в которой первое уравнение будет соответствовать данным до преобразования файла, а второе уравнение — после:

42 = N * i I = N / 4 * 4i

Выразим i в первом уравнении:

i = 42 / N

Подставим во второе уравнение и найдем I (объем файла):

\[ I= \frac {N}{4} * 4* \frac {42}{N} \]

После сокращений получим:

I = 42

Результат: 42

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.5 (источник: 9.1 вариант 30, К. Поляков, С. Логинова):

Изображение было оцифровано и сохранено в виде растрового файла. Получившийся файл был передан в город А по каналу связи за 72 секунды . Затем то же изображение было оцифровано повторно с разрешением в 2 раза больше и глубиной кодирования цвета в 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б , пропускная способность канала связи с городом Б в 3 раза выше, чем канала связи с городом А.
Б ?

✍ Решение:

По формуле скорости передачи файла имеем:

где I — объем файла, а t — время

По формуле объема файла изображения имеем:

где N — общее количество пикселей или разрешение,
а i — глубина цвета (количество бит, выделенное на 1 пиксель)

Для данной задачи, необходимо уточнить, что разрешение на самом деле имеет два сомножителя (пикселей по ширине * пикселей по высоте). Поэтому при увеличении разрешения в два раза, увеличатся оба числа, т.е. N увеличится в 4 раза вместо двух.
Изменим формулу получения объема файла для города Б :

\[ I= \frac {2*N * i}{3} \]

Для города А и Б заменим значения объема в формуле для получения скорости:

\[ V= \frac {N*i}{72} \]

\[ 3*V= \frac{\frac {4*N*i}{3}}{t} \]

\[ t*3*V= \frac {4*N*i}{3} \]

Подставим значение скорости из формулы для города А в формулу для города Б:

\[ \frac {t*3*N*i}{72}= \frac {4*N*i}{3} \]

Выразим t :

t = 4 * 72 / (3 * 3) = 32 секунды

Результат: 32

Другой способ решения смотрите в видеоуроке:

Тема: Кодирование изображений:

ЕГЭ по информатике задание 9.6 (источник: вариант 33, К. Поляков):

Камера делает фотоснимки размером 1024 х 768 пикселей. На хранение одного кадра отводится 900 Кбайт .
Найдите максимально возможное количество цветов в палитре изображения.

✍ Решение:

Количество цветов зависит от глубины кодирования цвета, которая измеряется в битах. Для хранения кадра, т.е. общего количества пикселей выделено 900 Кбайт. Переведем в биты:

900 Кбайт = 2 2 * 225 * 2 10 * 2 3 = 225 * 2 15

Посчитаем общее количество пикселей (из заданного размера):

1024 * 768 = 2 10 * 3 * 2 8

Определим объем памяти, необходимый для хранения не общего количества пикселей, а одного пикселя ([память для кадра]/[кол-во пикселей]):

\[ \frac {225 * 2^{15}}{3 * 2^{18}} = \frac {75}{8} \approx 9 \]

9 бит на 1 пиксель

9 бит — это i — глубина кодирования цвета. Количество цветов = 2 i :

2 9 = 512

Результат: 512

Смотрите подробное решение на видео:

Тема: Кодирование изображений:

9_8: Демоверсия ЕГЭ 2018 информатика:

Автоматическая фотокамера производит растровые изображения размером 640 ×480 пикселей. При этом объём файла с изображением не может превышать 320 Кбайт, упаковка данных не производится.
Какое максимальное количество цветов можно использовать в палитре?

✍ Решение:

По формуле объема файла изображения имеем:

где N i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель)

Посмотрим, что из формулы нам уже дано:

I = 320 Кбайт, N = 640 * 420 = 307200 = 75 * 2 12 всего пикселей, i - ?

Количество цветов в изображении зависит от параметра i , который неизвестен. Вспомним формулу:

количество цветов = 2 i

Поскольку глубина цвета измеряется в битах, то необходимо объем перевести из Килобайт в биты:

320 Кбайт = 320 * 2 10 * 2 3 бит = 320 * 2 13 бит

Найдем i :

\[ i = \frac {I}{N} = \frac {320 * 2^{13}}{75 * 2^{12}} \approx 8,5 бит \]

Найдем количество цветов:

2 i = 2 8 = 256

Результат: 256

Подробное решение данного 9 задания из демоверсии ЕГЭ 2018 года смотрите на видео:

9_21: : ЕГЭ по информатике задание 9.21 (источник: К. Поляков, 9.1 вариант 58):

Для хранения в информационной системе документы сканируются с разрешением 300 ppi . Методы сжатия изображений не используются. Средний размер отсканированного документа составляет 5 Мбайт . В целях экономии было решено перейти на разрешение 150 ppi и цветовую систему, содержащую 16 цветов . Средний размер документа, отсканированного с изменёнными параметрами, составляет 512 Кбайт .

Определите количество цветов в палитре до оптимизации .

✍ Решение:

По формуле объема файла изображения имеем:

где N — общее количество пикселей или разрешение, а i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель).

Так как по заданию имеем разрешение, выраженное в пикселях на дюйм, то фактически это означает:

I = значение ppi 2 * N * i

Формула количества цветов:

количество цветов = 2 i

Посмотрим, что из формулы нам уже дано до экономного варианта и при экономном варианте:

Неэкономный вариант: I = 5 Мбайт = 5 * 2 23 бит, N - ?, i - ? 300 ppi Экономный вариант: I = 512 Кбайт = 2 9 * 2 13 бит = 2 22 бит, N - ?, i = 4 бит (2 4 = 16) 150 ppi

Так как в экономном режиме нам известны все составляющие формулы, кроме разрешения (N), то найдем разрешение:

N = I / (i * 150*150 ppi) N = 2 22 / (4 * 22500)

Подставим все известные значения, включая найденное N, в формулу для неэкономного режима:

I = N * 300*300 ppi * i 5 * 2 23 = (2 22 * 300 * 300 * i) / (22500 * 4 );

Выразим i и вычислим его значение:

i = (5 * 2 23 * 22500 * 4) / (2 22 * 300 * 300) = 9000 / 900 = 10 бит

По формуле нахождения количества цветов в палитре имеем:

2 10 = 1024

Результат: 1024

Тема: Кодирование звука

9_7: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 15 (Крылов С.С., Чуркина Т.Е.):

На студии при четырехканальной (квадро ) звукозаписи с 32 -битным разрешением за 30 секунд был записан звуковой файл. Сжатие данных не производилось. Известно, что размер файла оказался 7500 Кбайт.

С какой частотой дискретизации (в кГц) велась запись? В качестве ответа укажите только число, единицы измерения указывать не нужно.

✍ Решение:

По формуле объема звукового файла получим:

I = β * t * ƒ * S

Из задания имеем:

I = 7500 Кбайт β = 32 бита t = 30 секунд S = 4 канала

ƒ — частота дискретизации — неизвестна, выразим ее из формулы:

\[ ƒ = \frac {I}{S*B*t} = \frac {7500 * 2^{10} * 2^2 бит}{2^7 * 30}Гц = \frac { 750 * 2^6}{1000}КГц = 2^4 = 16 \]

2 4 = 16 КГц

Результат: 16

Для более детального разбора предлагаем посмотреть видео решения данного 9 задания ЕГЭ по информатике:

Тема: Кодирование звука:

ЕГЭ по информатике задание 9_9 (источник: 9.2 вариант 36, К. Поляков):

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 2 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд; пропускная способность канала связи с городом Б в 4 раза выше, чем канала связи с городом А .

Сколько секунд длилась передача файла в город A ? В ответе запишите только целое число, единицу измерения писать не нужно.

✍ Решение:

Для решения понадобится формула нахождения скорости передачи данных формулы:
Вспомним также формулу объема звукового файла:

I = β * ƒ * t * s

где:
I - объем
β - глубина кодирования
ƒ - частота дискретизации
t - время
S - кол-во каналов (если не указывается, то моно)

Выпишем отдельно, все данные, касающиеся города Б (про А практически ничего не известно):

город Б: β - в 2 раза выше ƒ - в 3 раза меньше t - 15 секунд, пропускная способность (скорость V ) - в 4 раза выше

Исходя из предыдущего пункта, для города А получаем обратные значения:

город А: β Б / 2 ƒ Б * 3 I Б / 2 V Б / 4 t Б / 2, t Б * 3, t Б * 4 - ?

Дадим объяснения полученным данным:

так как глубина кодирования (β ) для города Б выше в 2 раза, то для города А она будет ниже в 2 раза, соответственно, и t уменьшится в 2 раза:

t = t/2

так как частота дискретизации (ƒ) для города Б меньше в 3 раза, то для города А она будет выше в 3 раза; I и t изменяются пропорционально, значит, при увеличении частоты дискретизации увеличится не только объем, но и время:

t = t * 3

скорость (V ) (пропускная способность) для города Б выше в 4 раза, значит, для города А она будет ниже в 4 раза; раз скорость ниже, то время выше в 4 раза (t и V — обратно пропорциональная зависимость из формулы V = I/t ):

t = t * 4

Таким образом, с учетом всех показателей, время для города А меняется так:

\[ t_А = \frac {15}{2} * 3 * 4 \]

90 секунд

Результат: 90

Подробное решение смотрите на видео:

Тема: Кодирование звука:

ЕГЭ по информатике задание 9.10 (источник: 9.2 вариант 43, К. Поляков):

Музыкальный фрагмент был записан в формате стерео (двухканальная запись ), оцифрован и сохранён в виде файла без использования сжатия данных. Размер полученного файла – 30 Мбайт. Затем тот же музыкальный фрагмент был записан повторно в формате моно и оцифрован с разрешением в 2 раза выше и частотой дискретизации в 1,5 раза меньше, чем в первый раз. Сжатие данных не производилось.

Укажите размер файла в Мбайт , полученного при повторной записи. В ответе запишите только целое число, единицу измерения писать не нужно.

✍ Решение:

I = β * ƒ * t * S

I - объем
β - глубина кодирования
ƒ - частота дискретизации
t - время
S -количество каналов

Выпишем отдельно, все данные, касающиеся первого состояния файла, затем второго состояния — после преобразования:

1 состояние: S = 2 канала I = 30 Мбайт 2 состояние: S = 1 канал β = в 2 раза выше ƒ = в 1,5 раза ниже I = ?

Так как изначально было 2 канала связи (S ), а стал использоваться один канал связи, то файл уменьшился в 2 раза:

I = I / 2

Глубина кодирования (β ) увеличилась в 2 раза, то и объем (I ) увеличится в 2 раза (пропорциональная зависимость):

I = I * 2

Частота дискретизации (ƒ ) уменьшилась в 1,5 раза, значит, объем (I ) тоже уменьшится в 1,5 раза:

I = I / 1,5

Рассмотрим все изменения объема преобразованного файла:

I = 30 Мбайт / 2 * 2 / 1,5 = 20 Мбайт

Результат: 20

Смотрите видеоразбор данной задачи:

Тема: Кодирование звуковых файлов:

ЕГЭ по информатике задание 9_11 (источник: 9.2 вариант 72, К. Поляков):

Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 100 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 3 раза выше и частотой дискретизации в 4 раз меньше , чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд.

Во сколько раз скорость (пропускная способность канала) в город Б больше пропускной способности канала в город А ?

✍ Решение:

Вспомним формулу объема звукового файла:

I = β * ƒ * t * S

I - объем
β - глубина кодирования
ƒ - частота дискретизации
t - время

Выпишем отдельно, все данные, касающиеся файла, переданного в город А , затем преобразованного файла, переданного в город Б :

А: t = 100 c. Б: β = в 3 раза выше ƒ = в 4 раза ниже t = 15 c.

✎ 1 способ решения:

Скорость передачи данных (пропускная способность) зависит от времени передачи файла: чем больше время, тем ниже скорость. Т.е. во сколько раз увеличится время передачи, во столько раз уменьшится скорость и наоборот.

Из предыдущего пункта видим, что если мы вычислим, во сколько раз уменьшится или увеличится время передачи файла в город Б (по сравнению с городом А), то мы поймем, во сколько раз увеличится или уменьшится скорость передачи данных в город Б (обратная зависимость).

Соответственно, представим, что преобразованный файл передается в город А . Объем файла изменился в 3/4 раза (глубина кодирования (β) в 3 раза выше, частота дискретизации (ƒ) в 4 раза ниже). Объем и время изменяются пропорционально. Значит и время изменится в 3/4 раза:

t A для преобразов. = 100 секунд * 3 / 4 = 75 секунд

Т.е. преобразованный файл передавался бы в город А 75 секунд, а в город Б 15 секунд. Вычислим, во сколько раз снизилось время передачи:

75 / 15 = 5

Раз время передачи в город Б снизилось в 5 раз, соответственно, скорость увеличилась в 5 раз.

Ответ: 5

✎ 2 способ решения:

Выпишем отдельно все данные, касающиеся файла, переданного в город А : А: t А = 100 c. V А = I / 100

Поскольку увеличение или уменьшение во сколько-то раз разрешения и частоты дискретизации приводит к соответствующему увеличению или уменьшению объема файла (пропорциональная зависимость), то запишем известные данные для преобразованного файла, переданного в город Б :

Б: β = в 3 раза выше ƒ = в 4 раза ниже t = 15 c. I Б = (3 / 4) * I V Б = ((3 / 4) * I) / 15

Теперь найдем соотношение V Б к V А:

\[ \frac {V_Б}{V_А} = \frac {3/_4 * I}{15} * \frac {100}{I} = \frac {3/_4 * 100}{15} = \frac {15}{3} = 5 \]

(((3/4) * I) / 15) * (100 / I)= (3/4 * 100) / 15 = 15/3 = 5 S - количество каналов

Для простоты расчетов пока не будем брать во внимание количество каналов. Рассмотрим, какие данные у нас есть, и какие из них необходимо перевести в другие единицы измерения:

β = 32 бита ƒ = 32кГц = 32000Гц t = 2 мин = 120 с

Подставим данные в формулу; учтем, что результат необходимо получить в Мбайтах, соответственно, произведение будем делить на 2 23 (2 3 (байт) * 2 10 (Кбайт) * 2 10 (Мбайт)):

(32 * 32000 * 120) / 2 23 = =(2 5 * 2 7 * 250 * 120) / 2 23 = = (250*120) / 2 11 = = 30000 / 2 11 = = (2 4 * 1875) / 2 11 = = 1875 / 128 ~ 14,6

Полученный результат значения объема умножим на 4 с учетом количества каналов связи:

14,6 * 4 = 58,5

Ближайшее число, кратное 10 — это 60 .

Результат: 60

Смотрите подробное решение:

Тема: Кодирование звука:

9_19: Государственный выпускной экзамен ГВЭ 2018 (информатика ГВЭ ФИПИ, задание 7):

Производится двухканальная (стерео) цифровая звукозапись. Значение сигнала фиксируется 48 000 раз в секунду , для записи каждого значения используется 32 бит . Запись длится 5 минут , её результаты записываются в файл, сжатие данных не производится.

Какая из приведённых ниже величин наиболее близка к размеру полученного файла?

1) 14 Мбайт
2) 28 Мбайт
3) 55 Мбайт
4) 110 Мбайт

✍ Решение:

I = β * ƒ * t * S

Подставим в формулу имеющиеся значения:

I = 48000 * 32 * 300 * 2

Поскольку значения большие, необходимо числа 48000 и 300 выразить в степенях двойки:

48000 | 2 24000 | 2 12000 | 2 6000 | 2 = 375 * 2 7 3000 | 2 1500 | 2 750 | 2 375 | 2 - уже не делится 187,5 300 | 2 = 75 * 2 2 150 | 2 75 | 2 - уже не делится 37,5

Получим:

I = 375 * 75 * 2 15

В предложенных вариантах ответа видим, что результат везде в Мбайт. Значит, необходимо разделить полученный нами результат на 2 23 (2 3 * 2 10 * 2 10):

I = 375 * 75 * 2 15 / 2 23 = 28125 / 2 8

Найдем приближенное к числу 28125 значение в степени двойки:

2 10 = 1024 1024 * 2 2048 * 2 4096 * 2 8192 * 2 16384 * 2 32768

Получаем:

2 10 * 2 5 = 2 15 = 32768 2 10 * 2 4 = 2 14 = 16384

Число 28125 лежит между этими значениями, значит берем их:

2 15 / 2 8 = 2 7 = 128 2 14 / 2 8 = 2 6 = 64

Выбираем ответ, значение в котором находится между двумя этими числами: вариант 4 (110 Мбайт)

Результат: 4

Подробное решение ГВЭ задания 7 2018 года смотрите на видео:

Тема: Кодирование звука:

9_20: Решение 9 задания ЕГЭ по информатике (диагностический вариант экзаменационной работы 2018 года, С.С. Крылов, Д.М. Ушаков):

Производится двухканальная (стерео) звукозапись с частотой дискретизации 4 кГц и 64-битным разрешением . Запись длится 1 минуту , ее результаты записываются в файл, сжатие данных не производится.

Определите приблизительно размер получившегося файла (в Мбайтах) . В качестве ответа укажите ближайшее к размеру файла целое число, кратное 2 .

✍ Решение:

По формуле объема звукового файла имеем:

I = β * ƒ * t * S

I - объем β - глубина кодирования = 32 бита ƒ - частота дискретизации = 48000 Гц t - время = 5 мин = 300 с S - количество каналов = 2

Подставим в формулу имеющиеся значения. Для удобства будем использовать степени двойки:

ƒ = 4 кГЦ = 4 * 1000 Гц ~ 2 2 * 2 10 B = 64 бит = 2 6 / 2 23 Мбайт t = 1 мин = 60 c = 15 * 2 2 c S = 2

Подставим значения в формулу объема звукового файла:

I = 2 6 * 2 2 * 2 10 * 15 * 2 2 * 2 1 / 2 23 = 15/4 ~ 3,75

Ближайшее целое, кратное двум — это число 4

Результат: 4

Видеоразбор задания:

Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.

Цель-мотивация. Подготовка к ЕГЭ.

План урока

1. Просмотр презентации по теме с комментариями учителя. Приложение 1

Материал презентации: Кодирование звуковой информации.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера :

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ :

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация . Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так

далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Аудиоадаптер (звуковая плата) - специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:

Частотой дискретизации
Разрядностью(глубина звука).

Частота временной дискретизации

Это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.

Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 =65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2 I = 2 16 = 65536, где I - глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

Звуковой файл - файл, хранящий звуковую информацию в числовой двоичной форме.

2. Повторяем единицы измерения информации

1 байт = 8 бит

1 Кбайт = 2 10 байт=1024 байт

1 Мбайт = 2 10 Кбайт=1024 Кбайт

1 Гбайт = 2 10 Мбайт=1024 Мбайт

1 Тбайт = 2 10 Гбайт=1024 Гбайт

1 Пбайт = 2 10 Тбайт=1024 Тбайт

3. Закрепить изученный материал, просмотрев презентацию, учебник

4. Решение задач

Учебник , показ решения на презентации.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

Задача (самостоятельно). Учебник , показ решения на презентации.
Определить информационный объем цифрового аудио файла длительностью звучания которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении 8 битов.

5. Закрепление. Решение задач дома, самостоятельно на следующем уроке

Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность?

Объем свободной памяти на диске - 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук?

Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

Цифровой аудиофайл содержит запись звука низкого качества (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?

Две минуты записи цифрового аудиофайла занимают на диске 5,05 Мб. Частота дискретизации - 22 050 Гц. Какова разрядность аудиоадаптера?

Объем свободной памяти на диске - 0,1 Гб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

Ответы

№ 92. 124,8 секунды.

№ 93. 22,05 кГц.

№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти - 15,1 Мб.

№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации - 11 кГц, разрядность аудиоадаптера - 8. Длительность звучания равна 60,5 с.

№ 96. 16 битов.

№ 97. 20,3 минуты.

Литература

1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера)

2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.

3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.

Основные понятия

Частота дискретизации(f) определяет количество отсчетов, запоминаемых за 1 секунду;

1 Гц (один герц) – это один отсчет в секунду,

а 8 кГц – это 8000 отсчетов в секунду

Глубина кодирования (b) – это количество бит, которое необходимо для кодирования 1 уровня громкости

Время звучания (t)

Объем памяти для хранения данных 1 канала (моно)

I=f·b·t

(для хранения информации о звуке длительностью t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется I бит памяти)

При двухканальной записи (стерео) объем памяти, необходимый для хранения данных одного канала, умножается на 2

I=f·b·t·2

Единицы измерения I - биты, b -биты, f - Герцы, t – секунды Частота дискретизации 44,1 кГц, 22,05 кГц, 11,025 кГц

Кодирование звуковой информации

Основные теоретические положения

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".

Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду, измеряется в герцах (Гц). Обозначим частоту дискретизации буквой f.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации b , которое называется глубиной кодирования звука

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 b . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 b = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Задачи для самостоятельной подготовки .

1. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц. (861 Кбайт)

2. Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1)0,3 2) 4 3) 16 4) 132

3. Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 11 2) 13 3) 15 4) 22

4. Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?

1) 11 2) 12 3) 13 4) 15

Временная дискретизация звука.

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.
Дискретизация - преобразование непрерывных сигналов в набор дискретных значений, каждому из которых присваивается определенный двоичный код.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".

Каждой "ступеньке" присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:
N=2 16 =65356[уровней звука],
где I - глубина кодирования.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Количество измерений в секунду может лежать в диапазоне от 8000 до 96 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 96[кГц]. При частоте 8[кГц] качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 96[кГц] - качеству звучания аудио-CD. Следует также учитывать, что возможны как моно, так и стерео режимы.

Информационный объем звукового файла

Для определения объема звукового файла V зф необходимо умножить количество измерений K изм на глубину кодирования (число бит на уровень) V 1изм:

V зф = K изм * V 1изм

Где количество измерений K изм зависит от:

Задача 1

Домашнее задание

1 Определить объем звукового стерео файла, при частоте дискретизации (дд)[кГц], времени звучания (гг)[с] для (мм)-битного кодирования.

2 Определить время звучания в [с] звукового моно файла, имеющего объем, равный (гг) [КБ], при глубине кодирования (мм)[БИТ] и частоте дискретизации (дд)[кГц].
Где (дд) - дата вашего рождения, (мм) - месяц вашего рождения, (гг) - год вашего рождения.

С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым . Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука . В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным , то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
$1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Определение 2

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.

Замечание 1

Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио -CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла .

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ - общая длительность звучания, выражаемая в секундах,

$f$ - частота дискретизации (Гц),

$k$ - глубина кодирования (бит).

Пример 1

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table .

Метод FM (Frequency Modulation ) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table ) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) - один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Формула вычисления информационного объема цифрового звукового файла. Кодирование и обработка звуковой информации

Читайте также

Кодирование текстовой информации

Кодирование графической информации

Кодирование звуковой информации

Определение скорости передачи информации

Решение заданий 9 ЕГЭ по информатике

Тема: Кодирование изображений

Тема: Кодирование звука

Временная дискретизация звука.

Информационный объем звукового файла

V зф = K изм * V 1изм

Задача 1

Домашнее задание

Частота дискретизации звука

Информационный объем звукового файла

Основные методы кодирования звуковой информации

Примеры форматов звуковых файлов