Формула вычисления информационного объема цифрового звукового файла. Кодирование и обработка звуковой информации
Читайте также
Урок посвящен разбору задания 9 ЕГЭ по информатике
9 тема — «Кодирование информации, объем и передача информации» — характеризуется, как задания базового уровня сложности, время выполнения – примерно 5 минут, максимальный балл — 1
Кодирование текстовой информации
Кодирование графической информации
Рассмотрим некоторые понятия и формулы, необходимые для решения ЕГЭ по информатике данной темы.
- Пиксель – это наименьший элемент растрового изображения, который имеет определенный цвет.
- Разрешение – это количество пикселей на дюйм размера изображения.
- Глубина цвета - это количество битов, необходимое для кодирования цвета пикселя.
- Если глубина кодирования составляет i битов на пиксель, код каждого пикселя выбирается из 2 i возможных вариантов, поэтому можно использовать не более 2 i различных цветов.
- N — количество цветов
- i — глубина цвета
- В цветовой модели RGB (красный (R), зеленый (G), синий (B)): R (0..255) G (0..255) B (0..255) -> получаем 2 8 вариантов на каждый из трех цветов.
- R G B: 24 бита = 3 байта — режим True Color (истинный цвет)
- I — объем памяти, требуемый для хранения изображения
- M — ширина изображения в пикселях
- N — высота изображения в пикселях
- i — глубина кодирования цвета или разрешение
- где N – количество пикселей (M * N) и i – глубина кодирования цвета (разрядность кодирования)
- Следует также помнить формулы преобразования:
Формула для нахождения количества цветов в используемой палитре:
Найдем формулу объема памяти для хранения растрового изображения :
Или можно формулу записать так:
I = N * i битов
* для указания объема выделенной памяти встречаются разные обозначения (V или I ).
1 Мбайт = 2 20 байт = 2 23 бит,
1 Кбайт = 2 10 байт = 2 13 бит
Кодирование звуковой информации
Познакомимся с понятиями и формулами, необходимыми для решения заданий 9 ЕГЭ по информатике.
Пример: при ƒ=8 кГц, глубине кодирования 16 бит на отсчёт и длительности звука 128 с . потребуется:
✍ Решение:
I = 8000*16*128 = 16384000 бит
I = 8000*16*128/8 = 2 3 * 1000 * 2 4 * 2 7 / 2 3 = 2 14 / 2 3 =2 11 =
= 2048000 байт
Определение скорости передачи информации
- Канал связи всегда имеет ограниченную пропускную способность (скорость передачи информации), которая зависит от свойств аппаратуры и самой линии связи(кабеля)
- I — объем информации
- v — пропускная способность канала связи (измеряется в битах в секунду или подобных единицах)
- t — время передачи
Объем переданной информации I вычисляется по формуле:
* Вместо обозначения скорости V
иногда используется q
* Вместо обозначения объема сообщения I
иногда используется Q
Скорость передачи данных определяется по формуле:
и измеряется в бит/с
Решение заданий 9 ЕГЭ по информатике
Тема: Кодирование изображений
9_1: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 1 (Крылов С.С., Чуркина Т.Е.):
Какой минимальный объем памяти (в Кбайт) нужно зарезервировать, чтобы можно было сохранить любое растровое изображение размером 160 х 160 пикселей при условии, что в изображении могут использоваться 256 различных цветов?
✍ Решение:
- Используем формулу нахождения объема:
- Подсчитаем каждый сомножитель в формуле, стараясь привести числа к степеням двойки:
- M x N:
Результат: 25
Детальный разбор задания 9 ЕГЭ по информатике предлагаем посмотреть в видео:
ЕГЭ по информатике задание 9.2 (источник: вариант 11, К. Поляков):
Рисунок размером 128 на 256 пикселей занимает в памяти 24 Кбайт (без учёта сжатия). количество цветов в палитре изображения.
✍ Решение:
- где M * N — общее количество пикселей. Найдем это значение, используя для удобства степени двойки:
Количество цветов = 2 i
i = I / (M*N)
Результат: 64
Смотрите видеоразбор задания:
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.3 (источник: 9.1 вариант 24, К. Поляков):
После преобразования растрового 256-цветного графического файла в 4-цветный формат его размер уменьшился на 18 Кбайт . Каков был размер исходного файла в Кбайтах?
✍ Решение:
- По формуле объема файла изображения имеем:
- i можно найти, зная количество цветов в палитре:
где N
— общее количество пикселей,
а i
количество цветов = 2 i
Результат: 24
Подробный разбор 9 задания ЕГЭ смотрите на видео:
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.4 (источник: 9.1 вариант 28, К. Поляков, С. Логинова):
Цветное изображение было оцифровано и сохранено в виде файла без использования сжатия данных. Размер полученного файла – 42 Мбайт 2 раза меньше и глубиной кодирования цвета увеличили в 4 раза больше по сравнению с первоначальными параметрами. Сжатие данных не производилось. Укажите размер файла в Мбайт , полученного при повторной оцифровке.
✍ Решение:
- По формуле объема файла изображения имеем:
- В такого рода задачах необходимо учесть, что уменьшение разрешения в 2 раза, подразумевает уменьшение в 2 раза пикселей отдельно по ширине и по высоте. Т.е. в целом N уменьшается в 4 раза !
- Составим систему уравнений на основе имеющихся сведений, в которой первое уравнение будет соответствовать данным до преобразования файла, а второе уравнение — после:
где N
а i
\[ I= \frac {N}{4} * 4* \frac {42}{N} \]
Результат: 42
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.5 (источник: 9.1 вариант 30, К. Поляков, С. Логинова):
Изображение было оцифровано и сохранено в виде растрового файла. Получившийся файл был передан в город А
по каналу связи за 72 секунды
. Затем то же изображение было оцифровано повторно с разрешением в 2
раза больше и глубиной кодирования цвета в 3
раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б
, пропускная способность канала связи с городом Б в 3
раза выше, чем канала связи с городом А.
Б
?
✍ Решение:
- По формуле скорости передачи файла имеем:
- По формуле объема файла изображения имеем:
- Для данной задачи, необходимо уточнить, что разрешение на самом деле имеет два сомножителя (пикселей по ширине * пикселей по высоте). Поэтому при увеличении разрешения в два раза, увеличатся оба числа, т.е. N увеличится в 4 раза вместо двух.
- Изменим формулу получения объема файла для города Б :
- Для города А и Б заменим значения объема в формуле для получения скорости:
- Подставим значение скорости из формулы для города А в формулу для города Б:
- Выразим t :
где I — объем файла, а t — время
где N
— общее количество пикселей или разрешение,
а i
— глубина цвета (количество бит, выделенное на 1 пиксель)
\[ I= \frac {2*N * i}{3} \]
\[ V= \frac {N*i}{72} \]
\[ 3*V= \frac{\frac {4*N*i}{3}}{t} \]
\[ t*3*V= \frac {4*N*i}{3} \]
\[ \frac {t*3*N*i}{72}= \frac {4*N*i}{3} \]
Результат: 32
Другой способ решения смотрите в видеоуроке:
Тема: Кодирование изображений:
ЕГЭ по информатике задание 9.6 (источник: вариант 33, К. Поляков):
Камера делает фотоснимки размером 1024 х 768
пикселей. На хранение одного кадра отводится 900 Кбайт
.
Найдите максимально возможное количество цветов
в палитре изображения.
✍ Решение:
- Количество цветов зависит от глубины кодирования цвета, которая измеряется в битах. Для хранения кадра, т.е. общего количества пикселей выделено 900 Кбайт. Переведем в биты:
\[ \frac {225 * 2^{15}}{3 * 2^{18}} = \frac {75}{8} \approx 9 \]
9 бит на 1 пиксель
Результат: 512
Смотрите подробное решение на видео:
Тема: Кодирование изображений:
9_8: Демоверсия ЕГЭ 2018 информатика:
Автоматическая фотокамера производит растровые изображения размером 640
×480
пикселей. При этом объём файла с изображением не может превышать 320
Кбайт, упаковка данных не производится.
Какое максимальное количество цветов
можно использовать в палитре?
✍ Решение:
- По формуле объема файла изображения имеем:
- Посмотрим, что из формулы нам уже дано:
где N i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель)
количество цветов = 2 i
\[ i = \frac {I}{N} = \frac {320 * 2^{13}}{75 * 2^{12}} \approx 8,5 бит \]
Результат: 256
Подробное решение данного 9 задания из демоверсии ЕГЭ 2018 года смотрите на видео:
9_21: : ЕГЭ по информатике задание 9.21 (источник: К. Поляков, 9.1 вариант 58):
Для хранения в информационной системе документы сканируются с разрешением 300 ppi . Методы сжатия изображений не используются. Средний размер отсканированного документа составляет 5 Мбайт . В целях экономии было решено перейти на разрешение 150 ppi и цветовую систему, содержащую 16 цветов . Средний размер документа, отсканированного с изменёнными параметрами, составляет 512 Кбайт .
Определите количество цветов в палитре до оптимизации .
✍ Решение:
- По формуле объема файла изображения имеем:
- Так как по заданию имеем разрешение, выраженное в пикселях на дюйм, то фактически это означает:
- Формула количества цветов:
- Посмотрим, что из формулы нам уже дано до экономного варианта и при экономном варианте:
где N — общее количество пикселей или разрешение, а i — глубина кодирования цвета (количество бит, выделенное на 1 пиксель).
I = значение ppi 2 * N * i
количество цветов = 2 i
Результат: 1024
Тема: Кодирование звука
9_7: ЕГЭ по информатике 2017 задание 9 ФИПИ вариант 15 (Крылов С.С., Чуркина Т.Е.):
На студии при четырехканальной (квадро ) звукозаписи с 32 -битным разрешением за 30 секунд был записан звуковой файл. Сжатие данных не производилось. Известно, что размер файла оказался 7500 Кбайт.
С какой частотой дискретизации (в кГц) велась запись? В качестве ответа укажите только число, единицы измерения указывать не нужно.
✍ Решение:
- По формуле объема звукового файла получим:
- Из задания имеем:
I = β * t * ƒ * S
\[ ƒ = \frac {I}{S*B*t} = \frac {7500 * 2^{10} * 2^2 бит}{2^7 * 30}Гц = \frac { 750 * 2^6}{1000}КГц = 2^4 = 16 \]
2 4 = 16 КГц
Результат: 16
Для более детального разбора предлагаем посмотреть видео решения данного 9 задания ЕГЭ по информатике:
Тема: Кодирование звука:
ЕГЭ по информатике задание 9_9 (источник: 9.2 вариант 36, К. Поляков):
Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 2 3 раза меньше, чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд; пропускная способность канала связи с городом Б в 4 раза выше, чем канала связи с городом А .
Сколько секунд длилась передача файла в город A ? В ответе запишите только целое число, единицу измерения писать не нужно.
✍ Решение:
- Для решения понадобится формула нахождения скорости передачи данных формулы:
- Вспомним также формулу объема звукового файла:
- Выпишем отдельно, все данные, касающиеся города Б (про А практически ничего не известно):
I = β * ƒ * t * s
где:
I
- объем
β
- глубина кодирования
ƒ
- частота дискретизации
t
- время
S
- кол-во каналов (если не указывается, то моно)
\[ t_А = \frac {15}{2} * 3 * 4 \]
90 секундРезультат: 90
Подробное решение смотрите на видео:
Тема: Кодирование звука:
ЕГЭ по информатике задание 9.10 (источник: 9.2 вариант 43, К. Поляков):
Музыкальный фрагмент был записан в формате стерео (двухканальная запись ), оцифрован и сохранён в виде файла без использования сжатия данных. Размер полученного файла – 30 Мбайт. Затем тот же музыкальный фрагмент был записан повторно в формате моно и оцифрован с разрешением в 2 раза выше и частотой дискретизации в 1,5 раза меньше, чем в первый раз. Сжатие данных не производилось.
Укажите размер файла в Мбайт , полученного при повторной записи. В ответе запишите только целое число, единицу измерения писать не нужно.
✍ Решение:
- Выпишем отдельно, все данные, касающиеся первого состояния файла, затем второго состояния — после преобразования:
I = β * ƒ * t * S
I
- объем
β
- глубина кодирования
ƒ
- частота дискретизации
t
- время
S
-количество каналов
Результат: 20
Смотрите видеоразбор данной задачи:
Тема: Кодирование звуковых файлов:
ЕГЭ по информатике задание 9_11 (источник: 9.2 вариант 72, К. Поляков):
Музыкальный фрагмент был оцифрован и записан в виде файла без использования сжатия данных. Получившийся файл был передан в город А по каналу связи за 100 секунд. Затем тот же музыкальный фрагмент был оцифрован повторно с разрешением в 3 раза выше и частотой дискретизации в 4 раз меньше , чем в первый раз. Сжатие данных не производилось. Полученный файл был передан в город Б за 15 секунд.
Во сколько раз скорость (пропускная способность канала) в город Б больше пропускной способности канала в город А ?
✍ Решение:
- Вспомним формулу объема звукового файла:
- Выпишем отдельно, все данные, касающиеся файла, переданного в город А , затем преобразованного файла, переданного в город Б :
I = β * ƒ * t * S
I
- объем
β
- глубина кодирования
ƒ
- частота дискретизации
t
- время
✎ 1 способ решения:
Ответ: 5
✎ 2 способ решения:
\[ \frac {V_Б}{V_А} = \frac {3/_4 * I}{15} * \frac {100}{I} = \frac {3/_4 * 100}{15} = \frac {15}{3} = 5 \]
(((3/4) * I) / 15) * (100 / I)= (3/4 * 100) / 15 = 15/3 = 5 S - количество каналов
Результат: 60
Смотрите подробное решение:
Тема: Кодирование звука:
9_19: Государственный выпускной экзамен ГВЭ 2018 (информатика ГВЭ ФИПИ, задание 7):
Производится двухканальная (стерео) цифровая звукозапись. Значение сигнала фиксируется 48 000 раз в секунду , для записи каждого значения используется 32 бит . Запись длится 5 минут , её результаты записываются в файл, сжатие данных не производится.
Какая из приведённых ниже величин наиболее близка к размеру полученного файла?
1) 14 Мбайт
2) 28 Мбайт
3) 55 Мбайт
4) 110 Мбайт
✍ Решение:
I = β * ƒ * t * S
Результат: 4
Подробное решение ГВЭ задания 7 2018 года смотрите на видео:
Тема: Кодирование звука:
9_20: Решение 9 задания ЕГЭ по информатике (диагностический вариант экзаменационной работы 2018 года, С.С. Крылов, Д.М. Ушаков):
Производится двухканальная (стерео) звукозапись с частотой дискретизации 4 кГц и 64-битным разрешением . Запись длится 1 минуту , ее результаты записываются в файл, сжатие данных не производится.
Определите приблизительно размер получившегося файла (в Мбайтах)
.
В качестве ответа укажите ближайшее к размеру файла целое число, кратное 2
.
✍ Решение:
- По формуле объема звукового файла имеем:
I = β * ƒ * t * S
Результат: 4
Видеоразбор задания:
Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.
Цель-мотивация. Подготовка к ЕГЭ.
План урока
1. Просмотр презентации по теме с комментариями учителя. Приложение 1
Материал презентации: Кодирование звуковой информации.
С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.
Процесс преобразования звуковых волн в двоичный код в памяти компьютера :
Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ :
Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация . Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.
Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так
далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.
Аудиоадаптер (звуковая плата) - специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.
В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:
- Частотой дискретизации
- Разрядностью(глубина звука).
Частота временной дискретизации
Это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:
11 кГц, 22 кГц, 44,1 кГц и др.
Разрядность регистра (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.
Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 =65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:
N = 2 I = 2 16 = 65536, где I - глубина звука.
Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.
Звуковой файл - файл, хранящий звуковую информацию в числовой двоичной форме.
2. Повторяем единицы измерения информации
1 байт = 8 бит
1 Кбайт = 2 10 байт=1024 байт
1 Мбайт = 2 10 Кбайт=1024 Кбайт
1 Гбайт = 2 10 Мбайт=1024 Мбайт
1 Тбайт = 2 10 Гбайт=1024 Гбайт
1 Пбайт = 2 10 Тбайт=1024 Тбайт
3. Закрепить изученный материал, просмотрев презентацию, учебник
4. Решение задач
Учебник , показ решения на презентации.
Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).
Задача (самостоятельно).
Учебник , показ решения
на презентации.
Определить информационный объем цифрового аудио файла длительностью звучания
которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении
8 битов.
5. Закрепление. Решение задач дома, самостоятельно на следующем уроке
Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.
В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность?
Объем свободной памяти на диске - 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц?
Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук?
Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?
Цифровой аудиофайл содержит запись звука низкого качества (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?
Две минуты записи цифрового аудиофайла занимают на диске 5,05 Мб. Частота дискретизации - 22 050 Гц. Какова разрядность аудиоадаптера?
Объем свободной памяти на диске - 0,1 Гб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?
Ответы
№ 92. 124,8 секунды.
№ 93. 22,05 кГц.
№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти - 15,1 Мб.
№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации - 11 кГц, разрядность аудиоадаптера - 8. Длительность звучания равна 60,5 с.
№ 96. 16 битов.
№ 97. 20,3 минуты.
Литература
1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера)
2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.
3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.
Основные понятия
Частота дискретизации(f) определяет количество отсчетов, запоминаемых за 1 секунду;
1 Гц (один герц) – это один отсчет в секунду,
а 8 кГц – это 8000 отсчетов в секунду
Глубина кодирования (b) – это количество бит, которое необходимо для кодирования 1 уровня громкости
Время звучания (t)
Объем памяти для хранения данных 1 канала (моно)
I=f·b·t
(для хранения информации о звуке длительностью t секунд, закодированном с частотой дискретизации f Гц и глубиной кодирования b бит требуется I бит памяти)При двухканальной записи (стерео) объем памяти, необходимый для хранения данных одного канала, умножается на 2
I=f·b·t·2
Кодирование звуковой информации
Основные теоретические положения
Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.
Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".
Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т.е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее "лесенка" цифрового звукового сигнала повторяет кривую аналогового сигнала.
Частота дискретизации звука - это количество измерений громкости звука за одну секунду, измеряется в герцах (Гц). Обозначим частоту дискретизации буквой f.
Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.
Глубина кодирования звука. Каждой "ступеньке" присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации b , которое называется глубиной кодирования звука
Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.
Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 b . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:
N = 2 b = 2 16 = 65 536.
В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.
Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим "моно"). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим "стерео").
Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Задачи для самостоятельной подготовки .
1. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц. (861 Кбайт)
2. Производится двухканальная (стерео) звукозапись с частотой дискретизации 48 кГц и 24-битным разрешением. Запись длится 1 минуту, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
1)0,3 2) 4 3) 16 4) 132
3. Производится одноканальная (моно) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 24 бита. Запись длится 7 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
1) 11 2) 13 3) 15 4) 22
4. Производится двухканальная (стерео) звукозапись с частотой дискретизации 11 кГц и глубиной кодирования 16 бит. Запись длится 6 минут, ее результаты записываются в файл, сжатие данных не производится. Какое из приведенных ниже чисел наиболее близко к размеру полученного файла, выраженному в мегабайтах?
1) 11 2) 12 3) 13 4) 15
Временная дискретизация звука.
Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.
Дискретизация - преобразование непрерывных сигналов в набор дискретных значений, каждому из которых присваивается определенный двоичный код.
Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность "ступенек".
Каждой "ступеньке" присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.
Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:
N=2 16 =65356[уровней звука],
где I - глубина кодирования.
Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.
При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.
Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.
Количество измерений в секунду может лежать в диапазоне от 8000 до 96 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 96[кГц]. При частоте 8[кГц] качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 96[кГц] - качеству звучания аудио-CD. Следует также учитывать, что возможны как моно, так и стерео режимы.
Информационный объем звукового файла
Для определения объема звукового файла V зф необходимо умножить количество измерений K изм на глубину кодирования (число бит на уровень) V 1изм:V зф = K изм * V 1изм
Где количество измерений K изм зависит от:Задача 1
Домашнее задание
1 Определить объем звукового стерео файла, при частоте дискретизации (дд)[кГц], времени звучания (гг)[с] для (мм)-битного кодирования.2 Определить время звучания в [с] звукового моно файла, имеющего объем, равный (гг) [КБ], при глубине кодирования (мм)[БИТ] и частоте дискретизации (дд)[кГц].
Где (дд) - дата вашего рождения, (мм) - месяц вашего рождения, (гг) - год вашего рождения.
С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.
Рисунок 1. Амплитуда колебаний звуковых волн
Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).
Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым . Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука . В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным , то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.
Частота дискретизации звука
Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:
- одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
- $1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .
Определение 2
Частота дискретизации звука - это количество измерений громкости звука за одну секунду.
Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.
Замечание 1
Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио -CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).
Информационный объем звукового файла
Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла .
Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:
$V = N \cdot f \cdot k$,
где $N$ - общая длительность звучания, выражаемая в секундах,
$f$ - частота дискретизации (Гц),
$k$ - глубина кодирования (бит).
Пример 1
Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:
$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$
При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.
Пример 2
Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):
$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$
Основные методы кодирования звуковой информации
Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table .
Метод FM (Frequency Modulation ) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).
Рисунок 2. Преобразование звукового сигнала в дискретный сигнал
На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.
Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.
Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал
На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.
Таблично-волновой метод (Wave-Table ) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.
Примеры форматов звуковых файлов
Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.
Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.
Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.
Формат МРЗ (MPEG-1 Audio Layer 3) - один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.