Кравченя - Технические средства обучения

Цифровое и аналоговое представление звуковых сигналов

Звук представляется в звуковой аппаратуре либо непрерывным электрическим сигналом, либо набором цифр (нулей и единиц). Аппаратура, в которой рабочий сигнал является непрерывным электрическим сигналом, называется аналоговой аппаратурой (например, радиоприемник, осциллограф и т.д.), а сигнал, передающийся через такую аппаратуру, – аналоговым сигналом.

Звуковой сигнал, как известно из физики, можно представить в виде спектра входящих в него частот (частотный спектр). Частотные составляющие спектра – это синусоидальные колебания, каждое из которых имеет свою собственную амплитуду и частоту. Вообще, любое, даже самое сложное по форме колебание (например, человеческий голос), можно представить суммой простейших синусоидальных колебаний определенных частот и амплитуд.

Как известно, компьютер оперирует данными в цифровом виде. Поэтому, необходимо представить звуковой сигнал в цифровом виде. Технология преобразования аналогового звукового сигнала в цифровой вид (оцифровка) заключается в осуществлении замеров амплитуды сигнала с определенным временным шагом и последующей записи полученных значений в численном виде. При этом оцифровка сигнала включает в себя два процесса – процесс дискретизации (осуществление выборки) сигнала по времени и процесс квантования по амплитуде. Процесс дискретизации по времени – это процесс получения значений преобразуемого сигнала с определенным временным шагом – шагом дискретизации (рис. 3.1). Чем меньше шаг дискретизации, тем чаще берутся значения амплитуды. Количество осуществляемых замеров амплитуды в одну секунду называют частотой дискретизации.

Квантование по амплитуде – это процесс замены реальных значений сигнала приближенными с определенной точностью (рис. 3.1).

Рис. 3.1. Процесс оцифровки аналогового сигнала

Точность округления зависит от выбранного количества и расположения уровней квантования: чем больше уровней квантования и чем ближе они друг к другу, тем на меньшую величину приходится округлять измеренные значения амплитуды, и, таким образом, тем меньше получаемая погрешность. Итак, оцифровка сигнала – это регистрация амплитуды сигнала через определенные промежутки времени и запись полученных значений амплитуды в виде округленных цифровых значений. Записанные численные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще делаются замеры амплитуды (чем выше частота дискретизации) и чем меньше будут округляться полученные значения (чем выше разрядность квантования), тем более точное представление оригинального сигнала в цифровом виде получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM ( Pulse Code Modulation).

Чтобы иметь возможность хранить относительно большие объемы аудио данных в хорошем качестве приходится прибегать к «ухищрениям», которые помогают записать аудио данные с использованием ощутимо меньшего объема памяти (то есть, уплотнить, сжать, закодировать данные) и не слишком сильно ухудшая (или даже совсем не ухудшая) при этом качество звучания.

Существует два распространенных способа кодирования^¹ аудио информации:

сжатие данных без потерь (lossless coding) – это способ кодирования аудио информации, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. Существующие сегодня алгоритмы сжатия без потерь (например, алгоритм, реализованный в кодеке Monkeys Audio , а также кодеках Flac, WavPack, TTA, OptimFrog и других) позволяют сократить занимаемый данными объем на 20–50%. Подобные кодеры – это своего рода архиваторы данных (как, например, ZIP, RAR и другие), только предназначенные специально для сжатия аудио информации;
сжатие данных с потерями (lossy coding). Цель такого кодирования – любыми способами добиться схожести звучания декодированного аудио сигнала с оригиналом при как можно меньшем объеме упакованных данных. Сегодня эта цель достигается за счет использования различных алгоритмов «упрощающих» оригинальный сигнал, выкидывая из него «ненужные» слабослышимые (или вообще неразличимые человеческим ухом) детали. После такого кодирования, декодированный сигнал при воспроизведении звучит похоже на оригинал, но фактически перестает быть ему идентичным. Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer 3 (это и есть официальное название всем известного « MP3»), MPEG-2/4 AAC (MPEG-2 и MPEG-4 Advanced Audio Coding). Выигрыш от использования таких алгоритмов сжатия вполне очевиден: коэффициент сжатия, обеспечиваемый такими кодерами, находится, усреднено, в пределах 7-14 (раз) и это при малозаметных потерях качества оригинального звучания.

Содержание