logo
shpora_mpi

Изучение вопросов кодирования звуковой информации.

В школе не рассматриваются вопросы представления в памяти компьютера информации графической, звуковой, видео. Но всегда в классе есть увлеченные интересующиеся школьники. Они могут самостоятельно изучить данный материал. Приведем некоторые сведения.

В зависимости от способа организации записи различают дискретные и непрерывные формы представления информации. Дискретная форма представления информации – это представление информации в форме конечного набора простых элементов. Например, символы алфавита, цифры. Непрерывная форма (аналоговая) – это представление информации в форме, которая содержит непрерывно меняющиеся параметры. Например, фотографии, выполненные пленочным фотоаппаратом, магнитофонная аудиозапись.

Компьютер способен сохранять и обрабатывать только дискретную информацию. Поэтому непрерывную информацию необходимо определенным образом преобразовать. Дискретизация – это процесс преобразования информации из непрерывной формы представления в дискретную. Информация при дискретизации искажается, поэтому к качеству этого процесса предъявляют высокие требования. Не требуют дискретизации целые числа и символы, а действительные числа, графическая и звуковая информация для ввода в память компьютера требуют определенных процедур ввода, которые преобразуют эти виды информации в дискретную форму.

Звук – это звуковая волна. Чем больше амплитуда сигнала, тем громче звук; чем выше частота сигнала, тем выше тон. Для дискретизации аудиосигналов проводят дискретизацию по времени (создают на оси времени систему точек среза амплитуды) и дискретизацию амплитуды (создают систему дискретных значений амплитуды). В каждой точке среза фактическое значение амплитуды заменяется ближайшим дискретным значением. Непрерывный график звуковой волны заменяется набором горизонтальных ступенек.

Для дискретизации видеосигналов проводят дискретизацию по времени (создают на оси времени систему точек для записи кадров) и дискретизацию кадров (как и для графических объектов).

Рассмотрим измерение объемов видеоинформации в двоичной форме. Если видеофрагмент записан и демонстрируется с помощью компьютера, то кадры сменяют друг друга 25 раз в секунду. При максимальной цветопередаче (3 байт на пиксель) один кадр в двоичной форме имеет объем 1,6 Мбайт. Поэтому только видеоряд 30-секундного видеоклипа должен иметь в двоичном виде объем:

1,6 Мбайт · 25 кадров · 30 с = 1200 Мбайт ≈ 1,2 Гбайт

На практике используются форматы, которые при кодировке «сжимают» данные (*.avi)

Звуковые фрагменты при компьютерной записи также занимают довольно много памяти. Например, звуковой фрагмент в формате звукозаписи (*.wav) имеет объем 10 – 12 Кбайт на секунду воспроизведения.