Цифровой звук

Показать все подкатегории +

Описание категории

Дмитрий СИМАНЕНКОВ
Музыкальное Оборудование
май 1998

Учитывая широкое распространение недорогого звукового оборудования на основе цифровых технологий, предлагаем вам поближе познакомиться с цифровым звуком.

Акустический звук представляет собой непрерывный во времени и по амплитуде процесс, то есть давление воздуха изменяется во времени плавно, а не перепрыгивает от одного значения к другому. Акустический звук может быть преобразован в электрический сигнал при помощи микрофона, который в зависимости от изменения давления воздуха изменяет создаваемое им на выходе электрическое напряжение. После перевода акустического звука в электрический сигнал непрерывность во времени и по амплитуде сохраняется: напряжение сигнала изменяется аналогично изменению давления воздуха, вот почему данный звук называют аналоговым. Мы можем записать электрический сигнал на магнитную ленту и превратить его вновь в звук при помощи динамика, который работает как «микрофон наоборот»: перемещает воздух в соответствии с изменениями напряжения. Соответственно, сохраняется и упомянутая непрерывность сигнала.

Несмотря на то, что аналоговый электрический сигнал исправно служит человечеству на протяжении десятилетий, со временем отдельным его (человечества) представителям стало ясно, что аналоговые сигнал и магнитная запись — не лучшие способы передачи и хранения звуковой информации, поскольку и при передаче и при хранении происходят неизбежные потери, то есть ухудшение звука. В то же время, передачу и хранение данных в компьютерах, оперирующих исключительно цифровыми данными, возможно производить без каких-либо потерь. Вопрос только в том, как перевести аналоговый звук в цифровой и обратно.

Для решения первой задачи существуют специальные устройства, известные как аналого-цифровые преобразователи (АЦП). Эти устройства способны преобразовать непрерывный аналоговый сигнал в последовательность отдельных чисел, то есть сделать его дискретным (англ. discrete — раздельный, состоящий из отдельных частей). Преобразование происходит следующим образом: устройство много раз в секунду измеряет амплитуду аналогового сигнала и выдает результаты измерений в виде чисел.

Как видно на рисунке, результат измерений не является точным аналогом непрерывного электрического сигнала. Насколько все же соответствует цифровой звук аналоговому? Очевидно, что это соответствие будет тем полнее, чем чаще происходят измерения и чем они точнее. Частота, с которой производятся измерения, называется частотой дискретизации. А на точность измерений амплитуды указывает число бит, использующихся для представления результата измерений. Этот параметр называют разрядностью.

Частота дискретизации

Итак, преобразование аналогового сигнала в цифровой состоит из двух этапов: дискретизации по времени и квантования по амплитуде. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (семплов), взятых через равные промежутки времени. Например, когда мы говорим, что частота дискретизации 44,1 кГц, то это значит, что сигнал измеряется 44100 раз в течении секунды (в МО обычно применяется более доходчивый термин «частота семплирования», однако «частота дискретизации» правильнее — прим. ред.).

Основной вопрос на первом этапе преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты дискретизации аналогового сигнала. Как уже было сказано, чем больше частота — тем точнее соответствует цифровой сигнал аналоговому. Однако, пропорционально увеличению частоты возрастают: а) интенсивность потока цифровых данных, а пропускные возможности интерфейсов не безграничны, особенно если записывается/воспроизводится одновременно несколько каналов; б) вычислительная нагрузка на цифровые процессоры эффектов, а их вычислительные возможности также ограничены; в) объем памяти, необходимой для хранения цифрового сигнала. Очевидно, что необходим компромисс.

От выбора частоты дискретизации зависит частотный диапазон полученного цифрового звука или максимальная частота аналогового сигнала, правильно представленная в цифровом. Считается, что диапазон частот, которые слышит человек, составляет от 20 до 20000 Гц. Согласно известной теореме Найквиста, для того, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты. Звуковая частота, равная половине частоты дискретизации, называется частотой Найквиста и является максимальной частотой, которую данная цифровая система может правильно сохранить и воспроизвести. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 Гц до 20 кГц, то частота дискретизации такого сигнала должна быть не меньше, чем 40 кГц. Сегодня самыми распространенными частотами дискретизации являются 44,1 кГц (CD) и 48 кГц (DAT). Впрочем, в последнее время идет немало разговоров о том, что обертоны, расположенные свыше 20 кГц, вносят немалый вклад в звучание и в результате появляются преобразователи, использующие частоты дискретизации 96 кГц и 192 кГц, а в недалеком будущем ожидается появление и систем с частотой 384 кГц.

Тем не менее, исходный аналоговый сигнал обычно имеет спектр, сосредоточенный в основном в полосе частот от 20 Гц до, примерно, 20 кГц. Однако, кроме того в сигнале обычно содержатся помехи с частотами до нескольких сот килогерц. Это различные трудно устранимые наводки от компьютерной техники, промышленных и электробытовых приборов, трамваев, троллейбусов и т. д. На рисунке внизу вы видите спектр исходного аналогового сигнала.

В процессе дискретизации частотный спектр аналогового сигнала претерпевает значительные изменения. Во-первых, при оцифровке сигнала с частотой больше, чем частота Найквиста, получается звук с более низкой частотой, чем у оригинала. То есть, происходит «свертка» всего первоначального спектра аналогового сигнала, простирающегося от, примерно, 20 Гц до нескольких сот килогерц, вовнутрь полосы частот от 0 Гц до частоты Найквиста (половины частоты дискретизации). Результат этого процесса показан на рисунке внизу.

Все это выглядит весьма непривычно, если не сказать, что вообще противоречит здравому смыслу! Получается, что происходит дискретизация высокочастотных сигналов, лежащих значительно выше не только частоты Найквиста, но и самой частоты дискретизации. На первый взгляд это даже противоречит упомянутой выше теореме Найквиста. Однако это происходит именно так и подробнее узнать о том, почему так происходит, вы можете из врезки «Свертка».

Второе изменение спектра заключается в его расширении. В отличии от «свертки» этот факт уже не противоречит здравому смыслу и вполне очевиден. После дискретизации относительно низкочастотный исходный аналоговый сигнал представляет из себя последовательный временной ряд очень узких импульсов с разной амплитудой и с очень широким спектром до нескольких мегагерц (математический факт — чем уже импульс, тем шире его спектр). Поэтому и в целом спектр такой последовательности импульсов расширяется до тех же нескольких мегагерц. Таким образом, спектр дискретизированного сигнала значительно шире спектра исходного аналогового сигнала.

Так как весь исходный спектр свернулся в полосу частот от 0 Гц до частоты Найквиста, то логично и естественно, что расширение спектра происходит дублированием спектра из полосы от 0 Гц до частоты Найквиста. В конечном итоге, спектр дискретизированного сигнала представляет собой несколько десятков сдвинутых по частоте копий спектров, полученных в результате свертки спектра исходного аналогового сигнала вовнутрь полосы частот от 0 Гц до частоты Найквиста.

Итак, реальные аналоговые сигналы часто содержат высокочастотные составляющие, плохо поддающиеся оцифровке на стандартных частотах 44,1 кГц или 48 кГц. Поэтому перед дискретизацией необходима аналоговая фильтрация, то есть удаление всех частот выше частоты Найквиста, являющаяся довольно сложной задачей. Аналоговые фильтры не могут пропустить, скажем, все частоты от 0 Гц до 24 кГц и подавить все частоты выше 24 кГц. Аналоговый фильтр низких частот начинает подавлять высокие частоты начиная с некоторой частоты, называемой частотой среза. Подавление плавно усиливается с ростом частоты. Поэтому, чтобы добиться отсутствия частот выше 24 кГц необходимо устанавливать частоту среза фильтра примерно на 16..20 кГц, а это уже плохо, так как будут ослаблены полезные частоты в слышимом диапазоне 16..20 кГц. Еще одна неприятность состоит в том, что чем более узкой мы пытаемся сделать переходную область между полосой пропускания и полосой подавления фильтра, тем сильнее вносимые фазовые искажения, длиннее переходный процесс (фильтр начинает «звенеть») и тем сложнее и капризнее в настройке такой аналоговый фильтр.

В современных АЦП эта проблема решается методом дискретизации на повышенной частоте (oversampling — в МО обычно употребляется термин «превышение частоты»). По этому методу диапазон частот входного аналогового сигнала ограничивается с помощью сравнительно несложного аналогового фильтра. Причем частота среза фильтра выбирается значительно выше высшей полезной частоты, а переходная полоса фильтра делается достаточно широкой. Таким образом, исключаются и завал полезных высших частот, и фазовые искажения, характерные для аналоговых фильтров с узкой переходной полосой. Далее, отфильтрованный, с ограниченным по частоте спектром, сигнал дискретизируется на достаточно высокой частоте, исключающей наложение и искажение спектра — алиазинг (aliasing). Затем дискретные отсчеты сигнала преобразуются в последовательность чисел с помощью АЦП. После этого мы имеем поток цифровых данных, представляющих аналоговый сигнал, включающий как полезные, так и нежелательные высокочастотные компоненты и помехи. Эти цифровые данные пропускаются через цифровой фильтр с очень узкой переходной полосой и очень большим подавлением нежелательных высокочастотных компонент. Сегодня расчет и создание таких цифровых фильтров, к тому же не вносящих никаких фазовых искажений, не представляют больших трудностей.

После цифрового фильтра получается цифровое представление сигнала, имеющего спектр, правильно ограниченный по частоте. Применяя к такому сигналу теорему Найквиста мы можем резко понизить частоту его дискретизации до удвоенной величины наивысшей полезной частотной составляющей, чего мы и хотели добиться. Надо отметить, что часто цифровые фильтры находятся в той же микросхеме, что и другие узлы АЦП, так что пользователь даже может и не подозревать какие сложные процессы происходят в его АЦП.

Применяется дискретизация на повышенной частоте (oversampling) и в цифро-аналоговых преобразователях (ЦАП). В ЦАП также есть проблема сложности аналоговых восстанавливающих (интерполирующих) фильтров. Ведь сразу после ЦАП сигнал представляет собой серию дискретных импульсов, имеющих многочисленные алиазинговые спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (скажем 0..24 кГц) и, по возможности, наиболее полно подавить ненужные высокочастотные компоненты. И, конечно, чисто аналоговому фильтру выполнить такие противоречивые требования очень сложно. Поэтому сначала цифровой сигнал интерполируют, то есть вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам и, тем самым, резко увеличивают частоту дискретизации. Это приводит к тому, что алиазинговые спектральные компоненты на выходе ЦАП далеко отстоят от частотных компонент основного сигнала и, соответственно, чтобы отфильтровать (подавить) их достаточно применить простой аналоговый фильтр.

Разрядность

Напомним, что преобразование аналогового сигнала в цифровой поток данных происходит в два этапа. Первый этап — это дискретизация сигнала на основе теоремы Найквиста с использованием повышенной частоты дискретизации. Второй этап — это квантование амплитуды дискретных отсчетов, полученных на первом этапе. Представим себе, что отсчет представляет собой некий столбик или полоску, наподобие той, что мы видим на студийном индикаторе уровня сигнала. Длина этой полоски и есть амплитуда сигнала в данном отсчете. Процесс квантования амплитуды тогда можно представить как измерение длины полоски с помощью линейки. Чем чаще идут метки на линейке, тем точнее мы можем измерить длину полоски (амплитуду) и тем меньше будут ошибки измерений (шумы квантования). Однако, чем чаще расположены метки на линейке — тем больше цифр (бит) нам потребуется для записи числа, соответствующего измеренной нами длине полоски (амплитуде сигнала в отсчете). Например, если на линейке 32 метки, то для представления длины полоски (амплитуды) в виде числа понадобится максимум 5 бит (32=25). В данном случае 5 бит и будет разрядностью АЦП.

Таким образом, процесс квантования амплитуд отсчетов фактически заключается в измерении их величин по отношению к некоторому опорному источнику напряжения (линейка в предыдущих объяснениях), обычно имеющемуся внутри корпуса микросхемы АЦП, и выражении этих величин в виде чисел, состоящих из конечного числа бит. Причем числа могут быть не только целые, например 16-, 18-, 20-, 24-битные, но и 24- или 32-битные с плавающей запятой или с другой кодировкой (например, в кодах с исправлением ошибок), зависящей от конкретной реализации устройства АЦП. Довольно часто используется все же кодирование результатов измерения амплитуд отсчетов в виде целых чисел.

В обычном АЦП число бит на один отсчет (разрядность числа) выходного цифрового потока данных непосредственно с квантователя амплитуд дискретов и на выходе всего АЦП равны, так как числа с квантователя амплитуд поступают непосредственно на выход устройства. Однако, квантователь АЦП не обязательно должен иметь высокую разрядность для того, чтобы выходной поток цифровых данных АЦП имел таковую. Увеличение эффективной разрядности АЦП может быть достигнуто использованием метода увеличения частоты дискретизации (oversampling) и цифровой фильтрации. Подробнее об этом вы можете узнать из врезки «Увеличение разрядности».

Дизеринг

Поскольку реальные музыкальные сигналы далеки от белого шума, то при их оцифровке шумы квантования оказываются зависимыми от сигнала. Человеческое слуховое восприятие четко реагирует на это возникновением ощущения «грязного» звука. Особенно ярко этот эффект проявляется для 8-битных сигналов. Другими словами, если обычный 16-битный сигнал уменьшится по громкости на 48 дБ (на 8 бит) от своего номинального уровня, то он станет «грязным» и непригодным для прослушивания. С этим, я думаю, согласятся все — кто же сейчас будет слушать восьмибитный звук?! То есть, вместо отношения сигнал/шум 96 дБ для обычного 16-битного сигнала реальный динамический диапазон из-за эффекта зависимости шумов квантования от сигнала составляет всего 48 дБ!

То есть, чтобы 16-битная запись звучала чисто, необходимо предотвратить понижение уровня сигнала: он не должен становиться фактически 8-битным. Получается, что исходный музыкальный материал должен быть скомпресcирован тем или иным способом с целью уменьшения его динамического диапазона и предотвращения грязного звучания на слишком маленьких уровнях. Однако, сжатие динамического диапазона исходного музыкального материала, достигающего порой 100 и более дБ (например, для электрогитары), на 48 и более дБ без заметных на слух искажений представляется крайне сложной (если вообще выполнимой) задачей. А иногда и художественное содержание музыкального произведения требует чередования громких и очень тихих звуков и, следовательно, искусственное сжатие динамического диапазона неприемлемо. В таких случаях применяется дизеринг (dithering), позволяющий частично «обменять» эффект грязного звучания на незначительное увеличения высокочастотного шума.

Метод дизеринга заключается в добавлении небольшого шумового (обычно высокочастотного) сигнала во входной сигнал АЦП или уже к цифровому сигналу в момент понижения разрядности (например, с 20 и более бит исходного музыкального материала до 16 бит для записи на компакт диск). Это приводит к независимости шумов квантования и сигнала, однако общий уровень шумов немного возрастает.

Нойс шейпинг

В результате оцифровки входного аналогового сигнала к нему добавляется шум квантования. Его спектр равномерен и простирается начиная от 0 Гц и до частоты Найквиста (половины частоты дискретизации). Равномерность по частоте и отсутствие взаимосвязи (некоррелированность) шума с сигналом достигается применением дизеринга и правилом квантования, при котором округление амплитуды происходит к ближайшей опорной величине.

Применение более сложных правил округления позволяет получить другие (неравномерные) спектральные характеристики шумов округления при сохранении полной мощности шумов неизменной. Учитывая, что человеческий слуховой аппарат имеет спад чувствительности на высоких и на очень низких частотах, возможно, используя специальные правила округления при квантовании, получить спектр шумов округления, большей частью сосредоточенный в области частот, которые наименее заметны на слух (выше 20 кГц). Частота дискретизации для ЦАП с 256-кратным превышением частоты около 11,2 МГц, и следовательно, мы имеем возможность переместить весь шум квантования в область частот, практически неслышимую человеческим ухом (от 20 кГц до 5,6 МГц). Таким образом, можно значительно улучшить отношение сигнал/шум в диапазоне слышимых частот в цифровом сигнале не увеличивая количество бит на один отсчет.

Применение нойс шейпинга (noise shaping) возможно и без перемещения шумов в полностью неслышимую высокочастотную область. Для этого при переходе от 20..24-битного исходного сигнала к 16-битному формируется спектр шумов квантования, имеющий форму, обратную кривой чувствительности слухового аппарата человека. То есть там, где наш слух наиболее чувствителен к шумам, будет минимум на кривой спектра мощности шумов и наоборот, там где наш слух менее чувствителен к шуму будет сосредоточен максимум шумов. Таким образом, особенно раздражающее слух шипение в области 3-4 кГц становится более мягким и незаметным, а «грязь» при небольших уровнях сигнала становится менее очевидной.

В мастеринге, например, целесообразно звуковой материал оцифровать на повышенной частоте дискретизации (скажем 96 кГц, если ваш АЦП это позволяет) и с высокой разрядностью (20..24-бит), а преобразование звука в 16-битный с частотой 44,1 кГц (необходимое для СD) произвести в самом конце работы с помощью специального программного обеспечения или аппаратных устройств, использующих компрессию, дизеринг, нойс шейпинг и другие алгоритмы обработки. Таким образом, можно достичь субъективно лучшего отношения сигнал/шум на СD, хотя объективные измерения могут показать незначительное ухудшение этого параметра за счет увеличения мощности высокочастотных шумов.

Вообще же стоит относиться критически к рекламным заявлениям фирм о «колоссальном» и «драматическом» улучшении звука после дизеринга, нойс шейпинга и т. д. Очевидно, что панацеи не существует и именно поэтому безработица инженерам по звуку пока не грозит.

Джиттер

Цифровой звук передается между устройствами посредством сигнала с прямоугольной формой волны. Джиттер (jitter) — колебания крутизны фронтов этого сигнала и небольшие случайные изменения местоположения фронтов во времени. Все это приводит к небольшим случайным изменениям скорости передачи цифровых отсчетов. Например, если фронт имеет малую крутизну или отстал по времени, то цифровой сигнал как бы запаздывает и наоборот. Физически цифровой джиттер по оказываемому влиянию на воспроизведение звука аналогичен детонации — дрожанию скорости магнитной ленты в аналоговом магнитофоне из-за несовершенства механической части. Однако, вносимые цифровым джиттером искажения намного заметнее. Видимо это связано с большей мягкостью и плавностью детонационных дрожаний (можно сказать аналогового джиттера) скорости воспроизведения сигнала магнитофоном благодаря эластичности магнитной ленты.

В современных цифровых системах звукозаписи и воспроизведения основным источником джиттера является АЦП, поскольку современные синхронизаторы частоты дискретизации настолько совершенны, что вносят джиттер гораздо меньший, чем АЦП. Рассмотрим, как образуется джиттер в АЦП. Частота дискретизации АЦП обычно задается кварцевым генератором, а любой кварцевый генератор (особенно дешевый, низкокачественный) имеет фазовые шумы. Таким образом, моменты времени получения отсчетов сигнала расположены на оси времени не совсем равномерно. Это приводит к размыванию спектра сигнала и ухудшению отношения сигнал/шум. Кроме того, на высокочастотных компонентах сигнала джиттер может привести к пульсации амплитуд. Для борьбы с этим явлением надо использовать высококачественные кварцевые генераторы с хорошо стабилизированными источниками питания, что на практике обычно означает попросту покупку более дорогого и высококачественного устройства АЦП.

Если не рассматривать низкокачественные АЦП, то джиттер возникает при передаче цифрового сигнала от одного устройства другому из-за неоднородности среды передачи. Джиттер слышен при мониторинге во время передачи, когда частота дискретизации принимающего устройства синхронизирована с частотой передающего. Если джиттер не настолько силен, чтобы появились щелчки или треск, то он не сохраняется на записи, поскольку воспроизводящее устройство регенерирует тактовую частоту при помощи собственного генератора. С этим связан и известный парадокс цифрового звука, когда копия может звучать лучше оригинала. Бороться с джиттером можно использованием качественной коммутации (в том числе согласованием сопротивлений, чтобы не было отражений сигнала) и применением устройств, регенерирующих цифровой сигнал. Также необходимо отключать внешнюю синхронизацию частоты дискретизации устройства при воспроизведении, если подобная синхронизация не требуется.

Те, кто использует системы типа АЦП-компьютер-CD, могут вообще не задумываться над этой проблемой. Кроме джиттера, связанного с АЦП, никакого дополнительного джиттера из-за неоднородности среды при передаче цифрового сигнала от одного устройства другому для таких систем вообще не существует. То есть, если вы программно обрабатываете звуковые файлы и записываете на CD с помощью CD-рекордеров, подключенных к вашему компьютеру по SCSI или IDE интерфейсу, то никаких проблем с джиттером у вас никогда не будет и можете вообще смело забыть это слово.

Архив материалов "Музыкального оборудования"
30-day money back guarantee
Support teams across the world
Safe & Secure online payment
Музыкальное оборудование
Журнал Музыкальное оборудование

это онлайн-издание, которое является голосом для потребителей музыкальной техники и оборудования со всего мира.

Контакты
  • Новый Арбат,
  • Москва, Россия
  • mail@muzoborudovanie.ru
Новое:
  • Обзоры
  • Рейтинги
  • Товары
  • Студии
Старое:
  • Архив статей
  • Номера МО
  • Словарь
  • Форум
Муз Оборудование
Logo