Студентам > Рефераты > Звуковые карты и Компрессия звука
Звуковые карты и Компрессия звукаСтраница: 2/12
Сам цифровой звук и
относящиеся к нему вещи принято обозначать общим термином Digital Audio;
аналоговая и цифровая части звуковой системы обозначаются терминами Analog
Domain и Digital Domain.
АЦП и ЦАП
Аналогово-цифровой и
цифро-аналоговый преобразователи. Первый преобразует аналоговый сигнал в
цифровое значение амплитуды, второй выполняет обратное преобразование. В
англоязычной литературе применяются термины ADC и DAC, а совмещенный
преобразователь называют codec (coder-decoder).
Принцип работы АЦП
состоит в измерении уровня входного сигнала и выдаче результата в цифровой
форме. В результате работы АЦП непрерывный аналоговый сигнал превращается в
импульсный, с одновременным измерением амплитуды каждого импульса. ЦАП получает
на входе цифровое значение амплитуды и выдает на выходе импульсы напряжения или
тока нужной величины, которые расположенный за ним интегратор (аналоговый
фильтр) превращает в непрерывный аналоговый сигнал.
Для правильной работы
АЦП входной сигнал не должен изменяться в течение времени преобразования, для
чего на его входе обычно помещается схема выборки-хранения, фиксирующая
мгновенный уровень сигнала и сохраняющая его в течение всего времени
преобразования. На выходе ЦАП также может устанавливаться подобная схема,
подавляющая влияние переходных процессов внутри ЦАП на параметры выходного
сигнала.
При временнОй
дискретизации спектр полученного импульсного сигнала в своей нижней части 0..Fa
повторяет спектр исходного сигнала, а выше содержит ряд отражений (aliases,
зеркальных спектров), которые расположены вокруг частоты дискретизации Fd и ее
гармоник (боковые полосы). При этом первое отражение спектра от частоты Fd в
случае Fd = 2Fa располагается непосредственно за полосой исходного сигнала, и
требует для его подавления аналогового фильтра (anti-alias filter) с высокой
крутизной среза. В АЦП этот фильтр устанавливается на входе, чтобы исключить
перекрытие спектров и их интерференцию, а в ЦАП - на выходе, чтобы подавить в
выходном сигнале надтональные помехи, внесенные временнОй дискретизацией.
Устройство АЦП и ЦАП
В основном применяется
три конструкции АЦП: параллельные - входной сигнал одновременно сравнивается с
эталонными уровнями набором схем сравнения (компараторов), которые формируют на
выходе двоичное значение. В таком АЦП количество компараторов равно (2 в
степени N) - 1, где N - разрядность цифрового кода (для восьмиразрядного -
255), что не позволяет наращивать разрядность свыше 10-12.
последовательного
приближения - преобразователь при помощи вспомогательного ЦАП генерирует
эталонный сигнал, сравниваемый со входным. Эталонный сигнал последовательно
изменяется по принципу половинного деления (дихотомии), который используется во
многих методах сходящегося поиска прикладной математики. Это позволяет
завершить преобразование за количество тактов, равное разрядности слова,
независимо от величины входного сигнала.
с измерением временнЫх
интервалов - широкая группа АЦП, использующая для измерения входного сигнала
различные принципы преобразования уровней в пропорциональные временнЫе
интервалы, длительность которых измеряется при помощи тактового генератора
высокой частоты. Иногда называются также считающими АЦП.
Среди АЦП с измерением временнЫх
интервалов преобладают следующие три типа: последовательного счета, или
однократного интегрирования (single-slope) - в каждом такте преобразования
запускается генератор линейно возрастающего напряжения, которое сравнивается со
входным.
Обычно такое напряжение
получают на вспомогательном ЦАП, подобно АЦП последовательного приближения.
двойного интегрирования
(dual-slope) - в каждом такте преобразования входной сигнал заряжает
конденсатор, который затем разряжается на источник опорного напряжения с
измерением длительности разряда.
следящие - вариант АЦП
последовательного счета, при котором генератор эталонного напряжения не
перезапускается в каждом такте, а изменяет его от предыдущего значения до
текущего.
Наиболее популярным
вариантом следящего АЦП является sigma-delta, работающий на частоте Fs,
значительно (в 64 и более раз) превышающей частоту дискретизации Fd выходного
цифрового сигнала. Компаратор такого АЦП выдает значения пониженной разрядности
(обычно однобитовые - 0/1), сумма которых на интервале дискретизации Fd
пропорциональна величине отсчета. Последовательность малоразрядных значений
подвергается цифровой фильтрации и понижению частоты следования (decimation), в
результате чего получается серия отсчетов с заданной разрядностью и частотой
дискретизации Fd.
Для улучшения
соотношения сигнал/шум и снижения влияния ошибок квантования, которое в случае
однобитового преобразователя получается довольно высоким, применяется метод
формовки шума (noise shaping) через схемы обратной связи по ошибке и цифрового
фильтрования. В результате применения этого метода форма спектра шума меняется
так, что основная шумовая энергия вытесняется в область выше половины частоты
Fs, незначительная часть остается в нижней половине, и практически весь шум
удаляется из полосы исходного аналогового сигнала.
ЦАП в основном строятся
по трем принципам: взвешивающие - с суммированием взвешенных токов или
напряжений, когда каждый разряд входного слова вносит соответствующий своему
двоичному весу вклад в общую величину получаемого аналогового сигнала; такие
ЦАП называют также параллельными или многоразрядными (multibit).
sigma-delta, с
предварительной цифровой передискретизацией и выдачей малоразрядных (обычно
однобитовых) значений на схему формирования эталонного заряда, которые со столь
же высокой частотой добавляются к выходному сигналу. Такие ЦАП носят также
название bitstream.
с широтно-импульсной
модуляцией (ШИМ, Pulse Width Modulation, PWM), когда на схему выборки-хранения
аналогового сигнала выдаются импульсы постоянной амплитуды и переменной
длительности, управляя дозированием выдаваемого на выход заряда. На этом
принципе работают преобразователи MASH (Multi-stAge Noise Shaping -
многостадийная формовка шума) фирмы Matsushita. Свое название эти ЦАП получили
по причине применения в них нескольких последовательных формирователей шума.
При использовании
передискретизации в десятки раз (обычно - 64x..512x) становится возможным
уменьшить разрядность ЦАП без ощутимой потери качества сигнала; ЦАП с меньшим
числом разрядов обладают также лучшей линейностью. В пределе количество
разрядов может сокращаться до одного.
Форма выходного сигнала
таких ЦАП представляет собой полезный сигнал, обрамленный значительным
количеством высокочастотного шума, который, тем не менее, эффективно
подавляется аналоговым фильтром даже среднего качества.
ЦАП являются
"прямыми" устройствами, в которых преобразование выполняется проще и
быстрее, чем в АЦП, которые в большинстве своем - последовательные и более
медленные устройства.
Передискретизация
(oversampling)
Это дискретизация
сигнала с частотой, превышающей основную частоту дискретизации.
Передискретизации может быть аналоговой, когда с повышенной частотой делаются
выборки исходного сигнала, или цифровой, когда между уже существующими цифровыми
отсчетами вставляются дополнительные, рассчитанные путем интерполяции. Другой
способ получения значений промежуточных отсчетов состоит во вставке нулей,
после чего вся последовательность подвергается цифровой фильтрации. В АЦП
используется аналоговая передискретизация, в ЦАП - цифровая.
Передискретизация
используется для упрощения конструкций АЦП и ЦАП. По условиям задачи на входе
АЦП и выходе ЦАП должен быть установлен аналоговый фильтр с АЧХ, линейной в
рабочем диапазоне и круто спадающей за его пределами. Реализация такого
аналогового фильтра весьма сложна; в то же время при повышении частоты
дискретизации вносимые ею отражения спектра пропорционально отодвигаются от
основного сигнала, и аналоговый фильтр может иметь гораздо меньшую крутизну
среза.
Другое преимущество
передискретизации состоит в том, что ошибки амплитудного квантования (шум
дробления), распределенные по всему спектру квантуемого сигнала, при повышении
частоты дискретизации распределяются по более широкой полосе частот, так что на
долю основного звукового сигнала приходится меньшее количество шума. Каждое
удвоение частоты снижает уровень шума квантования на 3 дБ; поскольку один
двоичный разряд эквивалентен 6 дБ шума, каждое учетверение частоты позволяет
уменьшить разрядность преобразователя на единицу.
Передискретизация вместе
с увеличением разрядности отсчета, интерполяцией отсчетов с повышенной
точностью и выводом их на ЦАП надлежащей разрядности позволяет несколько
улучшить качество восстановления звукового сигнала. По этой причине даже в
16-разрядных системах нередко применяются 18- и 20-разрядные ЦАП с
передискретизацией.
АЦП и ЦАП с
передискретизацией за счет значительного уменьшения времени преобразования
могут обходиться без схемы выборки-хранения.
Достоинства и недостатки
цифрового звука
Цифровое представление
звука ценно прежде всего возможностью бесконечного хранения и тиражирования без
потери качества, однако преобразование из аналоговой формы в цифровую и обратно
все же неизбежно приводит к частичной его потере. Наиболее неприятные на слух
искажения, вносимые на этапе оцифровки - гранулярный шум, возникающий при
квантовании сигнала по уровню из-за округления амплитуды до ближайшего
дискретного значения. В отличие от простого широкополосного шума, вносимого
ошибками квантования, гранулярный шум представляет собой гармонические
искажения сигнала, наиболее заметные в верхней части спектра.
Мощность гранулярного
шума обратно пропорциональна количеству ступеней квантования, однако из-за
логарифмической характеристики слуха при линейном квантовании (постоянная
величина ступени) на тихие звуки приходится меньше ступеней квантования, чем на
громкие, и в результате основная плотность нелинейных искажений приходится на
область тихих звуков. Это приводит к ограничению динамического диапазона,
который в идеале (без учета гармонических искажений) был бы равен соотношению
сигнал/шум, однако необходимость ограничения этих искажений снижает
динамический диапазон для 16-разрядного кодирования до 50-60 дБ.
Положение могло бы
спасти логарифмическое квантование, однако его реализация в реальном времени
весьма сложна и дорога.
Искажения, вносимые
гранулярным шумом, можно уменьшить путем добавления к сигналу обычного белого
шума (случайного или псевдослучайного сигнала), амплитудой в половину младшего
значащего разряда; такая операция называется сглаживанием (dithering). Это
приводит к незначительному увеличению уровня шума, зато ослабляет корреляцию
ошибок квантования с высокочастотными компонентами сигнала и улучшает
субъективное восприятие. Сглаживание применяется также перед округлением
отсчетов при уменьшении их разрядности. По существу, dithering и noise shaping
являются частными случаями одной технологии - с той разницей, что в первом
случае используется белый шум с равномерным спектром, а во втором - шум со
специально "формованным" спектром.
При восстановлении звука
из цифровой формы в аналоговую возникает проблема сглаживания ступенчатой формы
сигнала и подавления гармоник, вносимых частотой дискретизации. Из-за
неидеальности АЧХ фильтров может происходить либо недостаточное подавление этих
помех, либо избыточное ослабление полезных высокочастотных составляющих. Плохо
подавленные гармоники частоты дискретизации искажают форму аналогового сигнала
(особенно в области высоких частот), что создает впечатление
"шероховатого", "грязного" звука.
Интерфейсы, используемые
для передачи цифрового звука
S/PDIF (Sony/Philiрs
Digital Interface Format - формат цифрового интерфейса фирм Sony и Philiрs) -
цифровой интерфейс для бытовой радиоаппаратуры.
AES/EBU (Audio Engineers
Society / European Broadcast Union - общество звукоинженеров / европейское
вещательное объединение) - цифровой интерфейс для студийной радиоаппаратуры.
Оба интерфейса являются
последовательными и используют одинаковый формат сигнала и систему кодирования
- самосинхронизирующийся код BMC (Biphase-Mark Code - код с представлением
единицы двойным изменением фазы), и могут передавать сигналы в формате PCM
разрядностью до 24 бит на частотах дискретизации до 48 кГц.
Каждый отсчет сигнала передается
32-разрядным словом, в котором 20 разрядов используются для передачи отсчета, а
12 - для формирования синхронизирующей преамбулы, передачи дополнительной
информации и бита четности. 4 разряда из служебной группы могут использоваться
для расширения формата отсчетов до 24 разрядов.
Помимо бита четности,
служебная часть слова содержит бит достоверности (Validity), который должен
быть нулевым для каждого достоверного отсчета. В случае приема слова с
единичным битом Validity либо с нарушением четности в слове приемник трактует
весь отсчет как ошибочный и может на выбор либо заменить его предыдущим
значением, либо интерполировать на основе нескольких соседних достоверных
отсчетов.
Отсчеты, помеченные как
недостоверные, могут передавать CD-проигрыватели, DAT-магнитофоны и другие
устройства, если при считывании информации с носителя не удалось
скорректировать возникшие в процессе чтения ошибки.
Стандартно формат
кодирования предназначен для передачи одно- и двух-канального сигнала, однако
при использовании служебных разрядов для кодирования номера канала возможна
передача многоканального сигнала.
С электрической стороны
S/PDIF предусматривает соединение коаксиальным кабелем с волновым
сопротивлением 75 Ом и разъемами типа RCA ("тюльпан"), амплитуда
сигнала - 0.5 В. AES/EBU предусматривает соединение симметричным экранированным
двухпроводным кабелем с трансформаторной развязкой по интерфейсу RS-422 с
амплитудой сигнала 3-10 В, разъемы - трехконтактные типа Cannon XLR. Существуют
также оптические варианты приемопередатчиков - TosLink (пластмассовое
оптоволокно) и AT&T Link (стеклянное оптоволокно).
Обработка цифрового
звука
Цифровой звук
обрабатывается посредством математических операций, применяемых к отдельным
отсчетам сигнала, либо к группам отсчетов различной длины. Выполняемые
математические операции могут либо имитировать работу традиционных аналоговых
средств обработки (микширование двух сигналов - сложение, усиление/ослабление
сигнала - умножение на константу, модуляция - умножение на функцию и т.п.),
либо использовать альтернативные методы - например, разложение сигнала в спектр
(ряд Фурье), коррекция отдельных частотных составляющих, затем обратная
"сборка" сигнала из спектра.
Обработка цифровых
сигналов подразделяется на линейную (в реальном времени, над "живым"
сигналом) и нелинейную - над предварительно записанным сигналом. Линейная
обработка требует достаточного быстродействия вычислительной системы
(процессора); в ряде случаев невозможно совмещение требуемого быстродействия и
качества, и тогда используется упрощенная обработка с пониженным качеством.
Нелинейная обработка никак не ограничена во времени, поэтому для нее могут быть
использованы вычислительные средства любой мощности, а время обработки,
особенно с высоким качеством, может достигать нескольких минут и даже часов.
|