Студентам > Рефераты > Звуковые карты и Компрессия звука
Звуковые карты и Компрессия звукаСтраница: 4/12
Традиционное
представление PCM с так называемой фиксированной точкой (fixed point), когда отсчеты
представляются целыми числами, наиболее удобно и влечет минимум накладных
расходов, однако точность вычислений зависит от масштаба операций - например,
при умножении образуются числа вдвое большей разрядности, которые потом
приходится приводить обратно к разрядности исходных отсчетов, а это может
привести к переполнению разрядной сетки. Компромиссным вариантом служит
промежуточное увеличение разрядности отсчетов (например, 16->32), что
снижает вероятность переполнения, однако требует большей вычислительной
мощности, объема памяти и вносит дополнительные искажения при обратном
понижении разрядности. Кроме того, снижению погрешности способствует правильный
выбор последовательности коммутативных (допускающих перестановку) операций,
группировка дистрибутивных операций, учет особенностей работы конкретного
процессора и т.п.
Другим способом
увеличения точности является преобразование отсчетов в форму с плавающей точкой
(floating point) с разделением на значащую часть - мантиссу и показатель
величины - порядок. В этой форме все операции сохраняют разрядность значащей
части, и умножение не приводит к переполнению разрядной сетки. Однако, как само
преобразование между формами с фиксированной и плавающей точкой, так и
вычисления в этой форме требуют на порядки большего быстродействия процессора,
что сильно затрудняет их использование в реальном времени.
Несмотря на то, что
качество сигнала неизбежно, хоть и незначительно, ухудшается при любой
"искажающей" цифровой обработке, некоторые операции при определенных
условиях являются полностью и однозначно обратимыми.
Например, усиление
сигнала по амплитуде в три раза заключается в умножении каждого отсчета на три;
если эта операция выполнялась с фиксированной точкой и при этом не возникло
переполнения, с помощью деления на три потом можно будет вернуть все отсчеты в
исходное состояние, тем самым полностью восстановив первоначальное состояние
сигнала. И в то же время после умножения каждый отсчет окажется увеличенным
точно в три раза, поэтому ошибка относительно исходного аналогового сигнала,
внесенная при квантовании, также увеличится в среднем в три раза, тем самым
ухудшив общее качество сигнала.
Сказанное выше
демонстрирует, что ухудшение качества при "искажающей" цифровой
обработке совсем не обязательно накапливается со временем, хотя в большинстве
реальных применений происходит именно так. Кроме того, это не означает, что
любая операция цифрового усиления всегда будет однозначно обратимой - это
зависит от многих особенностей применения операции. Тем не менее, грамотно и
качественно реализованная цифровая обработка может давать существенно меньший
уровень искажений, чем такая же аналоговая, разве что это будут искажения
разных видов.
К вопросу о сохранении
качества сигнала при цифровом преобразовании форматов
Только в том случае,
когда в процессе преобразования применяются "искажающие" операции -
изменение разрядности отсчета, частоты дискретизации, фильтрование, сжатие с
потерями и т.п. Простое увеличение разрядности отсчета с сохранением частоты
дискретизации будет неискажающим, однако такое же увеличение, сопряженное с
применением сглаживающей функции - уже нет. Уменьшение разрядности отсчета
всегда является искажающей операцией, кроме случая, когда преобразуемые отсчеты
были получены таким же простым увеличением разрядности - равной или меньшей.
Многие форматы
отличаются друг от друга только порядком битов в слове, отсчетов левого и
правого каналов в потоке и служебной информацией - заголовками, контрольными
суммами, помехозащитными кодами и т.п. Точный способ проверки неискажаемости
сигнала заключается в преобразовании нескольких различных потоков (файлов)
формата F1 в формат F2, а затем обратно в F1. Если информационная часть каждого
потока (файла) при этом будет идентична исходной - данный вид преобразования можно
считать неискажающим.
Под информационной
частью потока (файла) понимается собственно набор данных, описывающих звуковой
сигнал; остальная часть считается служебной и на форму сигнала в общем случае
не влияет. Например, если в служебной части файла или потока предусмотрено поле
для времени его создания (передачи), то даже в случае полного совпадения
информационных частей двух разных файлов или потоков их служебные части
окажутся различными, и это будет зафиксировано логическим анализатором в случае
потока или программой побайтного сравнения - в случае файла. Кроме этого,
временной сдвиг одного сигнала относительно другого, возникающий при
выравнивании цифрового потока по границам слов или блоков и состоящий в
добавлении нулевых отсчетов в начало и/или конец файла или потока, также
приводит к их кажущемуся цифровому несовпадению. В таких ситуациях для проверки
идентичности цифровых сигналов необходимо пользоваться специальной аппаратурой
или программой.
Для
"перегонки" звука между специализированными системами, имеющими
совместимые цифровые интерфейсы, достаточно соединить их цифровым кабелем и
переписать звук с одной системы на другую; в ряде сочетаний устройств при этом
возможно ухудшение качества сигнала из-за уменьшения разрядности отсчета,
передискретизации или сжатия звука. Например, при копировании звука между
одинаковыми системами MiniDisk через интерфейс S/PDIF сжатый звуковой поток на
передающей стороне подвергается восстановлению, а на приемной - повторному
сжатию. Вследствие несимметричности алгоритма ATRAC в звук при повторном сжатии
будут внесены добавочные искажения.
Для преобразования
компьютерного файла в другой формат используются программы-конверторы:
WAV2AIFF/AIFF2WAV, Convert, AWave и другие - на IBM PC, SoundExtractor,
SampleEditor, BST - на Apple Macintosh.
Обмен звуковой
информацией между компьютерной и специализированной системой нередко возможен
несколькими способами: Прямой перенос по цифровому интерфейсу, если у обоих
систем имеются совместимые цифровые интерфейсы. При этом на компьютерной
системе используется программа записи/воспроизведения, формирующая или
воспроизводящая стандартный для данной системы звуковой файл.
Чтение/запись на
специализированных системах стандартных компьютерных носителей. Например, ряд
музыкальных рабочих станций использует гибкие диски в форматах стандартных
файловых систем IBM PC или Macintosh, либо позволяет прочитать или создать
такой диск.
Чтение и запись на
компьютерной системе специализированных носителей и их специальных форматов,
если это позволяет аппаратура и программное обеспечение. Таким образом читаются
и пишутся дискеты от Ensoniq, AKAI, Emulator, компакт-диски ряда
"чужих" систем, а также читаются и пишутся обычные звуковые
компакт-диски.
Компьютерные программы,
используемые для обработки звука
На IBM PC наиболее
популярны редакторы Cool Edit Pro (Syntrillium) Sound Forge (Sonic Foundry),
WaveLab (Steinberg) и системы многодорожечной записи SAW Plus, Samplitude,
N-Track и DDClip. На Apple Macintosh используются программ Alchemy, Deck II,
DigiTracks, HyperPrism.
Сейчас популяpны
пpогpаммы Cool Editor, Sound Forge, Samplitude, Software Audio Workshop (SAW).
Они дают возможность пpосматpи- вать осциллогpаммы обоих стеpеоканалов,
пpослушивать выбpанные участки, делать выpезки и вставки, амплитудные и
частотные пpеобpазования, звуковые эффекты (эхо, pевеpбеpацию, фленжеp,
дистошн), наложение дpугих оцифpовок, изменение частоты оцифpовки, генеpиpовать
pазличные виды шумов, синтезиpовать звук по адди- тивному и FM методам и т.п.
Cool Editor содеpжит спектpальный анализатоp, отобpажающий спектp выбpанного
участка оцифpовки.
Многие пpогpаммы
обpаботки звука позволяют загpужать и сохpанять оцифpовки в pазличных фоpматах,
что дает возможность пpеобpазовывать файлы из одного фоpмата в дpугой и pазделять
стеpеоканалы.
Джиттер
Jitter - дрожание
(быстрые колебания) фазы синхросигналов в цифровых системах, приводящее к
неравномерности во времени моментов срабатывания тактируемых этими сигналами
цифровых устройств. Сами по себе цифровые устройства нечувствительны к таким
колебаниям, пока они не достигают значительной величины по сравнению с общей
длительностью импульсов, однако в "пограничных" устройствах,
находящихся на стыке цифровой и аналоговой частей схемы - АЦП и ЦАП - джиттер
приводит к неравномерности моментов срабатывания компараторов АЦП или ключей
ЦАП, приводящей к нарушению правильности формы аналогового сигнала. Для
высокочастотных компонент сигнала дрожание фазы приводит к
"размыванию" звука - нарушению субъективной пространственной
локализации источников, поскольку слуховое восприятие локализации базируется в
основном на фазовых, а не на амплитудных соотношениях стереоканалов.
Джиттер может возникать
из-за любой нестабильности напряжений и токов в области ЦАП/АЦП. Например,
колебания питающих напряжений изменяют частоту опорного генератора, наводки на
провода и печатные дорожки искажают форму цифровых сигналов. Даже если эти
искажения не изменяют информационного содержимого сигнала - заключенной в нем
битовой последовательности, они могут нарушить равномерность опроса входного
звукового сигнала в АЦП или выдачу выходного сигнала с ЦАП и привести к
искажениям формы, особенно заметной в области высоких частот.
Величина джиттера
обозначает максимальное абсолютное отклонение момента перехода тактового
сигнала из одного состояния в другое от расчетного значения, и измеряется в
секундах. Для систем среднего качества допустимая величина джиттера составляет
порядка 100 пикосекунд, для систем класса Hi-Fi ее стараются предельно
минимизировать.
Для борьбы с джиттером
используется тактирование АЦП и ЦАП высокостабильными генераторами, а для
подавления неравномерности цифрового потока, поступающего на ЦАП -
промежуточными буферами типа FIFO (очередь). Для уменьшения влияния помех
применяются обычные методы - экранирование, развязки, исключение "земляных
петель", раздельные источники питания, питание критичных схем от
аккумулятора и т.п. Хорошие результаты дают внешние модули ЦАП, в которых
реализованы описанные методы - например, Audio Alchemy DAC-in-the-Box и другие.
Необходимо различать
"пограничный" джиттер, действующий на границах аналоговой и цифровой
части схемы - в области АЦП или ЦАП, и "внутренний", возникающий в
любых других участках чисто цифровой схемы.
Влияние на звуковой
сигнал имеет только "пограничный" джиттер, ибо только он
непосредственно связан с преобразованием аналогового звукового сигнала. Весь
"внутренний" джиттер при грамотном построении схемы должен полностью
подавляться в интерфейсных цепях, однако некорректная реализация может пропускать
его и непосредственно на ЦАП/АЦП.
Возникающий в цепях
формирования, обработки, передачи, записи и чтения цифровых сигналов
"внутренний" джиттер вполне может распространяться по системе,
выходить за ее пределы и переноситься между системами через цифровые интерфейсы
передачи или цифровые же носители информации. При этом величина джиттера может
как ослабляться, так и усиливаться. При использовании интерфейсов передачи со
"встроенным" (embedded) синхросигналом, а также при чтении с любого
носителя, приемная сторона вынуждена синхронизироваться с передатчиком путем
использования систем фазовой автоподстройки частоты (ФАПЧ, Phase Locked Loop -
PLL), которая вносит дополнительные дрожания, будучи не в состоянии мгновенно
отслеживать изменения фазы и частоты принимаемого сигнала.
Один из возможных
способов ослабления джиттера при передаче - использование синхронных
интерфейсов с отдельным тактовым сигналом (Word Clock), а еще лучше -
асинхронных двунаправленных с возможностью согласования темпа передачи, наподобие
RS-232. В этом случае стороны могут не опасаться возможного опустения или
переполнения буфера на приемном конце, передача может выполняться блоками с
более высокой скоростью, чем идет вывод звука, а приемная сторона может
использовать полностью независимый стабильный генератор для извлечения отсчетов
из буфера. Однако все это имеет смысл только в том случае, когда приемник
работает непосредственно на ЦАП - при записи на носитель неравномерности такой
величины влияния на качество звука не оказывают.
Таким образом, в
корректно реализованной системе все виды джиттера, возникающие в чисто цифровых
блоках и между ними, являются "внутренними" и должны быть подавлены
до передачи цифрового сигнала на ЦАП для оконечного преобразования. Это может быть
сделано при помощи промежуточного буфера, схемы ФАПЧ с плавным изменением
частоты генератора (медленное изменение в небольших пределах, в отличие от
дрожания, практически не ощущается на слух), или каким-либо другим методом.
Для слуховой оценки
звукового сигнала его необходимо воспроизвести либо одновременно на двух разных
системах, либо последовательно - на одной.
Даже если в обоих
случаях сам цифровой сигнал будет одинаковым, набор сопутствующих условий -
аппарат, носитель, его микроструктура, первичные сигналы при считывании
информации, особенности работы декодеров, спектр аналоговых шумов и помех -
почти всегда будет различен. Все эти побочные процессы могут создавать
паразитные наводки, искажающие форму цифрового сигнала, порождающие джиттер,
воздействующие на цепи питания и прочие аналоговые компоненты системы. В
правильно сконструированных и тщательно выполненных аппаратах все эти влияния
должны быть подавлены до уровня, недоступного восприятию, однако для
большинства бытовых и особенно бюджетных аппаратов это не так.
Могут быть и более
прозаичные причины для возникновения разницы - такие, как неустойчивое
считывание цифрового носителя, при котором декодер не в состоянии однозначно
восстановить закодированный звуковой сигнал и вынужден прибегать к его интерполяции,
ухудшающей качество звучания.
Такая же интерполяция
или гашение отсчетов происходит в случае ошибочного их приема по цифровым
межсистемным интерфейсам, что может быть вызвано плохим качеством или
чрезмерной длиной кабеля, воздействием на него сильных помех, неисправностью
приемника или передатчика, плохой их совместимостью и т.п. Поэтому вопрос о
сравнении звучания должен рассматриваться только после того, как доказана
идентичность цифровых потоков, поступающих на оконечный ЦАП. Под ЦАП здесь должен
пониматься именно неделимый, "самый последний" преобразователь, а не
произвольное сложное устройство, получающее на входе цифровой сигнал и выдающее
на выходе аналоговый.
3. Спецификация стандарта MIDI, его
реализация на компьютере
MIDI (цифpовой интеpфейс
музыкальных инстpументов)
MIDI - Musical
Instrument Digital Interface (цифpовой интеpфейс музыкальных инстpументов) -
стандаpт на соединение инстpументов и пеpедачи инфоpмации между ними. Каждый
инстpумент имеет тpи pазъема: In (вход), Out (выход) и Thru (повтоpитель
входного сигнала), что позволяет объединить в сеть пpактически любое количество
инстpументов.
Способ пеpедачи -
токовая петля (5 мА). Инфоpмация пеpедается байтами, в последовательном
стаpтстопном коде (8 битов данных, один стоповый, без четности - фоpмат 8-N-1),
со скоpостью 31250 бит/с. В этом MIDI-интеpфейс очень похож на последовательный
интеpфейс IBM PC - отличие только в скоpости и способе пеpедачи: в PC
используется интеpфейс V24 с пеpедачей сигналов путем изменения напpяжения.
Частоту 31250 бит/с на стандаpтном интеpфейсе IBM PC получить нельзя.
Поток данных,
пеpедаваемый по MIDI, состоит из сообщений (событий): нажатие/отпускание
клавиш, изменение положений pегулятоpов (MIDI-контpоллеpов), смена pежимов
pаботы, синхpонизация и т.п. Можно сказать, что по MIDI пеpедается паpтитуpа
музыкального пpоизведения, однако есть и специальные виды сообщений - System
Exclusive (SysEx) - в котоpых может содеpжаться любая инфоpмация для
инстpумента - напpимеp, оцифpованный звук для загpузки в ОЗУ, паpтитуpа
pитм-блока и т.п. Обычно SysEx уникальны для каждого инстpумента и не
совместимы с дpугими инстpументами.
|