Что такое оцифровка в музыке

Содержание

В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука — количество уровней) [1] .

Содержание

Принципы оцифровки звука [ править | править код ]

Цифровой звук — это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды [2] .

Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде [2] .
Другое название оцифровки звука — аналогово-цифровое преобразование звука.

Оцифровка звука включает в себя два процесса:

процесс дискретизации (осуществление выборки) сигнала по времени
процесс квантования по амплитуде.

Дискретизация по времени [ править | править код ]

Процесс дискретизации по времени — процесс получения значений сигнала, который преобразуется с определенным временным шагом — шагом дискретизации . Количество замеров величины сигнала, осуществляемых в единицу времени, называют частотой дискретизации или частотой выборки, или частотой семплирования (от англ. « sampling» — «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.
Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором находится частота спектра равная F_m, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации F_d выполняется: F_d>2F_m.
На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (20 Гц — 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен).
Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью (хотя исходя из теоремы Шенона и Котельникова это возможно)

Линейное (однородное) квантование амплитуды [ править | править код ]

Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2 N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от −1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды — динамический диапазон сигнала — в виде 2 N −1 равных промежутков, разделив его на 2 N уровней — квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде — процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2 N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным).
Точность округления зависит от выбранного количества (2 N ) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа — отсчетами или семплами (от англ. « sample» — «замер»). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала — дискретизация сигнала во времени в совокупности с методом однородного квантования — называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation — PCM).
Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM (Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.

Другие способы оцифровки [ править | править код ]

Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией — неоднородной ИКМ (Nonuniform PCM).
Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция — разностная ИКМ (англ. « Differential PCM») — в случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов [3] .

Аналогово-цифровые преобразователи (АЦП) [ править | править код ]

Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП).
Это преобразование включает в себя следующие операции:

Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.

Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.

Кодирование оцифрованного звука перед его записью на носитель [ править | править код ]

Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.

Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел — значений амплитуды. В этом случае существуют два способа хранения информации.

Первый — PCM (Pulse Code Modulation — импульсно-кодовая модуляция) — способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
Второй — ADPCM (Adaptive Delta PCM — адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).

Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.

Кодирование данных без потерь (lossless coding) — способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.

Кодирование данных с потерями (lossy coding). Здесь цель — добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путём использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» — сильное сжатие достигается путём «воинственного упрощения» (когда кодером игнорируются множественные нюансы). Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания [4] .

Терминология [ править | править код ]

кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
кодек (от англ. « codec » — « Coder / Decoder ») — программный или аппаратный блок, предназначенный для кодирования/декодирования данных.

Наиболее распространённые кодеки [ править | править код ]

MP3 – MPEG-1 Layer 3
ОGG – Ogg Vorbis
WMA – Windows Media Audio
MPC — MusePack
AAC – MPEG-2/4 AAC (Advanced Audio Coding)

Стандарт MPEG-2 AAC
Стандарт MPEG-4 AAC

Некоторые форматы оцифровки звука в сравнении [ править | править код ]

12:1 с потерями

3:1 с потерями

11:1 с потерями

Название формата	Квантование, бит	Частота дискретизации, кГц	Число каналов	Величина потока данных с диска, кбит/с	Степень сжатия/упаковки
CD	16	44,1	2	1411,2	1:1 без потерь
Dolby Digital (AC3)	16-24	48	6	до 640
DTS	20-24	48; 96	до 8	до 1536
DVD-Audio	16; 20; 24	44,1; 48; 88,2; 96	6	6912	2:1 без потерь
DVD-Audio	16; 20; 24	176,4; 192	2	4608	2:1 без потерь
MP3	плавающий	до 48	2	до 320
AAC	плавающий	до 96	до 48	до 529	с потерями
AAC+ (SBR)	плавающий	до 48	2	до 320	с потерями
Ogg Vorbis	до 32	до 192	до 255	до 1000	с потерями
WMA	до 24	до 96	до 8	до 768	2:1, есть версия без потерь

Читайте также: Acer aspire one обзор

Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя [ править | править код ]

Помехоустойчивое и канальное кодирование [ править | править код ]

Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу, полученному на выходе АЦП, добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежение. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП.

Принцип действия ЦАП [ править | править код ]

Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:

Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот

Параметры, влияющие на качество звука при его прохождении по полному циклу [ править | править код ]

Основными параметрами, влияющими на качество звука при этом являются:

Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:

Введение

О том, как пользоваться звуковой картой, написано множество книг и статей, в том числе и на нашем сайте. Однако, на этот раз речь пойдет не о том, что уже и без того известно каждому постоянному читателю раздела Мультимедиа, а о том, что называется практикой цифровой звукозаписи. Наверняка любой владелец мультимедийного компьютера рано или поздно приступает к этой увлекательной деятельности. Собственно, для этого (и не только) компьютер и приобретают. Тем не менее, процесс этот не столь прост, и нужно иметь некоторый навык для достижения максимального качества. Цель этой статьи — дать читателям сайта (и владельцам SB Live! среди них в частности) некоторые полезные рекомендации в этой области, которые по тем или иным причинам не освещены в прессе или Сети должным образом.

Начну с того, что в свое время передо мной встал вопрос сведения моей кассетной фонотеки в MP3 файлы, и я вынужден был потратить не одну ночь для того, чтобы сделать процесс перегона аудиоинформации в компьютер по возможности более качественным и более универсальным для большинства аудиозаписей. Скажу сразу, несмотря на солидный опыт звукозаписи (и аналоговой и цифровой), это, на первый взгляд, невинное занятие потребовало у меня мобилизации многих сил и знаний.

Однако, пользователь приличной звуковой карты совершенно не обязан (как я) иметь высшее радиотехническое образование, и все же, достойное качество полученной записи требовать вправе. Считаю своим долгом дать аудитории iXBT тот самый минимум информации, который, надеюсь, избавит многих от неприятностей, связанных с оцифровкой аудио (таких как помехи, наводки и т.д). Полагаю, что некоторые сведения в этом материале будут полезны и опытным пользователям. Для того чтобы не выйти за рамки приличия, скажу также, что все написанное ниже — результат обобщения опыта многих людей, но, конечно же, не претендует на истину в последней инстанции. Обоснованная критика от читателей — это всегда хорошо! (Свои отзывы на статьи можно писать и в нашу конференцию О материалах сайта).

Общие замечания

Наиболее часто пользователям мультимедиа приходится оцифровывать следующие источники:

Виниловые пластинки. Здесь главное — хороший проигрыватель и предусилитель-корректор (тот, что встраивается в дорогие усилители). Из отечественных проигрывателей порекомендую Феникс ЭП 009С (алмазный эллипс в качестве головки, автоматический тонарм). А дальше — записываем пластинку на компьютер, чистим от щелчков (Click Removal), фильтруем инфразвук ниже 16 Гц (для устранения рокота) и нарезаем запись на песни. Шум лучше не удалять, так как шум в 65-70 дБ на выходе проигрывателя (или корректора) не так уж и велик. Например, 65-70 дБ выдает аналоговый выход большинства CD-ROM и ведь ничего? А вот с фоном (неприятным низкочастотным тоном в 50, 100, 150 и так далее Гц) лучше разобраться до оцифровки — где-то висит земля, или перепутаны полюса внутри проигрывателя.

Микрофон. Я подразумеваю хороший микрофон и микрофонный усилитель. И про то, и про другое можно найти массу информации в печатных изданиях, да и в Сети тоже. Дам совет только в одном.

Дело в том, что в студийной практике применяется один очень умный принцип для соединительных кабелей. Про витую пару сигнальных линий все уже знают, но вот как припаивать провода на концах проводов — лишь посвященные, да и то не все.

На рисунке ниже показано, как правильно изготовить шнур, который не внесет никакого вклада в качество записи, если он состоит из качественных проводов. В качестве экрана — медная оплетка (желательно, чтобы везде применялась медь!). Сигнальные жилы внутри экрана — витая пара медных многожильных проводов. Подобный кабель лучше купить в каком-нибудь магазине, где продают профессиональные микрофоны, гитары, и т.п. (дешевле обойдется провод, чем помехи). Стоит отметить, что только с микрофоном необходимо столь щепетильно отнестись к кабелю, иначе будете менять микрофонные усилители и сами микрофоны до греческих календ.

Если картинка не очень понятна, знайте сам ПРИНЦИП:

Экран соединен с металлической основой капсюля (если она металлическая) или просто висит внутри корпуса микрофона, а на входе (только лишь на входе. ) экран соединяется с землей. Тогда помехи и наводки, попав в экран, стекают в одну точку (как бы компенсируются), а не циркулируют по экрану. Экран не должен быть "антенной для помех"!

Я надеюсь, инженеры простят мне столь вольное толкование этой важной истины, а эстеты подобный эскиз :).

В случае с электрогитарой — руководствоваться тем же! Электрогитара — тот же микрофон, только менее чувствительный. Экран коммутационной схемы внутри гитары (если нет — сделайте из жести или шоколадной фольги) присоединяем к экрану, а потом, также соединяем на входе карты или приставки с землей. Не играйте на этом инструменте вблизи системного блока — изготовьте кабель подлиннее.

Вот только не стоит гробить студийную технику! Просто проверьте, как распаяны разъемы и все. Микрофон с профессиональным разъемом CANON (это такой здоровый, с защелкой) имеет обычно землю на штырьке номер 3 — тот, что посередине, если не так — уточните у продавца (не дарить же 100$ за новенький Shure SM58!?).

Шнуры от микрофонного усилителя/процессора/магнитофона и т.д. паяем по тому же принципу (экран соединяем с землей на входе), только здесь добавляется еще жила второго стереоканала. Не мешает заземлить и системный блок компьютера.

Надеюсь, вы согласны с тем, что грамотно созданный шнур не столь уж плох в сравнении с кабелем Monster Cable или Vampire, хотя если ваш шестиканальный DSP-усилитель стоит 1000$ — все же потратьтесь на приличный кабель.

Запись с микрофона нуждается лишь в частотной коррекции (если АЧХ у микрофона имеет ощутимую неравномерность и спад раньше 18-19 кГц). Кое-кто чистит и шум, но "правильный" тракт до оцифровки менее шумен, чем капли дождя, падающие на подоконник и безжалостно фиксируемые на Ваш микрофон.

А вот с компакт-кассетой 2 не так все просто. Тут запись и очистка от артефактов — самое настоящее искусство и подходы у опытных людей свои. Я же поделюсь моими методами, позволившими ИМХО 3 выжать из кассеты все ценное.

2 Ирония судьбы — компакт-кассета и компакт-диск сейчас уже не кажутся нам компактными. А уж их "некомпактных" собратьев из эпохи динозавров так вообще мало кто помнит. Так что, производителям надо было быть поосторожнее с выбором названий в своё время.

3 ИМХО — сокращение от In My Humble Opinion, "по моему скромному мнению". Англоизм, стандартное слово в обиходе постоянных участников конференций. Обычно применяется пишущим сообщение перед каждой спорной фразой, чтобы указать, что это лишь ЕГО скромное мнение, не уводить тему в сторону, и не вызывать шквал протеста от оппонентов, которые забивают тем самым конференцию "мусором".

Вся штука в том, что у компакт-кассеты ограниченный ресурс эксплуатации (примерно 300 прогонов). Потом информация начинает теряться, звук становится рассыпчатым, глухим, прерывистым. Кроме того, более целесообразно гонять CD с отполированными MP3 файлами, чем вставлять кассету, крутить головку, чистить тракт спиртом и т.д. (хотя и у этого ритуала есть приверженцы!). К тому же, отреставрированная фонограмма с приличной по качеству кассеты ИМХО иногда даст фору по насыщенности деталями и аналоговой "теплоте" многим 128 Кбит MP3 — файлам. Я не распространитель мифов о дискретной и мертвой цифровой записи (хотя лет пять назад был другого мнения, да и АЦП/ЦАП были не те), но кассету хоронить рано, и владельцы хороших стационарных аппаратов меня поддержат!

Реставрация

Прежде всего, необходимо усвоить, что даже если Ваш аппарат выдает музыкальную информацию лишь 40-14000 Гц на Ferro-кассете, он все равно воспроизводит какие-то звуки и на более высоких частотах (вплоть до 20-21000 Гц), только они не вписались в нормы ГОСТа и МЭКа, то есть очень ослаблены и утоплены в шумах. Именно это нам и предстоит исправить.

1. Выравнивание АЧХ

Почти на любую стандартную кассету (TDK D, и т.д.), да и на кассеты подороже аудиозапись попадает практически одинаково. Если у вас не TEAC за 900$ или не Nakamichi Dragon, то разницы нет: AIWA или ВЕГА. На подобных "бюджетных" аппаратах воспроизводимый с кассеты сигнал больше зависит от свойств магнитной ленты, нежели от тракта воспроизведения. А магнитная лента на "железных" кассетах просто не пропустит частоты выше 14000 Гц, остальное будет жестоко ослаблено.

АЧХ тракта запись-воспроизведение для магнитофона ВЕГА-МП122С:

Конечно, тракт записи-воспроизведения у всех магнитофонов различен и особенно дотошным владельцам хороших стационарных магнитофонов исследования предстоит проделать самостоятельно. Для этого (а также для дальнейшего мастеринга) нам понадобятся последние версии знакомых программ (или хотя бы их демо-версии):

Cool Edit Pro 1.2, или 2000 для создания белого шума, синусов, фильтрации и очищения от шумов и т.д.
Sound Forge 4.5 для монтажа (оцифровка, нарезка материала)
SpectraLAB 4.32 для всестороннего анализа
Энтузиасты могут применять внешние денойзеры (удаление шума), типа Sonic Foundry Noise Reduction 2.0, Arboretum Restoration-NR и др., но я после многочисленных субъективных и объективных исследований остановился на встроенном средстве Cool Edit Pro (хотя долго не мог с этим смириться). Все же программисты Syntrillium Software свой хлеб едят не зря! 4 То же касается и фильтрации.

4 Cледует отметить, что коммерческая версия программы Cool Edit (Cool Edit Pro 1.2) существенно отличается от своего бесплатного собрата (Cool Edit 2000). Например, Cool Edit 2000 не имеет функции Preview (предварительного прослушивания) при обработке, Multitrack-режима и т.д. И тем не менее, все необходимое для наших задач имеется в обеих версиях программы Cool Edit.

Процедуру исследования тракта записи/воспроизведения магнитофона лучше проделать так:

Очистить воспроизводящую головку магнитофона и прижимной ролик с ведущим валом спиртом, затем, поместив чистую (с обеих сторон!) кассету в магнитофон, приготовить ее к записи.
Далее, подав белый шум 5 (48 кГц) на вход (Generate/Noise…/White, mono, intensity = 12 в Cool Edit), добиться оптимального уровня записи на Вашем магнитофоне и записать около 3-х минут (если компьютер не ниже Celeron+64Mb) или 60 секунд этого шума (ежели машина слабее). Магнитная лента весьма неравномерно реагирует на последовательное изменение значения частоты (Frequency Sweep), поэтому, из соображений статистики лучше использовать белый или розовый шум. Это обеспечивает более точный и равномерный график АЧХ.
Далее, следует, не вынимая кассету и не подкручивая воспроизводящую головку, записать только что полученный белый шум — с кассеты на Line-In звуковой карты (частоту дискретизации ставим 48 кГц). 6
Теперь нормализуем полученный сигнал под -1 дБ (Process/Normalize… в Sound Forge 4.5), и сохраняем.
В SpectraLAB выбираем Mode/Post Process, и открываем только что полученный файл. Делаем настройки (Settings): 48000, 16bit, FFT Size = 65536 (для слабой машины 16384), mono, Average = linear. Выделяем весь файл в режиме View/Time Series, жмем правую кнопку и приказываем: Compute and Display Average Spectrum.
Смотрим на спектр и кривимся неравномерности АЧХ нашего магнитофона J. В Cool Edit открываем этот же файл и поднимаем ослабленные частоты (FFT Filter etc.). Сохраняем (но не закрываем. ) в другой файл и этот другой открываем в SpectraLAB (первый файл пригодится в случае порчи второго). Чтобы запомнить огибающие спектра в SpectraLAB для сравнения — жмите Set в районе Overlays.
Не красиво? Отменяйте в Cool Edit фильтрацию — и снова!

5 Использовать розовый шум предпочтительнее, так как он ближе по свойствам к музыкальному сигналу.

6 Почему это обязательное условие для получения налучшего качества записи, читайте статьи с измерениями тестовых параметров звуковых карт на нашем сайте.

Как видите, искусство и здесь требует жертв :(. Однако я повторяю — на хороших аппаратах тракты Record-Play очень схожи, и вы можете воспользоваться моими результатами исправления АЧХ для магнитофона МП ВЕГА-122С. Для этого в файле C:Windowscool.ini найдите раздел [Filters96] и в незанятой строке запишите (в одну линию!) следующее:

Item29=RESTORATION,3,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,9,3444, 21,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,4004,100,4012,5,4096,5, 19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,9,3444,21,3583,28,3688,42,3773, 48,3848,61,3925,76,3957,96,3998,100,4004,100,4012,5,4096,5,2,0,12000,1,2,0,0,1000, 100,5,-10,100,-0.5,12,24000,1,0,1,1,48000

Теперь в Transform/Filters…/FFT Filter (все в том же Cool Edit) ищем пресет RESTORATION и корректируем фонограмму. Все. Я убил 2 дня, чтобы выровнять АЧХ своей ВЕГИ до значения ±0,5 дБ от 10 до 19500 Гц! Наслаждайтесь. АЧХ ВЕГИ-МП122С до (зеленый график) и после (желтый график) частотной коррекции:

Кроме того, всем известно, что АЧХ самой звуковой карты, тем более — внешнего кольца Line-Out-Line-In тоже обладает характерным спадом в области высоких частот, и в этом обычно виновен АЦП, нежели более-менее линейный ЦАП. Оцифровка получается тусклой, лишенной прозрачности и воздушности в верхнем регистре. С этой проблемой желательно справиться перед обработкой записанного материала и об этом речь пойдет ниже.

2. Владельцам SB Live!

Многие владельцы SB Live!1024 Value знают, что АЧХ кодека SigmaTel STAC9721 совсем не идеальна и уже после 4,5 кГц начинается ступенчатый спад:

Основной вклад в это вносит АЦП кодека, в чем можно убедиться, скажем, в этой статье. Сделано это, с одной стороны, для нашего же блага: таким образом предотвращается проникновение паразитных гармоник в слышимую область спектра. С другой стороны, подобное "подрезание" верхов имеет и негативное последствие: на достаточно серьезной Hi-Fi-аппаратуре этот ньюанс может быть вполне заметен.

Поэтому, всем владельцам SB Live! НАСТОЯТЕЛЬНО рекомендую каждую записанную фонограмму через Line-IN сначала, то есть до последующей обработки, пропустить через следующий фильтр (тот же cool.ini и тот же раздел):

Item36=CORRECtion,3,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391, 12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825, 89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391,12,2569,15, 2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825,89,4096,100, 2,0,12000,1,2,0,0,1000,100,3,-10,100,0,14,24000,1,0,0,1,48000

Кстати, номер Item должен не совпадать ни с каким другим, ну а так — любой…

После подобной операции неравномерность АЧХ в кольце LineOUT — LineIN для звуковой карты SB Live! удалось уменьшить до ±0,1 дБ! В этом можно убедиться, взглянув на спектрограмму (мне это далось в свое время опять же ценой пары ночей).

АЧХ звуковой карты SBLive (кодек STAC9721) до и после частотной коррекции. Шкала графика 5 дБ!:

Теперь линейный вход у нас — референс! Enjoy…

Владельцам микрофона МД-52А (студийный, 20-16000Гц) посоветую следующую коррекционную фишку:

Item40=MIC_MD52A,3,8,0,0,1723,17,2158,37,2569,53,3176,89,3316,100,3480,100,4096, 100,11,0,50,4,51,5,60,6,73,8,81,10,85,14,87,17,79,19,60,24,51,4096,50,2,1,6000,1,4, 0,0,648,31,831,57,1000,100,3,0,100,0,16,24000,2,1,0,1,48000

Не забываем, что строка неразрывна во всю свою длину.

3. Шумоподавление

Теперь поговорим о шумоподавлении. Как я уже указал — Noise Reduction в Cool Edit — на мой взгляд — лучший. Звукорежиссеры хвалят Arboretum Ionizer, якобы из-за того, что он избавлен от внесения фазовых артефактов в обработанный материал (если знаете где взять — напишите!), знакомые советуют Sonic Foundry Noise Reduction. Но мои уши пока что влюблены в CoolEdit-овский шумодав. Кроме того, ни в каком другом нет столько настроек и опций, да и то, что он работает медленнее (читай добросовестнее) других — тоже говорит о многом. Существует также весьма неплохая программа реставрации DART Pro, однако детальное сравнение всех этих программных продуктов выходит за рамки данной статьи.

Итак, после многотрудной фильтрации необходимо взять 1,5-1,6 секунд шума перед каждой (для максималистов) или какой-нибудь средней фанерой (но только с той же кассеты и стороны, откуда взята фонограмма). Далее:

1. Сделать профиль этого 1,5 секундного шума (Get Profile from Selection) с параметрами:

Snapshots in profile = 1024…4096 (в зависимости от мощности компьютера).
FFT Size = 4096 (эту цифру я нашел оптимальной для подавления шума после многочисленных экспериментов); Не рекомендую ставить максимальный размер FFT, так как это повлечет в результате увеличение так называемого Hiss-шума сигнале.
2. Теперь, отфильтрованную фонограмму выделяем и уничтожаем шум тем же Noise Reduction в Cool Edit. Параметры могут быть разными (поэкспериментируйте с кнопкой Preview). Но я, после долгих опытов, могу для магнитофона порекомендовать следующие параметры:

Precision Factor = 12 (для максималистов — все 14, для Preview — 8). Параметр определяет точность вычислений;
Smoothing Amount = 0 (именно 0!). Параметр вносит допуск на погрешность вычитания спектра шума из спектра сигнала в дБ. Чем больше — тем хуже;
Transition W >Noise Reduction Level = 35…42 (при Transition W >Нередко приходиться повторно нормализовать фонограммы под -0,2 дБ (это стандарт для CD-Audio), так как шумоподавление может серьезно уменьшить энергию сигнала. Все готово к MP3-кодированию! Правда, бытует мнение, что нормализация перед сжатием в MP3 — это очень вредно, и Вы на это должны идти лишь в случае ощутимого различия между уровнями отдельных каналов или просто слабого (-3…-6 дБ) уровня фонограммы в конечном итоге. Это как раз тот случай, когда решать Вам.

4. Сжатие

Лично я пользуюсь кодером Fraunhofer IIS, встроенный в BPM Studio Pro 3.0. Остальные кодеры (ИМХО) от Fraunhofer IIS не могут преодолеть своеобразного шелеста в полученном файле, причем на всех битрейтах. А вот к LAME -f я отношусь настороженно, этот кодер, по-моему, только на АЧХ и хорош.

Теперь о битрейте. Честно говоря, все ньюансы сохраняются лишь при 256 Кбит/c, но и при 192 Кбит/c фонограмма почти неотличима от исходной. Для проверки того, какой битрейт наилучший для данной фонограммы, я применяю довольно жестокую методику субъективного сравнения. Сначала кодирую наиболее ответственный фрагмент (насыщенный высокими частотами или с какими-нибудь знакомыми ньюансами) во все битрейты: 128, 160, 192, 224, 256. Затем последовательно соединяю в Sound Forge оригинальный фрагмент с закодированным и слушаю. Обычно 128 и 160 Кбит/с выпадают из рассмотрения сразу, а настоящая борьба разворачивается между 192 и 256 Кбит/с (ну не люблю я поток в 224 Кбит/c, ибо кривой он какой-то :)).

Для отреставрированных фонограмм вполне хватает и 192 Кбит/с, но опять-таки некоторым и 256 Кбит/c подчас не хватает. Скажу также, что магнитофонные записи представляют собой весьма непростой для кодирования материал. Как-то раз я подверг, как теперь принято говорить, "зачистке" фонограмму с весьма посредственным качеством и закодировав потом все в 192 Кбит/c я был потрясен услышанным! Результат звучал словно джаз на 112 Кбит/c, то есть омерзительно. У этого феномена очень глубокая причина и я могу написать еще одну статью на эту тему, если желаете. Так что, доверяйте технике и спектрограммам, но контрольное прослушивание устроить не ленитесь. Тем не менее, по большей части эта информация относится к обладателям хорошего тракта усилитель-колонки (наушники).

Заключение

Вот так, проявив стремление получить максимум из возможного, можно добиться вполне пристойного качества записи с любого источника. Просто не нужно никогда довольствоваться тем, чем нас снабдили производители звуковых карт, а искать, изучать и требовать Звук. Надеюсь, вы со мной согласны, уважаемые читатели.

«Обычный» аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде. Как же происходит преобразование аналогового сигнала в цифровой?

Цифровой звук – это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество» будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот – приблизительно от 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Как этого добиться и как происходит оцифровка? Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть», то есть описать математический вид функции и сохранить в памяти компьютера. Однако практически это невозможно, поскольку звуковые колебания нельзя представить аналитической формулой (как y=COSx, например). Остается один путь – описать функцию путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям – амплитудной и временной (приближать в точках – значит, говоря простым языком, брать значения функции в точках и записывать их с конечной точностью).

Таким образом, оцифровка сигнала включает в себя два процесса — процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации — это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени (рис. 1).

Квантование — процесс замены реальных значений сигнала приближенными с определенной точностью (рис. 2). Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Теперь о практических проблемах.

Во-первых, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

Во-вторых, частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения (под фразой «в цифровом звуке есть такие-то частоты и шумы» подразумевается, что когда этот звук будет преобразован обратно из цифрового вида в аналоговый, то в его звучании будут присутствовать упомянутые частоты и шумы). Так, например, джиттер (jitter) – шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к «захвату» не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. Как мы говорили, при квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.

Справочка: стандартные параметры записи аудио компакт-дисков следующие: частота дискретизации — 44.1 КГц, уровень квантования – 16 бит. Такие параметры соответствуют 65536 (2) уровням квантования амплитуды при взятии ее значений 44100 раз в секунду.

На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя — всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

Поехали дальше. Как получить аналоговый звук опять из цифры?

Мы же его должны услышать, а цифровки нам слышать не дано.

Как после оцифровки прослушивать звук? То есть, как преобразовывать его обратно из цифрового вида в аналоговый?

Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала:

Еще совсем недавно воспроизведение звука в домашних компьютерах было проблемой, так как компьютеры не оснащались специальными ЦАП. Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker). Вообще говоря, этот динамик до сих пор имеется почти во всех PC, но никто уже не помнит как его «раскачать», чтобы он заиграл. Если вкратце, то этот динамик присоединен к порту на материнской плате, у которого есть два положения – 1 и 0. Так вот, если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом он «плавно раскачивается» вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox – это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый – то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты – подключаемой, либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом. Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно). Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнями. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.

Что такое оцифровка в музыке

Содержание

Принципы оцифровки звука [ править | править код ]

Дискретизация по времени [ править | править код ]

Линейное (однородное) квантование амплитуды [ править | править код ]

Другие способы оцифровки [ править | править код ]

Аналогово-цифровые преобразователи (АЦП) [ править | править код ]

Кодирование оцифрованного звука перед его записью на носитель [ править | править код ]

Терминология [ править | править код ]

Наиболее распространённые кодеки [ править | править код ]

Некоторые форматы оцифровки звука в сравнении [ править | править код ]

Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя [ править | править код ]

Помехоустойчивое и канальное кодирование [ править | править код ]

Принцип действия ЦАП [ править | править код ]

Параметры, влияющие на качество звука при его прохождении по полному циклу [ править | править код ]

Введение

Общие замечания

Реставрация

1. Выравнивание АЧХ

2. Владельцам SB Live!

3. Шумоподавление

4. Сжатие

Заключение

Рекомендуем к прочтению

Вертикальная компьютерная мышь: преимущества и недостатки

Ноутбуки на Intel Core i7

Как зашифровать свой компьютер

Добавить комментарий Отменить ответ