Осцилограф, анализатор спектра, звуковой измеритель и генератор в одной программе Wavetools. Анализ качества музыкального материала с использованием программных средств

Программа представляет собой Open Source амплитудно-частотный звуковой анализатор, действующий в режиме реального времени.

Frequency Analyzer работает с любыми звуковыми колебаниями, включая человеческий голос, выполняя над ними быстрое преобразование Фурье и разбивая их на частотные составляющие.

Когда микрофон преобразует звук в напряжение, звуковая карта работает как очень быстрый цифровой вольтметр, измеряющий напряжение от 11025 до 44100 раз в секунду (в программе можно самостоятельно установить число измерений в секунду). Каждый замер преобразуется в восьми- или шестнадцатиразрядное число. Шестнадцатиразрядные числа позволяют проводить более точный анализ слабых сигналов. В результате выборки удается получить ряд чисел. Они воссоздаются в виде синусоиды в рабочем окне программы под названием «Wave». Помимо этого любой звук может быть показан в виде комбинации синусоидальных волн различных частот. Математически это разделение на составляющие частоты называется преобразованием Фурье. Лучший из всех возможных алгоритмов называется быстрым преобразованием Фурье. Таким образом, окно программы «Frequency Spectrum» показывает спектральный состав звука.

В программе можно выбирать количество замеров, которые будут включены в одно преобразование Фурье. Чем больше замеров, тем больше частот может быть обнаружено в спектре. При изменении этого значения в Frequency Analyzer, график будет меняться.

Для тех, кто хотел бы делать подобные программы самостоятельно, разработчики представили исходный алгоритм быстрого преобразования Фурье, созданный на C + +. Использовать его можно свободно в любом коммерческом программном обеспечении. Также в дистрибутив программы по многочисленным просьбам включен учебник о том, как работать с сигналами, поступающими на микрофон, с помощью Win32 API, полный исходный код Frequency Analyzer и учебник по физике звука. Работает данный программный пакет без инсталляции. Для работы программы необходимо иметь микрофон и звуковую карту.

Количество вычислений преобразований Фурье в секунду можно настроить с помощью параметра программы «Speed (FFT"s per sec)». Однако разработчики предупреждают, что менять эти значения следует с особой осторожностью, поскольку медленные процессоры могут не успевать обрабатывать все присылаемые звуковой картой значения. Это приведет к зависанию компьютера.

Программа Frequency Analyzer была разработана компанией Reliable Software в 1996 году. Это союз четверых независимых программистов двое из которых проживают в Сиэтле, США (Бартош Милевский и Дебби Эрлих) , а двое в Гданьске, Польша (Веслав Калкус и Петр Трояновски). Основной целью своей деятельности компания объявляет борьбу с низким качеством программного обеспечения. Работы по созданию программ проходят удаленно в реальном времени через Skype. Авторы уже создали ряд учебных пособий для Windows и онлайн книгу по программированию, ведут блог, посвященный многопоточному программированию и справочник по Windows API.

Интерфейс приложения английский, русификатора нет. Однако из-за минимального количества настроек разобраться в программе не представляет труда.

Frequency Analyzer работает на персональных компьютерах под управлением операционных систем семейства Microsoft Windows, начиная с версии Windows 98.

Распространение программы: Freeware (бесплатная)

Спектроанализаторы значительно упрощают процесс сведения, позволяя делать более обьективную, подкреплённую визуально эквализацию. Чем может быть полезен анализатор спектра ? Чем они различаются? Где скачать спектроанализатор? Как обычно, обо всём по порядку.

Для начала, небольшой обзор и сравнение vst анализаторов, которыми я пользовался.

Прекрасный, динамичный 1 анализатор. Это первый мой vst, и с ним я проработал долгое время, пока не появилась потребность в более точном приборе. Дело в том, что минимальный шаг измерения PAZ Analyzer’а в низкочастотной области (кнопка «LF res.») равен 10Гц, и этого катастрофически нехватало. В поисках бесплатной альтернативы, я наткнулся на

Простой и точный анализатор от отечественного производителя. В нём достаточно настроек, чтобы отображать данные так же, как и PAZ Analyzer, но есть существенный (для меня, по крайней мере) недостаток, из-за которого, я перестал им пользоваться: при высоких значениях FFT 2 , интерфейс жутко тормозит, прямо слайд-шоу…

Этот анализатор я нашёл совершенно случайно, перейдя по чьей то рекомендательной ссылке. Он клёвый При относительно невысокой стоимости, имеет демо-версию без ограничения по времени пользования или функционалу (единственное ограничение заключается в том, что в демо-версии программа переключается в режим bypass на 5 секунд, через каждые 40 секунд работы). Плюс, красивый интерфейс с быстрым обновлением кривой, высокую точность и море функций, вплоть до возможности высчитывать разницу в АЧХ нескольких сигналов.

Выбор сделан, но оставался один момент, который меня беспокоил. Я привык к анализатору PAZ и его отображению АЧХ. SPAN и FreqAnalyst же, отображали кривую… как то не так. Анализатор от Waves «видел» большинство студийных миксов как горизонтальную прямую, но его «конкуренты» - почему то с подъёмом в низкочастотной области и завалом на высоких частотах, хотя на слух этого не воспринималось. Кому (чему) верить?

Разобрался я достаточно быстро, решив протестировать анализаторы шумом - сигналом, занимающим всю полосу частот. В поисках звуковых сэмплов шума, я наткнулся на , в которой упоминалось о цветах шума. Как же я сразу не догадался! PAZ имеет логарифмическую характеристику отображения АЧХ, что соответствует горизонтальной прямой при измерении розового шума. Анализаторы SPAN и FreqAnalyst по умолчанию «откалиброваны» белым шумом. Исправить это легко, благодаря регулятору Slope, изменяющему наклон кривой АЧХ:

Итак, с инструментами для анализа и их особенностями мы более-менее определились. Что дальше?

Работа со спектроанализатором

Каждый из вас наверняка сталкивался с анализаторами звука хотел он того или нет. На прилавках магазинов уже более десяти лет каждый более ли менее приличный музыкальный центр обладает таковым. В народе их обычно называют "цветомузыка", "эквалайзер" и тому подобное. На компьютере тоже многие плееры обладают анализаторами спектра и в некоторых случаях очень мощно визуализируют звук (плагины для Winamp). Но речь сейчас пойдет не о рядовых пользовательских, а именно о профессиональных программах для анализа сигнала (в нашем случае звука). Объясню почему я пишу "сигнала". Фактически, даные программы позволяют анализировать сигнал поступающий на вход звуковой платы, но есть умельцы которые подают не звуковые сигналы и получают нечто вроде осциллографа или мультиметра, но нам это опять же не надо. В свой обзор я включил 3 программы для анализа сигнала (звука): PAS Analysis Center v3.5, 4Pockets PocketRTA PC v1.0 и Pinguin Audio Meter v2.2.

PAS Analysis Center v3.5

Итак, начнем по порядку: запустив программу мы видим несколько окон (рис. 1). Вот их мы и будем рассматривать далее.

Рисунок 1. Окна в PAS Analysis Center v3.5

Первое из окон - Spectrum Analyzer , собственно анализатор спектра. На первой вкладке (FFT Length) производятся настройки для преобразования Фурье (собственно, сам процесс представления сигнала в спектральном виде). Blackman, Hamming, Parzen и пр. - это так называемые "окна", проще говоря это имена математиков, которые предложили каждый свою весовую функцию для представления спектра звука. Если хотите ощутить между ними разницу, то включите генератор (рис. 2) и сгенерируйте синусоиду (Sine).

Рисунок 2. Включаем генератор

Так как синусоида должна в идеале давать один пик в спектральной области, то можно переключать вышеупомянутые "окна" и посмотреть на результат.

Следующий параметр - FFT Length . Это количество отсчетов при Фурье-преобразовании. Чем это значение больше, тем точнее спектральная характеристика но медленней процесс. И наоборот.

Следующая вкладка - Scale . Здесь находятся настройки шкалы спектроанализатора. Все три характеристики регулируют растяжение/сжатие по осям.

Display . В этой вкладке находятся настройки вида спектроанализатора.

Log Amplitude и Log Frequency - логарифмическая либо линейная шкалы по соответствующим осям. Draw grid - прорисовка сетки. Draw inactive - подсветка спектральных полос. Draw amplitude scale и Draw frequency scale - отображать градуировку шкалы уровня и частоты соответственно. Draw peaks - прорисовка пиковых значений. Peaks hold - отображение последнего пикового значения.

Kind - тип визуализации спектра. Тут особо интересный режим Scroll, т.к. в этом режиме еще включается 3-е измерение - время.

Peaks - настройка отображения пиков. Numbers - толщина пиков. Peak delay - задержка пиков. Peak speed - скорость спада пиков.

Decay - настройка времени регенерации спектральных столбцов. Необходимо для коррекции скорости, т.е. чтоб они не прыгали с бешенной скоростью или наоборот не ворочались еле-еле.


Рисунок 3. Осциллограф

Следующее окно Oscilloscope (осциллограф) (рис. 3). Он показывает форму волны в случае звука, а в общем случае изменение напряжения (или тока в зависимости от подключения) анализируемого сигнала.

FFT Length - как я уже говорил, это настройка для преобразования Фурье.

Scale - здесь настройка подписей шкал. Effect - выбирается разделение по цвету для пиков (Peaks) или для верхней/нижней части (Splitt).

Display - настройка вида. Здесь стоит выделить Scroll - значительное сжатие по времени, удобно для наблюдения более общей картины.

Outfits - тип прорисовки волны.

Trigger mode - эта функция похожа на функцию синхронизации в осциллографах. И полезна она для анализа музыки вряд-ли будет. Up Flag и Down Flag - по какому фронту синхронизировать (заметно на пилообразных сигналах). Trigger level - уровень срабатывания.

И последнее окно - Spectrogram (рис. 4) это фактически перевернутый спектр, растянутый по времени. Амплитуда (уровень) здесь отображается цветом.


Рисунок 4. Спектрограф

FFT Length - см. ранее.

Scale - установки шкалы и усиления. Amp scale - усиление. Sensitive - чувствительность. Freq scale - степень растяжения оси частоты. Freq base - основная (нижняя) частота.

Display - настройки отображения спектрограммы. Accelerate - ускорение во времени. Embossed - смена фона спектрографа, особо эффектно бывает при других подстройках (Black-White в Outfit). Scroll display - прокручивать дисплей по прохождении или возвращаться назад.

Outfit - цветовые настройки спектрограммы.

На этом обзор окон закончен.

Теперь я хочу немного сказать об основных принципах работы этой программы, да и других подобных ей (анализаторов сигнала).

Существует 3 режима работы таких программ: 1. Вживую (анализ звука в реальном времени со входа звуковой платы). Здесь смотри рисунок 5

Рисунок 5. "Живой" режим

2. Проигрыватель файлов. Анализирует уже записанные файлы (см. рис. 6)

Рисунок 6. Режим плеера

3. Режим генератора. О нем я уже упоминал выше (см. рис.2). Полезен для подстроек и настроек.

4Pockets PocketRTA PC v1.0

Данный продукт интересен тем, что он сделан для двух платформ: PC и Pocket PC, т.е. как для настольных так и для карманных ПК. Я буду рассматривать версию для настольного ПК.

Итак, включив программу мы видим основное окно программы (рис. 7).


Рисунок 7. Основное окно 4Pockets PocketRTA PC v1.0

Сверху мы видим уровни входного сигнала. Чуть ниже расположена секция, показывающая уровень самой громкой частоты спектра в виде, собственно, числового значения в герцах, а также приблизительно ноту, соответствующую этой частоте. Еще ниже расположено окно анализатора. В самом низу идет секция настроек. Вот ее мы и рассмотрим поподробнее.

Scale - выбор точности и типа анализатора. Кроме всего есть осциллограф (Sample), спектрограф (Spectrograph) и такая необычная функция как уровень звукового давления (SPL). С помощью SPL определяют отношение сигнал/шум и некоторые характеристики "железа".

Average - функция для удобства наблюдения спектра (замедляет/убыстряет)

Mon - (Monitor channel) выбор типа анализируемых каналов (моно, стерео, левый, правый)

Trace - сохраняет на экране пиковые уровни. Удобно при настройках на octave.

Weight - как утверждают разработчики, на частотах ниже 500 Гц и выше 4 кГц слуховая чувствительность падает, это значит что вне этих частотных пределов человек слышит звуки тише. Для компенсации этого эффекта в профессиональной аппаратуре используют весовые кривые (weight curves). Здесь доступны 4 типа весовой кривой.

Decay - скорость спада спектральных столбцов.

Gain - регулировка усиления. Увеличение на 3 дБ все равно что умножение в 2 раза.

Pause - пауза (а кто сомневался).

Tone - генератор. Доступны 8 синусоидальных пресетов разной частоты и 2 шумовых пресета.

Еще я хочу обратить внимание на то что в режиме спектрального анализатора мы можем увидеть в секции ниже уровней частоту, ноту и уровень в точке куда мы кликнем мышкой. Иногда полезно.

Pinguin Audio Meter v2.2

Этот продукт не обладает такими гибкими настройками как его собратья. Но мне он понравился своей простотой и дизайном, ведь далеко не всегда и не всем нужно использовать массу всех сложных настроек.

Программа Pinguin Audio Meter имеет всего 4 окна (рис. 8)


Рисунок 8. Основное окно Pinguin Audio Meter v2.2

Удобство сей программы в том, что каждое окно можно развернуть и так наблюдать гораздо приятнее. При нажатии правой кнопки мыши выскакивает меню с настройками для каждого окна.

PPM Meter - индикатор уровня (рис. 9). Доступные настройки - горизонтальное/вертикальное расположение (horizontal), статическое отображение пиковых уровней (peak hold), отображение пиковых уровней с затуханием (peak decay), время спада уровней (decay time) и цветовые настройки (color).


Рисунок 9. PPM Meter - индикатор уровня в Pinguin Audio Meter

Stereo meter - индикатор фазовой корреляции и ширину стереобазы в X-Y координатах (рис. 10).


Рисунок 10. Stereo meter в Pinguin Audio Meter

Доступны следующие настройки:

Visible points - количество видимых точек, для регулировки четкости картины.

Thick points - жирные или мелкие точки.

Samples - время выборки. Регулируется для снижения нагрузки на процессор.

Spectrum analyzer - анализатор спектра (как несложно догадаться)(рис. 11).


Рисунок 11. Анализатор спектра в Pinguin Audio Meter

В меню настроек доступны те же, что и у индикатора уровня, но есть еще парочку своих.

Windowing - весовые функции преобразования Фурье (см. выше, про Spectra Lab). Доступны 7 функций. Создатели программы считают интересной функцию Уэлша (Welch).

Input mode - режим отображения анализируемых каналов. Здесь, в отличие от рассмотренных ранее программ, нельзя отображать сразу несколько каналов.

Correlation meter - коррелометр. Отображает разность (корреляцию) фаз между двумя каналами (рис. 12). Это своего рода проверка "качества стерео картины". У него всего лишь две настройки - включение (On) и вертикальный/горизонтальный режим (Horizontal).

Рисунок 12. Коррелометр в Pinguin Audio Meter

Вот и все для нашего "пингвиньего анализатора". Да, на панели инструментов есть еще пару настроек типа частоты семплирования (sample rate), выбор устройства (device) и приоритет программы (priority).

Что ж, в завершение я решил свести основные данные в таблицу, т.е. сравнить вышеперечисленные анализаторы.

Параметр PAS Analysis Center v3.5 4Pockets PocketRTA PC v1.0 Pinguin Audio Meter v2.2
анализатор спектра + + +
спектрограф + + -
осциллограф + + -
индикатор фазовой корреляции (X-Y) - - +
коррелометр - - +
настройки БПФ (FFT) + + -
генератор сигналов + + -
анализ файлов + + -
количество "окон" (типов отображения спектра) 7 4 7
внешний вид (5-бальная шкала) 3 2 4

Как видно из сводной таблицы Pinguin Audio Meter v2.2 по функциям слабоват, но обладает несколькими "фишками", которыми не могут похвастать его более мощные собратья - коррелометром и индикатором фазовой корреляции. Внешний вид - оценка лично моя, т.е. достаточно субъективная. Оценивал я по 5-ти бальной шкале. 5 не поставил никому, ведь, согласитесь, можно было и покруче в плане графики сделать (вспомнить те же плагины Winamp-а). Но все же по виду мне понравился "пингвин".

Обратите внимание:

Программы, описываемые в данной статье:


Как получить частотные спектры аудио файла

Получить спектр трэка или просто проверить качественные характеристики аудио файла можно с помощью различных программ. Попробуем рассмотреть наиболее доступные, интересные и удобные программы.

Sonic Visualiser

Бесплатная программа для визуализации и анализа аудио-музыкальным данных. Обладает очень развитыми функциями спектрального анализа.

Мультиплатформенная, поддерживает форматы: aiff, au, avr, caf, flac, htk, iff, mat, mp3, oga, ogg, paf, sd2, sds, sf, voc, w64, wav, wve, xi.

Настройки спектрограммы по-настоящему инженерные: можно выбирать глубину нахлёста окон, шкалы просмотра и способы отбора значений бинов, очень удобна навигация. Отдельно нужно отметить высокую скорость прорисовки и расчёта спектра.

К официальной информации, пожалуй нужно добавить: уверенно работает на win7 x64, не требует установки (выполнена в виде единого запускаемого файла), имеет полностью русскоязычный интерфейс и не оставляет програмных файлов в папках с проверяемым аудио материалом.

Программа для мастеринга, анализа и реставрации аудио материала.

Можно затащить файл мышкой в окно программы или открыть через окно импорта: File > Open

Ползунок масштабирования по шкале времени:

Ползунок масштабирования по шкале частот:

Adobe Audition

Аудиоредактор, предназначенный для редактирования, микширования и восстановления цифрового звука.

Затягиваем мышкой исследуемый файл на ярлык программы и видим:

Можно затащить файл мышкой в окно программы или открыть через окно импорта: Файл > Открыть...

Переходим к спектру. Кликаем по кнопке в верхней части программы:

Или открываем: Вид > Показать частотный спектр

Для детального рассмотрения спектра, кликаем правой кнопкой мыши по шкале частот и выбираем на вкладке строку Увеличение (Частота)

Теперь достаточно ухватиться левой кнопкой мыши за шкалу частот и перемещением вверх, вниз детально ее рассмотреть. В нижней правой части находится кнопка Увеличение (Время) - масштабирование по шкале времени.



2012-08-16T14:46

2012-0408-16T14:46

Audiophile"s Software

Copyright 2017, Taras Kovrijenko

Полное или частичное копирование текста допускается только с письменного разрешения автора .

Пролог

Хоть интернет полнится различного рода инструкциями по проверке честности lossless аудио, проверке на апконверт и т. п., я решил написать на этот счет свою инструкцию, подойдя к рассмотрению вопроса с должной основательностью и расстановкой.

Итак, перейдем непосредственно к делу.

Что будем мерить

Сперва хочу предупредить: невозможно, полагаясь лишь на программные средства (анализаторы и т.п.), с абсолютной уверенностью судить о превосходстве качества одной версии трека над другой. Имеются ввиду, например, различные раздачи на торренте, отличающиеся как источником, так и способом, которым они были закодированы. Ни одна программа не даст Вам полного понятия о звучании трека.

О чем же в данном случае можно судить? Во-первых - о частотном диапазоне анализируемого сигнала (это единственное, что можно определить точно), о его спектральном составе, ну и, как следствие (уже с той или иной вероятностью):

1. Если это lossless трек: был ли он получен из lossless источника, или же ранее был закодирован с использованием одного из lossy алгоритмов. Имеются ввиду алгоритмы, использующие психоакустическое сжатие. Сжатие с динамическим понижением разрядности (lossy WavPack, lossyWAV) скорей всего выявить не удастся, возможно, только на слух, по фоновым шумам.

2. Если это lossy: соответствует ли материал текущему своему виду, т.е., опять же, был ли источником кодирования lossless сигнал, или это апконверт . Апконвертом является любое преобразование с повышением битрейта. Например, перекодирование MP3 128 кбит/с в 320 кбит/с. Однако, осознанное перекодирование качественного AAC, OGG или MPC 200-256 кбит/с в MP3 320 кбит/с (для лучшей совместимости с устройствами воспроизведения) - случай довольно спорный, и при отсутствии других исходников даже не осуждается. Но, конечно же, при создании раздачи подобного материала, источник надо обязательно указывать.

Кроме того, для lossy (и в особенности, для LAME MP3) можно с той или иной степенью достоверности определить параметры кодирования. А определив например такой параметр, как частота срез НЧ фильтра, и сравнив его с актуальным частотным диапазоном записи, можно в некоторых случаях выявить тот самый апконверт.

Что будем использовать

Постепенно переходим к тяжелой артиллерии. Открываем папку с треком в программе EncSpot и в контекстном меню файла жмем Lame Header . Видим следующее:

Полное описание информации отображаемой EncSpot можно почитать в отдельной статье . Здесь мы видим, опять же, что использовался кодер LAME 3.99, был применен НЧ фильтр на частоте 20.5 кГц. Качество алгоритма кодирования использовалось максимальное (Quality кратно 10), источник имел частоту дискретизации 44.1 кГц. Возвращаясь к теме частоты семплирования - очень важно, чтобы частота источника (точнее, частота потока поступившего на вход кодера) и MP3 файла совпадала. Если это не так, то был использован встроенный в LAME ресемплер, а он качеством не отличается.

Отдельно хочу сказать о параметрах Join Stereo mode и Safe Joint - для музыки сочетание этих параметров наиболее предпочтительно (JS без режима Safe допустимо только при низких битрейтах).

Все фреймы конечно же имеют битрейт 320 кбит/с.

Здесь видно, что запись имеет широкую стереопанораму, различия между каналами довольно велики, а потому большинство фреймов закодированы в режиме Simple Stereo. Большинство блоков имеют тип Long, что говорит об относительно простой форме сигнала (малое количество транзиентов).

Тут стоит обратить внимание на резервуар бит - для MP3 CBR 320 он должен активно использоваться. Также хорошо, если стоят отметки Scalefac_scale и Scfsi .

А теперь можно перейти к более детальному анализу спектра. Жмем правой кнопкой на треке->Run Srviice->Open As... и открываем его через Adobe Audition 2:

Развернем окно на весь экран и уменьшим масштаб колесиком мышки:

Перед Вами просто таки характернейший для MP3 спектр: частотный диапазон составляет ~20 кГц, при этом спектральная плотность, начиная с 16 кГц резко падает. Это обусловлено особенностями психоакустической модели используемой в MP3 - она просто таки нещадно вырезает большинство слабых гармоник с частотой выше 16 кГц. Таким образом MP3 (даже с высоким битрейтом) очень легко узнать по спектру: если на записи есть фоновые шумы, выше 16 кГц они вырезаются, и на этом уровне образуется такая себе полка. Хотя, при достаточно высоком уровне ВЧ (обычно в электронной музыке), они могут в большинстве своём и сохранится.

Давайте рассмотрим спектры еще для нескольких кодеков-битрейтов.

LAME 3.99.5, VBR V2:

Здесь видно еще более жесткое обращение с ВЧ (хотя на слух это обычно неотличимо).

LAME 3.99.5, CBR 128 kbps (-q 0):

При 128 кбит/с частоты выше 16 кГц практически всегда отсутствуют, а НЧ фильтр установлен на 17000 Гц (ширина фильтра по умолчанию - 5%, так что спад начинается с 16.15 кГц). Вдобавок здесь спектр явно прорежен уже даже в районе 8 кГц, а то и ниже, в итоге спектрограмма начинает чем-то походить на решето.

Fraunhofer MP3 Encoder, CBR 320 kbps (highest, join stereo):

Как видите, битрейт 320, а по спектру скорее похож на VBR V2 (~200 кбит/с). Кстати, это тот случай, когда результаты для спектрограммы совпадают с результатами прослушивания - качество кодера FhG заметно хуже LAME (за исключением CBR 128 кбит/с - здесь результаты прослушивания весьма спорные).

Как я уже говорил, сравнивая значение Lowpass Filter из EncSpot с фактической шириной спектра материала, можно судить о «честности» данного рипа (не апконверт). Тут же приведу соответствие популярных пресетов и стандартных частот среза для последней версии LAME:

CBR 320 - 20500 Гц
CBR 256 - 19700 Гц
CBR 192 - 18600 Гц
CBR 160 - 17500 Гц
CBR 128 - 17000 Гц
VBR V0 - 22100 Гц
VBR V2 - 18500 Гц

Если ширина спектрального диапазона не соответствует данному значению, это может говорить об апконверте. Однако, здесь довольно много «но» - ширина зависит от версии кодера, настроек (есть настройка, меняющая значение предельной частоты), самого материала в конце концов.

И последний штрих - конечно же MP3 Packer. Эта программка покажет нам, насколько эффективно сжат MP3 файл (чисто математически). Кликаем по треку правой кнопкой, выбираем Run service->MP3 Info . Видим окно:

Тут нас прежде всего интересует пункт Minimum bitrate possible - он показывает нам, какого битрейта можно достичь при перепаковке фреймов данного CBR файла в VBR фреймы (без потерь качества). Сравнив это значение с актуальным битрейтом, можно судить об эффективности сжатия. Это расхождение обычно связано с нерациональным использованием резервуара бит старыми версиями LAME. Приемлемыми можно считать отклонения до 10 кбит/с включительно (310 кбит/с для актуальных 320 кбит/с), если расхождения больше - это косвенно может говорить о низком качестве кодирования. Также обратите внимание на значение Largest frame uses (kbps) - оно указывает пиковый битрейт для трека с учетом битов из резервуара. Большое значение (>400) говорит об эффективном использовании резервуара и сложности отдельных фрагментов трека.

Теперь, что касается современных кодеров (AAC, OGG Vorbis, Musepack). Они обладают более гибкими алгоритмами и не имеют такой статичной полки на 16 кГц, как MP3 (она у них динамически перемещается, в зависимости от целевого битрейта/качества), а на высоких битрейтах (>300 кбит/с) могут быть на глаз (не говоря уже о «на слух») неотличимы от lossless (если конечно не сравнивать непосредственно со спектром источника). Так что здесь ситуация посложнее, особенно если взять такой продвинутый формат как Musepack (MPC) - он работает по несколько другому принципу, чем MP3, AAC и Vorbis. Это сказывается как на спектральном отображении, так и на звучании. Например, тот же фрагмент, MPC q 6 (~210 кбит/с) :

Преимущество перед LAME MP3 VBR V2 - очевидное, и, к тому же, ощутимое на слух. Сохранены практически все составляющие до 18 кГц (этого диапазона обычно бывает достаточно даже людей с «идеальным» слухом), а пики достигают и 20. К тому же этот кодер практически не страдает от пре-эхо - главной проблемы психоакустического lossy кодирования.

А теперь взглянем на спектры AAC и OGG Vorbis.

QuickTime AAC True VBR 127 (~350 кбит/с) :

OGG Vorbis -q9 (~350 кбит/с) :

А теперь, для сравнения, спектр оригинала :

Как видите, оба кодека охраняют весь частотный диапазон, а QAAC даже практически не урезает спектр фоновых шумов. Согласитесь: довольно трудно догадаться, что спектр QAAC принадлежит lossy источнику. А если бы на записи еще не было фоновых шумов - это не смог сделать никто (даже специальная программа). Впрочем, и на слух этот метод кодирования остается (по крайней мере, для меня) лучшим.

Касаемо определения параметров кодирования AAC, OGG и MPC - здесь инструментарий довольно скромный. Практически всю доступную информацию можно найти на вкладке Properties в foobar2000.

Lossless

О спектрах мы уже говорили, с характерными особенностями спектра MP3 (и других кодеров) Вы уже знакомы, а потому, обнаружив их в спектре lossless трека, уже сможете сделать соответствующие выводы. Но, что касается спектра апконвертов - один очень важный момент. Большинство lossless кодеров не принимают на вход PCM с плавающей точкой, а если источником является lossy, в нем с большой вероятностью присутствуют фрагменты с уровнем выходящим за 0 dBFS. После преобразования в фиксированную точку, так как «умникам», клепающим lossless из MP3, лимитирование сделать мозгов не хватает, мы получаем срезы, а прямоугольные срезы содержат полный спектр частот. В итоге на спектрограмме полученного трека мы будем видеть вертикальные полосы, простирающиеся аж до 22.05 кГц (при чем сама запись обычно уложена в диапазон до 20 кГц). Вот пример такого безобразия:

Завидев это дело, можете смело расстреливать автора раздачи из реактивного гранатомета.

Ну а теперь можно смело перейти к автоматическому анализу.

Здесь всё просто: выделяете lossless треки, нажимаете третью с конца кнопку на панели моего foobar2000 и через несколько минут видите что-нибудь эдакое:

Я специально выделил кроме lossless (TAK) еще и закодированные ранее (для получения спектрограмм выше) lossy треки - чтобы показать, насколько хорошо программа обнаруживает lossy кодирование. «95% MPEG» можно интерпретировать как «скорее всего, имело место lossy кодирование». «CDDA 100%» - означает, что материал с очень большой вероятностью (конечно не 100 %, но 99 уж точно) не был подвергнут lossy кодированию. Обмануть эту программу удается только Musepack на высоком битрейте (и то редко) или lossyWAV.

Честно говоря, программа при анализе фактически руководствуется теми же критериями, что и мы при рассмотрении спектрограммы - поиск резкого спада плотности спектра, той самой «полки» - а потому, её выводы практически всегда совпадают с заключением человека с наметанным глазом, сделанным по спектрограмме.

Целостность

Также очень важно проверять треки на наличие ошибок. Для этого выделите их в foobar2000, нажмите на выделенном правую кнопку мыши и выберите из раскрывшегося списка Utils->Verify Integrity. При наличии ошибок в файлах формата MP3 foobar2000 может их исправить. Если Вы увидите ошибку вроде «Reported length is inaccurate...», выделите треки для которых отобразилась данная ошибка, нажмите правую кнопку и выберите Utils->Fix VBR MP3 Header, после обработки проверьте трек еще раз, ошибка должна отсутствовать. Если при проверке Вы наблюдаете ошибку вида «MPEG Stream error...», её можно исправить с помощью опции Utils->Rebuild MP3 Stream. После выполнения операции исправления ошибки не забывайте повторно проверять треки.

Для других lossy форматов, а также lossless исправить ошибки в foobar2000 нельзя, но проверить всё равно стоит.

Das Ende