Мастер-класс по цифровому звуку. Применение устройств обработки звука

Среди обывателей существует устойчивое мнение, что устройства обработки звука позволяют улучшить качество работы профессиональной системы звуковоспроизведения. Это правда… Однако, не стоит этот тезис экстраполировать на качество звука, который этой системой воспроизводится.

При применении любых устройств обработки звука, его качество, в принципе, может только ухудшаться. Дело в том, что они вовсе не решают проблему самого звука, а позволяют звукооператорам и звукорежиссерам нивелировать шероховатости исполнения вокалистов и музыкантов, устранить неточности в звучании музыкальных инструментов, скомпенсировать дефекты, вызванные неправильным выбором оборудования и мест его размещения, а также уменьшить влияние на воспроизведение акустических свойств помещений. Но если, например, вокалист хорошо владеет своим голосом и умеет пользоваться микрофоном, то компрессор ему ни к чему.

Изначально, процессы, связанные со специальным искажением воспроизводимого сигнала, использовались только в коммерческих звуковых системах, таких как системы телефонной, радио- или громкоговорящей связи. Сейчас они нашли широкое применение в музыке и используются для придания инструменту или голосу необычности либо ненатуральности звучания. Главным образом, это делается для того, чтобы удивить публику и усилить воздействие от прослушивания произведения.

С научной точки зрения, любое звукотехническое устройство – микрофон, усилитель мощности или акустические системы – это тоже устройства обработки звука. Во-первых, они не идеальны и изменяют амплитуду и фазу сигналов, во-вторых, эти изменения на разных частотах происходят по-разному, а в-третьих, нелинейные искажения в них приводят к появлению в них новых спектральных составляющих. Кстати, первым устройством обработки звука был динамик Leslie, который применялся вместе с электрическим органом Хаммонда в 30-40-е годы XX века и придавал ему «рычащее» звучание.

Параметры и классификация устройств обработки звука

Работа со звуком может осуществляться как в цифровом, так и в аналоговом виде, а то и вовсе без электроакустического преобразования. В связи с этим, необходимо определиться: а что подразумевается под устройством обработки звука?

Итак, мы будем рассматривать программно-аппаратные средства, работающие с электрическими сигналами звуковой частоты (как в аналоговой, так и в цифровой форме) в режиме реального времени. Прежде чем качественно оценить каждый из способов работы с ними, необходимо разобраться, как и с какой целью осуществляется обработка звуковых сигналов.

Все устройства обработки звука можно достаточно условно разделить на 3 группы:

  • устройства, не вносящие в сигнал дополнительных составляющих (аудиопроцессорные блоки);
  • устройства, вносящие в сигнал дополнительные составляющие (звуковые эффекты);
  • устройства, синтезирующие новые сигналы на основе характеристик исходного сигнала (вокодеры).

Аудиопроцессорные блоки

К ним относятся блоки задержки , эквалайзеры , кроссоверы и компрессоры .

Необходимость в блоках задержки появилась в 40-х годах XX века, когда в кино стал использоваться стереозвук. Как известно, человек воспринимает звук как совокупность сигналов, поступающих к каждому из ушей. Анализируя задержку поступающей к каждому уху звуковой волны, наш мозг с легкостью определяет местоположение источника звука.

С помощью блока задержки, используемого, например, в одном из каналов, можно имитировать изменение местоположения источника звука относительно слушателя. Разумеется, что при формировании пространственных эффектов, слушатель охотно вовлекается в звуковую картину. Вообще, задержка звука – естественное природное явление, связанное с тем, что скорость распространения звуковой волны относительно невысокая. Наверняка всем знаком эффект эха, возникающий при отражении волны от препятствия и преодоления ею обратного пути. Отличие эффекта, реализованного с помощью блока задержки, заключается в том, что «отраженный» сигнал ничем не отличается от исходного. В реальных условиях спектр сигнала при отражении существенно изменяется, так как различные его составляющие по-разному отражаются от препятствий.

Рис. 1. Пример распространения звука в помещении

В настоящее время блоки задержки широко используются в составе аудиопроцессоров. Они служат для выравнивания звукового поля в больших и сложных помещениях, в конференц-залах, а также для создания звуковых эффектов, таких как Echo, Delay, Reverberation и др. Время задержки может регулироваться – от единиц микросекунд до десятков секунд. Аналоговые линии задержки довольно сложны и сейчас не используются. Принцип действия цифровых блоков заключается в записи двоичного представления сигнала в память и последующем воспроизведении этой информации, но с задержкой, которая программно регулируется и устанавливается.

Эквалайзеры (от англ. equalize - выравнивать) появились достаточно давно, и их история развития неразрывно связана с развитием электрических фильтров. Они предназначены для выравнивания амплитудно-частотных характеристик электрических сигналов. Фильтрующие свойства электрических цепей к 30-м годам XX века уже широко использовались для компенсации потерь в каналах передачи сигналов. Первым, кто внедрил эквалайзер в звукоусилительную систему, был Джон Волкман. Прибор EQ-251A использовался в кино для коррекции звука и имел всего два ползунка и переключатель выбора частоты для каждого из них. Уже тогда применение эквалайзеров было необходимо, учитывая низкое качество звукозаписывающей и звуковоспроизводящей техники. После Второй мировой войны были разработаны многополосные эквалайзеры, использующие фильтры с высокой добротностью. В настоящее время эти устройства широко используются как в бытовых, так и профессиональных системах. Простейший, всем известный эквалайзер – регулятор тембра, который включает 2 фильтра: НЧ и ВЧ.



Рис 2. Регулировка амплитудно-частотных характеристик при использовании регулятора тембра

Принцип действия эквалайзера заключается в раздельной регулировке уровней составляющих сигнала на различных частотах. Звуковой сигнал имеет богатый спектр, который с помощью полосовых фильтров разделяется на составляющие. Это дает возможность выделить определенные частоты, составляющие основу звучания музыкального инструмента, либо убрать высокочастотные составляющие, такие как звук касания пальцем струны, сделать тембровую окраску мягче или, наоборот, жестче.



Рис. 3. Функциональная схема эквалайзера


Рис. 4. Регулировка амплитудно-частотной характеристики полосового фильтра

Необходимо помнить, что эквалайзер никогда не добавит в звучание то, чего нет в исходном сигнале, а значит, он не решит проблемы самого сигнала. Поэтому профессионалы предпочитают такие устройства не использовать или используют их с очень большой осторожностью. Небрежное обращение с эквалайзером приводит к неестественности звучания. Например, удаление из сигнала, снимаемого с гитары, низких частот, может улучшить качество записи при сведении его с другими партиями (низкие частоты хоть и не присущи гитаре, но присутствуют в спектре ее сигнала и могут маскировать другие инструменты, влияя на их звучание). Однако, даже незначительное приглушение высокочастотных составляющих (от 1 до 5 кГц) в том же сигнале, приведет к потере четкости и яркости игры, исчезнут детали. Визуально это выражается в сглаживании сигнала, а на слух воспринимается как тусклость и излишняя тонкость звучания. Непрофессиональный подход к эквализации вокальной партии может вызвать не только потерю выразительности и энергичности голоса, но даже изменение букв и окончаний.



Рис. 5. Сглаживание сигнала при применении эквалайзера с настройками в соответствии с рисунком 6


Рис. 6. Пример настройки графического эквалайзера



Рис. 7. Принцип действия параметрического эквалайзера

Различают графические и параметрические эквалайзеры. Графические отличаются большей наглядностью, пользователь с помощью многочисленных ползунков (регуляторов), каждый из которых соответствует фиксированной частоте полосового фильтра, определяет уровень усиления или ослабления сигнала в узкой полосе частот. Центральные частоты фильтров в графических эквалайзерах обычно устанавливаются по октавам. Для выбора центральных частот, кстати, имеется стандарт ISO. При достаточно большом количестве полос на панели управления эквалайзера вполне отчетливо вырисовывается график его амлитудно-частотной характеристики. Поэтому такие эквалайзеры и называются графическими. Их недостаток заключается в том, что пользователь не имеет возможности самостоятельно настраивать полосовые фильтры, т.е. устанавливать их центральные частоты и добротность.

Параметрический эквалайзер позволяет регулировать параметры полосовых фильтров: центральную частоту, добротность (полоса пропускания) и собственно усиление (ослабление). Они просто незаменимы, когда надо вырезать узкий участок спектра сигнала, на котором, например, из-за акустической обратной связи, система звуковоспроизведения начинает возбуждаться. Каждый из нас наверняка слышал характерный свист из акустических систем при поднесении к ним микрофона. Параметрические эквалайзеры сложнее в настройке и несколько дороже. Количество полос в них, как правило, намного меньше, чем в графических.

В настоящее время используются графические и параметрические эквалайзеры, причем как цифровые, так аналоговые и гибридные. Эти устройства могут выполняться как в виде отдельных блоков, так и быть встраиваемыми в микшеры, предварительные усилители, программное обеспечение для работы со звуком.

Например, компания Inter-M широко применяет графические эквалайзеры в трансляционном и профессиональном звуковом оборудовании (IMX-416, PP-9213, PP-9214, PAM-510, PCT-620 и многих других), а также производит эквалайзеры в виде отдельных блоков EQ-2215 (графический, 2 канала, 15 полос), EQ-2131 (графический, 1 канал, 31 полоса), EQ-2231 (графический, 2 канала, 31 полоса) и MEQ-2000 (цифровой смешанного типа, 31 полоса + 8 полосовых фильтров).


Рис. 8. Двухканальный эквалайзер EQ-2215 Inter-M


Рис. 9. Эквалайзер смешанного типа MEQ-2000 Inter-M

Кроссовер предназначен для разделения сигнала на несколько спектральных составляющих. Устройство применяется для построения систем звукоусиления, раздельного по полосам частот. При этом для воспроизведения каждого выделенного кроссовером частотного диапазона (”сверхнизкие частоты”, "низкие частоты", "средние частоты", "высокие частоты") применяется отдельный канал усиления. Для построения систем большой мощности, применение принципа раздельного усиления по частотам является практически единственным решением, обеспечивающим высокое качество звука. История кроссоверов неразрывно связана с историей развития акустических систем. Когда стало очевидно, что с помощью одного электродинамического излучателя невозможно воспроизвести весь спектр звукового сигнала, появилась необходимость в фильтрах, разделяющих энергию между НЧ, СЧ и ВЧ излучателями. Первым кроссовером можно считать обычный пассивный разделительный фильтр.

Различают активные и пассивные кроссоверы. Пассивные отличаются тем, что в них все параметры разделения фиксированы и не могут изменяться пользователем. Активные кроссоверы выполняются или в виде отдельных блоков, или являются частью аудиопроцессорного модуля.



Рис. 10. Кроссовер DIV-9123 Inter-M

В линейке профессионального оборудования Inter-M кроссоверы представлены 19” блоком DIV-9123, который может работать в режиме «стерео» (разделение на 2 полосы в каждом канале + бас) и в режиме «моно» (разделение на 3 полосы + бас). К основным параметрам, регулируемым с помощью активного кроссовера относятся:

  • частота разделения (частота среза фильтра) для каждой полосы;
  • крутизна среза фильтров.


Рис. 11. Разделение полос при использовании кроссовера

Частота разделения для подключения сабвуфера обычно устанавливается в диапазоне от 60 до 250 Гц, а для разделения на средние и высокие – в диапазоне от 80 до 8000 Гц. Крутизна среза характеристик фильтров в зависимости от качества кроссовера составляет от 6 до 72 дБ на октаву. Типовое значение составляет 18-24 дБ на октаву, что соответствует третьему-четвертому порядку чувствительности. Например, DIV-9123 имеет крутизну среза не менее 24 дБ на октаву. Нередко кроссоверы оснащаются дополнительным отключаемым фильтром высоких частот с частотой среза 30 Гц, который позволяет защитить акустические системы от воздействия ультранизких частот.

Компрессор предназначен для сжатия (англ. compress) динамического диапазона сигнала. Иными словами, он уменьшает разницу между самыми громкими и самыми тихими звуками. В недавнем прошлом функции компрессора выполнял звукооператор, предугадывая изменения громкости, например, вокалиста и регулируя, соответствующим образом, громкость воспроизведения. История компрессоров началась во время Второй мировой войны. Тогда, из-за резких скачков уровня громкости в передаваемом сигнале, часто выходили из строя радиостанции. С тех пор компрессор используется практически во всех радиостанциях, в том числе и в широковещательных. Кроме того, устройство нашло применение в звуковых системах. Работа компрессоров помогает повысить разборчивость речи при работе с микрофонами, увеличить цифровое разрешение, а значит, и отношения сигнал/шум, придать «плотность» звучания голосу и инструментам. Результат обработки звука компрессором едва различим на слух. Но при правильной работе с ним тусклый звук можно сделать более острым и насыщенным, голос сделать более жестким, придать ему нехарактерные для исполнителя черты, а дешевые музыкальные инструменты выставить в более выгодном свете. Однако, из-за недостатка квалификации, звук можно непоправимо испортить.

Разновидностей компрессоров, как и других блоков обработки звука, великое множество – цифровые и аналоговые, аппаратные и программные, ручные и автоматические, оптико-электронные, ламповые, транзисторные и т.д.

Любой компрессор имеет 5 основных параметров:

В большинстве современных компрессоров предусмотрены дополнительные режимы, настройки и функции:

Компрессоры также могут быть частотно-зависимыми или многополосными. Многополосный компрессор, по сути, объединяет в себе кроссовер и многоканальный компрессор. Обработка сигнала осуществляется отдельно для различных частотных составляющих, что бывает полезно при сведении музыкальной композиции. Частотно-зависимый компрессор подвергает сигнал обработке только в заданном узком диапазоне частот. Частным случаем частотно-зависимого компрессора является de-esser.

В настоящее время в чистом виде компрессор не используется, он дополняется множеством перечисленных функций, связанных с динамической обработкой сигнала. Например, CN-9102 Inter-M, кроме функций 2-х канального компрессора, выполняет функции лимитера (limiter) и шумоподавителя (noise gate).



Рис. 15. Компрессор CN-9102 Inter-M

Лимитер является частным случаем компрессора с установленной степенью компрессии ∞:1.

Шумоподавитель используется для создания комфортных пауз между сигналами. Он также закрывает вход при падении уровня сигнала ниже порогового значения, которое устанавливается вручную или автоматически исходя из отношения сигнал/шум.

При установке слишком высокого порога noise gate threshold сигнал может существенно потерять информативность, что выражается в уменьшении продолжительности, обрывистости звучания.

Среди других устройств динамической обработки звука можно выделить повышающий компрессор и экспандер. Повышающий компрессор, в отличие от рассмотренного выше, усиливает сигнал при падении его уровня ниже установленного порогового уровня. Экспандер – это устройство, расширяющее динамический диапазон сигнала, то есть противоположное компрессору. Экспандер позволяет улучшить макродинамику произведения, придать живости некоторым инструментам, а также в ряде случаев, исправить перекомпрессию сигнала.

Звуковые эффекты

Устройства, реализующие звуковые эффекты, искажают исходный сигнал, привнося в него что-то новое. Прежде чем рассматривать такие устройства, стоит отметить, что оригинальность звучания музыкальных инструментов, появившихся в XX веке, достигалась не только за счёт мастерства, интересных находок со стороны исполнителей, а в большей степени за счет технических ухищрений. Звуковые эффекты подарили нам множество новых направлений в музыке, современная музыка, театр и кино сегодня без них просто немыслимы. С их помощью можно привнести интригу, изменить характер звучания до неузнаваемости, имитировать объем, движение и многое другое…

Поскольку звуковой сигнал можно характеризовать амплитудой, частотой, начальной фазой и временем его возникновения, то и звуковые эффекты можно разделить на процессы, искажающие амплитуду, частоту, фазу, время или несколько этих характеристик одновременно. Амплитудные преобразования реализуют такие эффекты как, например, distortion , over drive , fuzz , амплитудное vibrato и tremolo , panning , ADSR и др. К эффектам задержки относятся reverberation , delay , echo , flanger , chorus . К эффектам, искажающим фазу, например, относится phaser . Частотные преобразования реализует одна из разновидностей эффекта vibrato , а также эффект pitch .

Эффект delay , как уже упоминалось, связан с задержкой сигнала и последующего сложения его с исходным звуковым сигналом. Сам по себе delay используется редко, так как звук при этом получается неестественным. В основном данный эффект характеризуется временем задержки и соотношением амплитуд исходного сигнала и его копии. Если установить время задержки более 60-100 мс, то человеческое ухо будет воспринимать задержанную копию сигнала как отдельный сигнал, то есть, как эхо. Звуки перестанут сливаться, и покажутся отражениями от удаленных преград.

Эффект Echo характеризуется не только увеличенным до 100 мс и более временем задержки, но и изменением спектра сигнала. Это связано с тем, что в природе различные частотные составляющие звукового сигнала, отражаясь от преград, имеют различную степень затухания. Как известно, лучше всего отражаются низкочастотные составляющие.


Рис. 16. Спектр звукового сигнала при реверберации


Рис. 17. Акустическая комната для имитации реверберационных свойств помещений

Reverberation (англ. – повторение, отражение) в настоящее время относится к наиболее популярным звуковым эффектам. Реверберация – природное явление, и, как многие другие природные явления, широко используется человеком в его деятельности. Суть эффекта заключается в том, что исходный звуковой сигнал смешивается со своими копиями, задержанными относительно него на различные интервалы времени. Отличие от Delay состоит в том, что, во-первых, при реверберации количество копий сигнала значительно больше; во-вторых, с увеличением времени задержки сигнала, его амплитуда уменьшается; в-третьих, относительное время задержки нельзя установить большим.

Эффект Reverberation позволяет имитировать геометрию помещения, покрытие его стен, пола и потолка. С его помощью можно обеспечить иллюзию, превратив маленькую, заглушенную на сто процентов, комнату звукозаписи в огромный кафедральный собор или туннель. У слушателя возникает ощущение объемного гулкого помещения. Тембр музыкальных инструментов обогащается, голос приобретает напевность, а некоторые его недостатки удачно маскируются.

Для сравнения реверберационных свойств помещений было введен термин – время реверберации. Данное понятие можно сформулировать так: это время, за которое уровень воспроизводимого импульсного сигнала уменьшается на 60 дБ.

История устройств, реализующих эффект reverberation, началась с появлением эхо-камер. Позже использовались стальные листы, колебания в которых вызывались электромагнитным приводом. Реверберация получалась не трехмерная, а плоская, а сам сигнал имел характерный металлический призвук. В середине 60-х годов для получения эффекта реверберации стали применять пружинные ревербераторы (преимущественно в гитарных усилителях). С помощью электромагнитного преобразователя, соединенного с одним из концов пружины, возбуждались механические колебания, которые с задержкой достигали другого конца пружины, связанного с датчиком. Эффект повторения звука был обусловлен многократным отражением волн механических колебаний от концов пружины. Качество звука в пружинном ревербераторе было чрезвычайно низким. Пружина воспринимала любые колебания воздуха и пола. Кроме того, звук имел ярко выраженную "металлическую" окраску, а время реверберации не регулировалось. Позже на смену пружинным пришли магнитофонные ревербераторы. Механизм формирования эхо-сигнала в них был довольно прост: исходный сигнал записывался на ленту записывающей магнитной головкой, а затем считывался воспроизводящей магнитной головкой (через время, необходимое для перемещения ленты) и через цепь обратной связи вновь подавался на запись. В цепи обратной связи сигнал уменьшался по амплитуде, что обеспечивало постепенное затухание звука при реверберации. Недостаток магнитофонного ревербератора заключался в том, что при существовавших скоростях протяжки ленты удавалось получить только эффект эха. Для получения собственно реверберации требовалось либо еще сильнее сблизить магнитные головки (чего не позволяла сделать их конструкция), либо значительно увеличить скорость движения ленты.

С развитием цифровой техники и появлением интегральных микросхем появилась возможность реализовать высококачественные цифровые ревербераторы. В таких устройствах время задержки практически не ограничено, что позволяет на их основе реализовывать все эффекты, связанные с задержкой сигнала. В любом современном цифровом ревербераторе можно выбрать несколько программ, имитирующих как реальные, так и фантастические условия воспроизведения. Они реализуют различные математические модели, имеют различные настройки и параметры. Поэтому, чаще всего, производители создают ряд предустановок, позволяющих воссоздать объемные характеристики неких стандартных помещений. Это помогает звукооператорам быстро освоить новое устройство или программу.

Эффект Flanger можно услышать, например, на остановке общественного транспорта, слушая звук проезжающего мимо автомобиля. Всем известен эффект повышения тона гудка приближающегося поезда, который нам объясняли на уроках физики в школе (эффект Доплера). Естественно, это свойство можно использовать и в музыке. Механизм его реализации был совершенно случайно открыт в 1958 году звукорежиссером Филом Спектором. Он пытался «удвоить» голос, воспроизводя его на двух магнитофонах одновременно, и задел обод катушки с лентой. В результате получился эффект временной модуляции, который Фил назвал flanger (англ. – обод катушки).

Как уже говорилось, эффект delay имитирует неодновременное восприятие человеком звуковых сигналов. В реальности это вызвано различными путями распространения звука от источника к приемнику. При условии неподвижности относительно друг друга источника и приемника звука, а также предметов, от которых он отражается, частота колебания не изменяется, каким бы путем она не достигала наших ушей. Но в реальной жизни это условие редко выполнимо. Если какой-либо из трех элементов подвижен, то частота принимаемого звука не может оставаться той же, что и частота звука переданного. Это и есть проявление эффекта Доплера. Итак, реальные звуки при распространении претерпевают не только расщепление на несколько звуковых волн и различную для каждой из них задержку, но и неодинаковое изменение частот для разных спектральных составляющих. Flanger имитирует проявление взаимного перемещения трех упомянутых элементов: источника, приемника и отражателя звука. По сути, эффект представляет собой echo c изменяемым по определенному закону временем задержки. Поскольку время задержки при использовании flanger составляет 1 – 25 мс, то мы не воспринимаем исходный и задержанный сигнал раздельно.


Рис. 18. Функциональная схема блока реализующего эффект Flanger

В прошлом, чтобы получить эффект Flanger, вместо одной инженеры использовали несколько акустических систем, размещенных на различных расстояниях от слушателей. В определенные моменты производили поочередное подключение источника сигнала к акустическим системам таким образом, что создавалась иллюзия приближения или удаления источника звука.

Эффект Chorus (англ. – хор) превращает звучание одного инструмента или голоса в целый хор. Хоровое пение и одновременное звучание нескольких музыкальных инструментов украшает музыкальное произведение. В электронной музыке создание одинаковых сигналов не представляет сложности. Но, если их сложить вместе, то звучание будет слишком правильным, но безжизненным и тусклым. Дело в том, что хотя исполнители, при работе в оркестре, и стараются играть одинаково, но из-за индивидуальных особенностей источников, звук все равно получается разным. В пространстве, тракте звукоусиления и в слуховом аппарате человека, эти немного неодинаковые колебания взаимодействуют, образуя, так называемые, биения. За счет биений спектр звука обогащается. Считается, что предельным случаем chorus является унисон – одновременное звучание, слегка отличающихся по частоте, двух источников. Именно унисон лежит в основе звучания двенадцатиструнной гитары и аккордеона. В аккордеоне, например, звук каждой ноты генерируется узлом, которые содержат два язычка, специально настроенных с небольшой (в единицы герц) разницей в частотах. В двенадцатиструнной гитаре звук извлекается одновременно из пары струн, настроенных в октаву. Разница в частотах образуется естественным путем, из-за невозможности идеально одинаково настроить струны инструмента. Ничтожная разница в частотах голосов певцов или инструментов и служит причиной красивого звучания.

По сути, все алгоритмы реализации эффекта chorus сводятся к тому, что копии сигнала с небольшой задержкой складывается с исходным сигналом. Но, в отличие от механизма реализации эффекта echo, спектр каждой копии сигнала незначительно сдвигается по частоте, т.е. подвергается частотной модуляции. Частотные сдвиги и время задержки для каждой из копий сигнала могут изменяться во времени, что обеспечивает непрерывное изменение спектра. При этом период полного цикла этих изменений обычно настолько велик, что повторяемость свойств сигнала не ощущается. В настоящее время Chorus стал одним из эффектов, имеющихся практически в каждом синтезаторе и многих звуковых картах. Он имеет множество разновидностей. Необходимо отметить, что чрезмерное употребление данного эффекта может привести к ухудшению разборчивости звучания голоса и к "засорению" музыкального произведения.


Рис. 19. Принцип действия эффекта ADSR

К амплитудным преобразованиям, в принципе, относится такой процесс как усиление, при котором амплитуда сигнала увеличивается или уменьшается пропорционально некоторой постоянной величине. Если задаться целью, изменить коэффициент усиления или ослабления сигнала по определенному закону, то мы в итоге получим такие звуковые эффекты как, например, ADSR (A ttack, D ecay, S ustain, R elease). Данный эффект широко используется в синтезаторах и позволяет с помощью 4-х параметров описать функцию, по которой изменяется амплитуда воспроизводимого сигнала.

Это обеспечивает схожесть электронного музыкального инструмента с реальным, например, такого как синтезатор. Если орган звучит ровно, пока нажата клавиша, то звук, издаваемый гитарой, имеет максимальную громкость только в момент удара по струне, после чего он плавно затухает. Необходимо отметить, что ADSR является самым примитивным способом описания огибающей сигнала – современные синтезаторы гораздо сложнее. Эффект может применяться не только в отношении каждой ноты, но и в отношении некоторых участков музыкального произведения. В этом случае его принято называть Envelope . С помощью такого преобразования, сигнал, записанный с равномерной громкостью (интенсивностью) на всей его протяженности, можно сделать медленно нарастающим вначале и медленно спадающим в конце. В стереосистемах, изменением уровня громкости составляющих одного и того же сигнала в разных каналах, можно добиться эффекта перемещения источника звука по стереопанораме. Это реализуется с помощью таких эффектов, как Panning / Ping-pong .


Рис. 20. Амплитудная модуляция лежит в основе эффекта амплитудного Vibrato

Сущность амплитудного vibrato состоит в периодическом изменении уровня громкости звукового сигнала. Частота, с которой происходит изменение амплитуды, выбирается в диапазоне от долей герца до 10 Гц. При выходе за эти рамки необходимый эстетический эффект не достигается. По сравнению с тембром исходного сигнала, тембр сигнала с амплитудным вибрато богаче, и его широко используют, например, при пении. Степень проявления эффекта характеризуется глубиной вибрато: n = Sv/Si, где Sv – максимальное изменение амплитуды сигнала с вибрато, Si – амплитуда исходного сигнала. Глубина вибрато может устанавливаться от 0 до 1.

Особой разновидностью амплитудного вибрато является tremolo , отличительной чертой которого являются относительно высокая частота вибрации (10–12 Гц), глубина вибрато n = 1 и импульсная форма результирующего сигнала. Тремоло, например, является основным приемом игры на мандолине. Амплитудное vibrato и его частный случай tremolo используют достаточно редко, особенно для обработки вокала.

Такие эффекты, как Over drive , Distortion и Fuzz реализуются за счет нелинейных искажений, возникающих при перегрузке усилителя. Их история началась в середине прошлого века, когда тембру электрогитары стали уделять большее внимание. В конце пятидесятых годов, например, широко применяли пружинные ревербераторы, встроенные в комбо-усилители. Для большой громкости гитарные усилители нередко перегружались как по входу, так и по выходу.

При перегрузке по входу, то есть при подаче на вход усилителя сигнала слишком большого уровня, синусоидальная волна обрезается, и результирующей формой волны становится уже не синусоида, а квазитрапеция, имеющая иной характер звучания. Аккорды при этом звучат очень грязно, с хрипом и ревом, так как образующиеся в результате интермодуляции комбинационные частоты затрудняют интонационную разборчивость нот, составляющих аккорд. Отдельные мелодические ноты мало напоминают тембр гитары – но, удивительное дело, этот звук понравился и музыкантам, и публике.



Рис. 21. Нелинейные искажения при перегрузке усилителя по входу

Over Drive, Distortion и Fuzz реализуются с помощью лимитеров и отличаются только степенью вносимого искажения. Например, Over drive (англ. – перегрузка) используется для искажения только самых громких звуков. Когда гитарист начинает играть громче, сигнал попадает в область действия лимитера и верхушка сигнала обрезается. В результате, инструмент приобретает очень интересный характер, такой эффект украшает его звучание, как легкая хрипота украшает голос вокалиста. Distortion (англ. – искажение) и Fuzz искажают сигнал в значительно большей степени, приближая его форму к прямоугольной. Звук зачастую получается слишком грязный, поэтому используются дополнительные фильтры (эквалайзер) для сглаживания «острых углов» в звучании.

Эффект Phaser , как это следует из названия, реализуется за счет изменения мгновенного значения фазы сигнала. В принципе, этот эффект очень похож на Flanger и достигается таким же способом. Иногда его даже относят к группе звуковых эффектов задержки сигнала. Отличие заключается в том, что при времени задержки, сопоставимом с периодом колебания, что характерно для Phaser, принято говорить собственно не о временной задержке, а о фазовых сдвигах. И Flanger и Phaser имитируют проявления перемещения источника, приемника или отражателя звука. Чтобы понять их различия можно представить последствия применения этих эффектов. Образно говоря, если бы певец летел к слушателю в зале со скоростью поезда, то получился бы Flanger, а если бы слушатель часто-часто вертел головой из стороны в сторону, то получился бы Phaser. По своей сути Phaser – это эффект с применением фазового вибрато.

Кроме амплитудного и фазового существует частотное и тембровое vibrato. Суть частотного vibrato заключается в периодическом изменении частоты звукового колебания. Этот эффект использовался в музыке задолго до появления электронных музыкальных инструментов и реализовывался, кстати, более простыми способами. Например, скрипка в умелых руках потому и звучит так прекрасно, что едва заметными движениями пальцев вдоль грифа скрипач создает частотное вибрато. На электрогитаре этот эффект реализуется с помощью специального механизма: подвижной подставки для крепления струн и рычага. Реализация частотного вибрато в электронных инструментах и синтезаторах достаточно проста. В радиотехнике этот процесс называется частотной модуляцией. Если изменение частоты производится по периодическому закону, то в результате получается частотное вибрато. При этом спектр сигнала расширяется, тембр перестает быть постоянным и периодически изменяется во времени. Необходимо отметить, что эффект имеет эстетическую ценность только в том случае, если глубина частотного вибрато (относительное изменение частоты звука) невелика. В противном случае создается впечатление, что инструмент расстроен. Частотное вибрато используется само по себе, а также является составной частью в более сложных звуковых эффектах.


Рис. 22. Частотная модуляция лежит в основе эффекта частотного Vibrato

Сущность эффекта тембрового vibrato состоит в том, что исходный сигнал пропускается через полосовой фильтр, у которого периодически изменяется либо центральная частота, либо полоса пропускания, либо оба параметра вместе. При этом фильтр выделяет из всего спектра исходного сигнала только те частотные составляющие, которые попадают в "мгновенную" полосу его пропускания. Так как полоса пропускания "дышит" по ширине и "гуляет" по частоте, то тембр сигнала периодически изменяется. Тембровое вибрато может быть не только автоматическим, но и ручным. Вариант ручного тембрового вибрато известен под названием Wah-Wah. Тембровое вибрато звучит необычайно красиво, но для этого необходимо синхронизировать период изменения настроек полосового фильтра со скоростью игры.

Преобразования, связанные с перемещением спектра сигнала вверх или вниз по частоте, реализует такой эффект, как Pitch. При этом к исходному сигналу добавляется его копия, сдвинутая по частоте на определенное значение, обычно в пределах двух октав. Частным случаем Pitch является Octaver. При его использовании копия сигнала имеет частоту в два раза большую или меньшую частоты исходного сигнала. Иначе говоря, исходный сигнал и его копия составляют музыкальный интервал, именуемый октавой.

Звуковые эффекты в настоящее время реализуются как с помощью ПК, так и в виде отдельных программно-аппаратных комплексов. Они в огромном количестве присутствуют в каждом приложении для обработки звука, для сведения музыкальных композиций, таких как Cubase, Sound Forge, Vegas, Ableton и др. Из-за сложности алгоритмов реализации некоторые эффекты вызывают задержку сигнала, что затрудняет их использование в режиме реального времени. Процессорами звуковых эффектов оснащаются музыкальные центры, инструментальные усилители (особенно гитарные) и др. Среди производителей кроме именитых вендоров Ibanez, Marshall, Fender, Pioneer ежегодно появляется множество новых компаний. Каждый производитель реализует эффекты по своему, что несколько затрудняет их использование. С другой стороны любой специалист может подобрать устройство на свой вкус.

Вокодеры

Вокодер (англ. voice coder речевой кодер) был разработан для экономии частотных ресурсов в цифровой радиосвязи. При его использовании в канале связи транслируется не сам сигнал, а способ его синтеза. В результате удается очень существенно сжимать поток данных. Принцип его работы схож собственно с физическим принципом формирования речевого сигнала. Первым таким устройством был параметрический вокодер Дадли. При кодировании на каждом интервале времени (фрейм 20-30 мс) анализируется характеристика речи - "звонкая-глухая". В случае звонкой речи, определяется частота основного тона, а также параметры фильтра, образуемого голосовыми связками и ротовой полостью. Эти параметры вместе с общей оценкой громкости передаются в канале связи. Декодер по полученным параметрам восстанавливает речь – фильтры при воспроизведении гласных возбуждаются импульсами соответствующей величины, следующими с интервалами основного тона, а при воспроизведении глухих звуков – шумом. В результате спектр полученного звука похож на спектр исходной речи. Подобное кодирование обеспечивает высокую разборчивость речи и низкую скорость потока данных (до 2,4 кбит/с).

Естественно, о качестве вокодерной речи строго судить не следует. Резкие изменения спектральных параметров на границах интервалов, грубые переходы между глухими и звонкими звуками, неточная передача основного тона, а также неспособность воспроизводить частично приглушенные звуки и другие "свойства" значительно снизили возможности узнавания голоса и придавали речи неестественный характер. Чтобы повысить качество, низкочастотную часть спектра решили передавать обычным путем, без параметрического кодирования. Такие устройства назвали полувокодерами. Благодаря неискаженной передаче основного тона, достигалось более естественное звучание и качество речи.

Вокодер как многие другие способы обработки звука был заимствован из телефонии музыкантами и впоследствии стал полноценным устройством. Благодаря фирмам-изготовителям музыкального оборудования, ему придали форму и удобство музыкального эффекта. Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя – сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» инструмента. Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком. Здесь так же нет ограничений и для несущего сигнала. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты – говорящая гитара, барабаны со звуком пианино, гитара звучащая как ксилофон и т.д.

Заключение

Научиться правильно использовать блоки обработки звука довольно сложно. Многие согласятся с тем, что, например, для художественной обработки звука, нужен, прежде всего, талант. Звукооператор и звукорежиссер – это профессия, а значит, работа со звуком – дело настоящих профессионалов. Поэтому мы не ставили перед собой цели – научить кого бы то ни было пользоваться перечисленными устройствами. Обработка звука – это творчество. Каждый мастер самостоятельно, основываясь на собственном опыте, решает поставленные задачи. Свой опыт всегда лучше. Поэтому, вместо того, чтобы давать советы по использованию оборудования, мы, прежде всего, решили познакомить читателя с физикой процессов, которые они реализуют, найти их природные естественные аналоги, перечислить их возможности. Это поможет начинающим звукооператорам заранее представлять – как изменится звук, если они повернут какую-либо ручку на устройстве обработки звука.


ВНИМАНИЕ! Данная статья подготовлена специалистами Группы компании «АРСТЕЛ» и является интеллектуальной собственностью «АРСТЕЛ». Любые публикации данной статьи, а равно ссылки на нее возможны только с разрешения правообладателя.

1

Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи. В модуляционной теории сигнал описывается как сложномодулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала. Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию. Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.

модуляционный анализ-синтез

мгновенная частота

шумопонижение

1. Аблазов В.И., Гупал В.И., Згурский А.И. Преобразование, запись и воспроизведение речевых сигналов. – Киев: Лыбидь, 1991. – 207 с.

2. Агеев Д.В. Активная полоса частотного спектра функции времени // Труды ГПИ. – 1955. – Т. 11. – № 1.

3. Гиппернрейтер Ю.Б. Восприятие высоты звука: Автореф. дис. канд. психол.наук. – М.: 1960. – 22 с.

4. Ишуткин Ю.М. Разработка теории модуляционного анализа-синтеза звуковых сигналов и её практическое применение в технике записи звука кинофильмов: Автореф. дис.на соискание уч. ст. д. т. н. – М.: НИКФИ, 1985. – 48 с.

5. Ишуткин Ю.М., Уваров В.К. Основы модуляционных преобразований звуковых сигналов / Под ред. Уварова В.К. – СПб.: СПбГУКиТ, 2004. – 102 с.

6. Ишуткин В.М. Перспективы обработки звуковых сигналов по их модулирующим функциям / В сб.: Проблемы звукотехники // Труды ЛИКИ, Вып. XXXI. – Л.: ЛИКИ, 1977. – С. 102–115.

7. Корсунский С.Г. Влияние спектра воспринимаемого звука на его высоту // Пробл.физиол.акуст. – 1950. – Т. 2. – С. 161–165.

8. Маркел Дж.Д., Грэй А.Х. Линейное предсказание речи: Пер. с англ. / Под ред. Ю.Н. Прохорова, В.С. 3вездина. – М.: Связь, 1980. – 308 с.

9. Маркин Д.Н., Уваров В.К. Результаты практических исследований соотношений между спектрами сигнала, его огибающей, косинуса фазы и мгновенной частоты. Деп. рук. № 181кт-Д07, ОНТИ НИКФИ, 2007. – 32 с.

10. Маркин Д.Н. Разработка метода и технических средств компандирования спектров речевых сигналов. Автореф. дис. на соискание уч. ст. к.т. н. – СПб.: СПбГУКиТ, 2008. – 40 с.

11. Муравьев В.Е. О современном состоянии и проблемах вокодерной техники // Современные речевые технологии сборник трудов IX сессии Российского акустического общества, посвящённой 90-летито М.А. Сапожкова. – М.: ГЕОС,1999. – 166 с.

12. Орлов Ю.М. Динамический фильтр-шумоподавитель // ТКиТ. – 1974. – № 10. – С. 13–15.

13. Сапожков М.А. Речевой сигнал в кибернетике и связи. Преобразование речи применительно к задачам техники связи и кибернетики. – М.: Связьиздат, 1963. – 452 с.

14. Уваров В.К., Плющёв В.М., Чесноков М.А. Применение модуляционных преобразований звуковых сигналов / Под ред. В.К. Уварова. – СПб.: СПбГУКиТ, 2004. – 131 с.

15. Уваров В.К. Сжатие частотного диапазона звуковых сигналов для улучшения качества звука при кинопоказе: Автореф.дис. канд.тех. наук. – Л.: ЛИКИ,1985. – 22 с.

16. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: Пер. с нем. – М.: Связь, 1971. – 255 с.

17. Gаbor D. Theory of communications. – The Journal of the institute of Electrical Engineers, Part III (Radio and Communication Engineering), Vol. 93, № 26, November 1946. – Р. 429–457.

18. Ville J.A. Theorie et application de la notion de signal analytique. – Cables a Transmissions, 2A, № 1, January, 1948. – Р. 61–74; translated from the French in I. Selin, «Theory and applications of the notion of complex signal». – Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA, August 1958.

Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи.

Проведенный обзор методов обработки звуковых сигналов выявил перспективность модуляционного анализа-синтеза, разработанного Ю.М. Ишуткиным в 70-х годах прошлого столетия для обработки и измерения искажений . В дальнейшем модуляционная теория получила свое развитие в работах его учеников и последователей .

Модулирующие функции колебания сложной формы

В середине ХХ века независимо двумя учеными Д. Габором и Дж. Вие была создана теория аналитического сигнала, дающая возможность описывать в виде явной функции времени любой случайный процесс. Именно эта теория стала математической основой, на базе которой впоследствии была сформирована модуляционная теория звуковых сигналов.

При некоторых нежестких ограничениях любые колебания сложной формы могут быть представлены в виде произведения двух явных функций времени

где s(t) - исходный звуковой сигнал,

S(t) - неотрицательная огибающая сигнала, амплитудно-модулирующая функция;

cos φ(t) - косинус фазы сигнала, частотно-модулированная функция;

φ(t) - текущая фаза сигнала, фазо-модулирующая функция сигнала.

Мгновенная частота сигнала, частотно-модулирующая функция сигнала.

Модулирующие функции S(t), φ(t) и ω(t) сигналов являются действительными функциями действительного аргумента t. В общих случаях модулирующие функции нельзя определить, исходя из самого исходного сигнала s(t): его необходимо дополнить вторым сигналом, называемым опорным s1(t) и уже для пары этих сигналов {, } можно определить модулирующие функции. Вид этих функций в равной степени зависит от обоих сигналов.

Дж. Габор впервые в 1946 году показал необходимость опорного сигнала при определении модулирующих функций и применил для этого прямое преобразование Гильберта к исходному сигналу s(t) . В теоретической радиотехнике это привело к понятию аналитического сигнала. Однако теория аналитического сигнала была разработана для узкополосных колебаний.

Модулирующие функции широкополосного сигнала

Впоследствии строгие математические представления о модулирующих функциях были распространены и на широкополосные звуковые сигналы. Однако выбор опорного сигнала предполагается произвольным, и выдвигаются лишь требования к ортогональности основного и опорного сигналов . Тем не менее на сегодняшний момент именно преобразование Гильберта рассматривается как удобный в техническом отношении способ построения пары ортогональных сигналов.

Так как в общем случае звуковые сигналы являются непериодическими и их можно считать квазипериодическими лишь на отдельных достаточно коротких интервалах времени, в модуляционной теории для определения опорного сигнала используется прямое преобразование Гильберта с ядром Коши

, (2)

где Н - оператор преобразования Гильберта, интеграл (2) является сингулярным, т.е. не существует в обычном смысле в точке t = τ, его следует понимать как интеграл Лебега, а его значение в точке t = τ как главное значение по Коши.

Две функции, связанные между собой преобразованием (2), называются сопряженными по Гильберту. Из теории преобразования Гильберта известно, что эти функции удовлетворяют условию ортогональности, то есть их скалярное произведение равно нулю на всей области определения

. (3)

Выражение (3) представляет собой определенный интеграл, понимаемый в смысле Лебега. Т - означает область значений переменной t, по которой ведется интегрирование.

В геометрическом представлении амплитудно-модулирующая функция S(t) это сигнальный вектор, вращающийся вокруг начала координат с угловой частотой ω(t), при этом сигнал может развиваться быстро или медленно, но только в прямом, а не в обратном направлении. Это означает, что обе модулирующие функции могут принимать любые положительные и отрицательные значения (причем ничем не ограниченные) и каждая имеет в общем случае постоянную и переменную составляющие:

где S0 - постоянная составляющая (среднее значение) огибающей сигнала;

SS(t) - огибающая переменной составляющей огибающей сигнала;

cos ωS(t) - косинус фазы переменной составляющей огибающей сигнала;

ω0 - среднее значение мгновенной частоты сигнала (несущая частота);

ωd(t) - девиация мгновенной частоты сигнала;

ωm(t) - модулирующая частота сигнала.

Многоступенное модуляционное преобразование

Из изложенного выше следует, что процесс разложения сигнала по его модулирующим функциям можно продолжить - провести многоступенное модуляционное разложение .

Первая ступень разложения дает пару модулирующих функций первого порядка (см. формулу 4)

Вторая ступень разложения дает дополнительно две пары модулирующих функций второго порядка. При этом огибающая первого порядка S1(t) дает огибающую огибающей и мгновенную частоту огибающей: S21(t) и ω21(t).

Вторая ступень разложения мгновенной частоты первого порядка ω1(t) дает огибающую мгновенной частоты и частоту мгновенной частоты: S22(t) и ω22(t).

После третьего разложения получаются еще четыре пары модулирующих функций третьего порядка и т.д.

Перечисленные после формулы (4) параметры модулирующих функций различных порядков являются важными информационными признаками звукового сигнала, воздействие на значения и частотное расположение которых открывает широкие возможности для обработки звукового сигнала: сжатие спектра, изменение тембра, преобразование динамического диапазона и шумопонижение, транспонирование сигналов и т.д.

Технические задачи обработки звуковых сигналов путем воздействия на их модулирующие функции состоят в следующем:

● создать многоступенный демодулятор (преобразователь), при подаче на вход которого напряжения u(t) = s(t) на выходах обеспечивались бы напряжения, пропорциональные модуляционным функциям первого, второго и т.д. порядков;

● воздействовать на значения и спектры этих напряжений;

● восстановить звуковой сигнал по обработанным модуляционным функциям, т.е. осуществить амплитудную и частотную модуляцию колебаний генераторов.

Например, использование нелинейного корректирующего воздействия на параметры амплитудно-модулирующей функции позволит провести компрессирование и шумопонижение восстановленного звукового сигнала . Воздействием на сигнал канала частотно-модулирующей функции с помощью нелинейной цепи, обладающей уменьшением дифференциального коэффициента передачи с увеличением мгновенных значений выходного напряжения, можно достичь сжатия частотного диапазона обрабатываемого звукового сигнала . Делением частоты ωm(t) и устранением высокочастотной части ее спектра можно существенно сжать спектр звукового сигнала с сохранением высокой помехоустойчивости .

Перспективы применения деления-умножения мгновенной частоты сигнала без выделения модулирующих функций в целях шумопонижения

Постановка задачи

При передаче звуковых сигналов по узкополосным каналам связи частотное компрессирование приводит к заметному ограничению ширины спектра мгновенной частоты. Исследуем возможность подмены в спектре фонем таких сигналов компонент, обусловленных высокими частотами частотной модуляции, на другие компоненты - расположенные на близких частотах, но обусловленные увеличением девиации мгновенной частоты фонемы при восстановлении частотно-компрессированных сигналов. Такая замена должна обеспечить повышение качества звукопередачи за счет более полного субъективного восприятия.

Предпосылками к такой постановке задачи может служить следующее:

1. Гласные звуки на большей части их длительности можно рассматривать как периодический сигнал. При увеличении девиации частоты число гармоник основного тона будет увеличиваться. Следовательно, есть возможность при передаче сигнала уменьшить количество гармоник основного тона, а на приемной стороне канала восстановить их количество путем увеличения девиации частоты.

2. Спектры глухих согласных звуков являются сплошными. Спектры их мгновенных частот также сплошные, в полосе примерно равной половине полосы частот спектра сигнала. Поэтому при увеличении девиации частоты спектр мгновенной частоты останется сплошным, но спектр фонемы расширится.

3. Известно влияние спектрального состава сложных сигналов на восприятие высоты их тона. Звуки, богатые высокочастотными спектральными составляющими, воспринимаются на слух как более высокие по сравнению со звуками, имеющими ту же частоту основного тона, но со слабыми гармониками высокого порядка или с меньшим их количеством.

4. Поскольку подмена спектральных составляющих будет происходить на высоких частотах, то можно предположить, что для слуха такая подмена будет незаметной или почти незаметной. В основе этого лежит пониженная чувствительность слуха к изменению высоты тона в области высоких частот .

Разработка методики проведения исследования

Следящее частотное шумопонижение

Возможность использования операции деления мгновенной частоты с целью шумопонижения будет количественно обоснована после предварительных исследований допустимых пределов сокращения спектров модулирующих функций звуковых сигналов для разных каналов передачи.

При использовании деления мгновенной частоты для целей передачи звуковых сигналов в частотно-компрессированном виде, очевидно, что передаваемый сигнал концентрируется в низкочастотной области. Причем ширина полосы частот, которая необходима для неискаженной передачи сигнала, будет постоянно меняться, вместе с изменением звукового сигнала. Поэтому в качестве одной из основных задач этого исследования можно назвать определение возможности создания следящего фильтра низких частот (СФНЧ), верхняя граничная частота которого изменялась бы во времени, принимая значения в соответствии с определенными допустимыми ограничениями полосы частот мгновенной частоты и огибающей, которые будут известны после проведения предварительных исследований. Представляется, что сокращение полосы для узкополосных сигналов, которые практически не маскируют шумы канала передачи, будет очень значительным. Поэтому для таких сигналов будет значительным и выигрыш в отношении «сигнал/шум».

Второй задачей этого исследования следует назвать определение сигнала управления для СФНЧ. В качестве первых претендентов на роль сигнала управления можно предложить сигналы, пропорциональные или ωн(t), или производной мгновенной частоты сигнала в соответствии с . Поскольку шумопонижение при этом достигается за счет различения частотных диапазонов сигнала и шума, то такое шумопонижение можно называть частотным.

При использовании огибающей для порогового амплитудного шумопонижения или для динамической фильтрации, получим комбинированный шумоподавитель для частотно-компрессированных сигналов.

Динамическая фильтрация

Как известно , в существующих вариантах динамических фильтров весь частотный диапазон звуковых сигналов делится на полосы, в каждой из которых шумопонижение осуществляется с помощью порогового шумоподавителя (обычно - это инерционные устройства). К недостаткам динамических фильтров обычно относят аппаратурную сложность, так как динамический фильтр представляет собой совокупность нескольких пороговых шумоподавителей (обычно четыре и более). Кроме этого, возникают трудности с обеспечением линейных частотных характеристик.

Теперь появилась возможность исследовать вариант динамической фильтрации в одной низкочастотной полосе при передаче частотно-компрессированных сигналов, управляя шириной полосы сигналом огибающей. Как известно, при уменьшении уровня звукового сигнала вначале в шумах канала звукопередачи тонут верхние гармоники звука, а в последнюю очередь - колебание основного тона. Это позволяет предположить, что возможно, уменьшая полосу фильтра пропорционально уменьшению огибающей, обеспечить эффект шумопонижения без обычных для динамических фильтров недостатков.

Заключение

В модуляционной теории сигнал описывается как сложно модулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала.

Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию.

Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.

Рецензенты:

Смирнов Н.В., д.ф.-м.н., доцент, профессор кафедры моделирования экономических систем прикладной математики процессов управления Санкт-Петербургского государственного университета, г. Санкт-Петербург;

Стариченков А.Л., д.т.н., доцент института проблем транспорта им. Н.С. Соломенко Российской Академии Наук, г. Санкт-Петербург.

Библиографическая ссылка

Уваров В.К., Редько А.Ю. МОДУЛЯЦИОННЫЙ АНАЛИЗ-СИНТЕЗ ЗВУКОВЫХ СИГНАЛОВ И ПЕРСПЕКТИВЫ ЕГО ИСПОЛЬЗОВАНИЯ В ЦЕЛЯХ ШУМОПОНИЖЕНИЯ // Фундаментальные исследования. – 2015. – № 6-3. – С. 518-522;
URL: http://fundamental-research.ru/ru/article/view?id=38652 (дата обращения: 26.04.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

02.03.2015 в 10:15

Итак, в данном цикле статей мы с вами поговорим о том что же такое компрессия и как ее использовать. К сожалению зачастую люди пользуются ей не понимания ее основ и в результат получается далеко не самого лучшего качества. Именно это и натолкнуло меня на написания цикла статей, где мы с вами детально разберем работу устройства под названием компрессор, и я покажу его применение на практике.

Одним из главных параметров звука является его динамика. С помощью динамики можно акцентировать ноты и музыкальные фразы добавляя новые краски в произведение, но, как показывает практика, мало кому из музыкантов(здесь не берутся во внимание профессионалы своего дела) удается это сделать. Да и ударные не подверженные динамической обработке звучат сухо и невыразительно. А ответ здесь прост - наш слух более чувствителен к высоким звукам и менее к низким. В качестве примера мы можем сравнить звук тарелки и саб-бочки, нормализовать их в 0db и послушать: тарелку люди будут воспринимать более ярко, ясно и насыщено. Конечно, можно поднять и уровень саб-бочки, но при этом (учитывая наличие других инструментов в миксе) мы рискуем получить режущую ухо кашу из звуков, где бочка будет зашкаливать, а тарелка звенеть где-то позади. Именно для предотвращения «динамических конфликтов» и служит компрессор. Так же через него могут пропускать готовые миксы в целях выравнивания общего звучания, добавления ему плотности и создания эффекта накачки.

Подводя небольшой итог вышесказанному: Компрессор - устройство, используемое для понижения динамического диапазона - промежутка между самым тихим и более громким уровнем звукового сигнала.

Принцип работы компрессора не так уж сложен, как кажется - он захватывает все, что превышает заданное значение в db и уменьшает его в соответствии с настройками. Рассмотрим на примере компрессора из пакета T-Racks Plugin Bundle

Threshold - данный параметр отвечает за порог срабатывания компрессора. Именно им устанавливается порог, при котором компрессор начинает свою работу. Измеряется он в db. К примеру, если мы выставим значение данного параметра -11.1, то это говорит о том, что все что находится ниже данного диапазона не будет подвергаться обработке, а все, что выше компрессор захватит и обработает.

Сразу хочу предостеречь - работать данным параметром нужно крайне аккуратно и постоянно смотреть на показание информационной панели(справа сверху). При обработке им звукового сигнала есть риск захватить более тихие звуки, которые в компрессии не нуждаются.

Ratio - соотношение. Зачастую данный параметр многие не понимают, или понимают неправильно. На самом деле все очень просто - он отвечает за величину ослабления сигнала. Измеряется так же в db. Допустим, у нас стоит значение 2(в некоторых компрессорах может использоваться обозначение 2:1), это означает, что сигнал превысивший порог Threshold будет ослаблен до 1 db выше значения порога, 8 db будет ослаблен до 4х и так далее. Значение Ratio в районе 3 будет считаться умеренным сжатием, 5 - средним, 8 -сильное, а значения свыше 20 будут уже считаться ограничивающими. В этом случае наш компрессор по работе начинает напоминать Limiter , но данный компрессор не позволяет выставлять такие экстремальные значения.

Attack Time - время срабатывания компрессора, которое требуется сигналу чтобы стать максимально компресированным после прохождения порога заданного параметром Threshold . Измеряется в миллисекундах.

На некоторых компрессорах значение времени атаки представляется в Дб/сек.

Release - время восстановления.Данный параметр является полностью противоположным параметру Attack Time . Если говорить конкретно, то это время, которое потребуется сигналу, чтобы вернуться в первоначальное состояние. Время восстановления, как правило, значительно больше времени атаки.

На компрессоре от T- Racks это особо заметно, т.к. значение времени Release представлено в секундах против миллисекунд значения Attack Time .

Make Up - в связи с тем, что компрессор является прибором понижающим динамическую характеристику сигнала, то на выходе звук будет тише, чем был до обработки. Именно для компенсации этого процесса служит данный параметр. Иными словами - им мы увеличиваем громкость сигнала после обработки.

В некоторых компрессорах он так же может обозначаться как Output Gain , Output , Gain и т.д.

Knee - данный параметр показывает плавность перехода между сжатым и несжатым сигналом. Имеет 2 типа - Hard Knee и Soft Knee . При использовании Soft Knee данный переходпроисходит более плавно и естественно, компрессор работает мягче и незаметней. Его работу очень хорошо иллюстрирует следующий график

Типы компрессии(по принципу использования):

1. Последовательная компрессия - самый распространенный тип динамической обработки звука. В Insert канала добавляем тот компрессор, который нам нужен и настраиваем. Все просто.

2.Параллельная компрессия — данный тип компрессии так же имеет достаточное широкое распространение, но есть одно существенное отличие от последовательной компрессии — при нем мы добавляем компрессор на Send -канал и уже примешиваем его к чистому и не обработанному звуку.

На некоторых компрессорах имеется параметр Mix , который позволяет настроить соотношение чистого сигнала к обработанному не прибегая к созданию отдельной дорожки Send.

3.Многополосная компрессия — компрессия, при которой отдельные диапазоны частот обрабатываются различным образом. Давайте взглянем на многополосный компрессор от Waves

Принцип работы данного компрессора не так уж сложен, каким он может показаться на первый взгляд: в его основе находится устройство под названием Crossover , который разделяет частоты звукового сигнала на различные диапазоны. А далее идет работа, как с обычным компрессором, но каждый частотный диапазон может быть обработан со своими настройками, что очень полезно при обработке отдельных инструментов микса.

На этом все. Во второй части я расскажу об особенностях применения различных компрессоров.

Адаптер

Поскольку линейный вход звукового адаптера является основным приемником внешнего сигнала при записи, каждый производитель стремится обеспечить на этом входе достаточное качество усиления сигнала. Чувствительность линейных входов большинства звуковых адаптеров примерно одинакова, а параметры качества пропорциональны общему качеству плат. Совершенно иначе обстоит дело с микрофонными входами: плата стоимостью 100 долл. может иметь гораздо худший по чувствительности и качеству вход, нежели ширпотребовская за 8 долл. Причина здесь в том, что микрофонный вход для звукового адаптера является второстепенным и его функциональность чаще всего ограничивается подключением простейшего дешевого микрофона для подачи голосовых команд, где уровень шума и АЧХ не столь критичны.

Микрофонные входы современных адаптеров рассчитаны, как правило, на подключение электретных микрофонов со встроенным усилителем, получающим питание от адаптера. Такой микрофон имеет высокое выходное сопротивление и развивает на выходе до 50-100 мВ, поэтому для усиления сигнала до уровня линейного входа (около 500 мВ) достаточно простейшего предусилителя . Некоторые адаптеры, согласно документации, позволяют подключать и динамические микрофоны, не нуждающиеся в питании, однако такой микрофон развивает на выходе всего 1-3 мВ и требует достаточно чувствительного и малошумящего усилителя, который на звуковых платах встречается довольно редко. Поэтому типовая плата в лучшем случае позволяет получить с такого микрофона недостаточно громкий, глуховатый звук, изобилующий шумами и наводками, а в худшем случае от динамического микрофона вы вообще не добьетесь звука. Предпочтение электретным микрофонам отдается вследствие того, что компьютер является источником множества электромагнитных излучений, создающих на чувствительном микрофонном входе ощутимые помехи, справиться с которыми довольно сложно. Создание малошумящего усилителя потребовало бы специальной компоновки платы, тщательной фильтрации питающих напряжений, экранирования области входных цепей и прочих сложных и дорогих ухищрений.

Разъем микрофонного входа большинства адаптеров - монофонический; в нем для передачи сигнала используется только концевой контакт (TIP) штекера, который в стереофоническом разъеме отвечает за сигнал левого канала. Средний контакт (RING), который в стереофоническом разъеме отвечает за правый канал, в микрофонном разъеме либо вообще не используется, либо служит для передачи питающего напряжения +5 В для электретного микрофона. Когда отдельный контакт для питания микрофона отсутствует, питающее напряжение подается прямо на сигнальный вход, а усилители в этом случае должны иметь емкостную развязку входа и выхода.

Микрофон

Как мы выяснили, для непосредственного подключения к адаптеру лучше всего подойдут электретные микрофоны, которые обычно выпускаются в достаточно миниатюрном исполнении: в виде «карандашей» с подставками либо «клипс», прикрепляемых к одежде или к корпусу монитора. Они недороги и продаются в магазинах компьютерных аксессуаров; если не требуется высокого качества записи, близкого к профессиональному, - таким микрофоном вполне можно обойтись. В противном случае необходим качественный профессиональный микрофон, за которым придется идти в магазин музыкальной аппаратуры, и цена его будет примерно на порядок выше.

С подключением профессионального микрофона обязательно возникнет некоторое количество проблем. Такие микрофоны чаще всего являются динамическими и выдают сигнал амплитудой в единицы милливольт, а микрофонный вход большинства звуковых адаптеров, как уже говорилось, не способен нормально воспринимать столь слабые сигналы. Выходов может быть два: либо купить в том же музыкальном магазине микрофонный предусилитель (который может оказаться довольно дорогой игрушкой) и подключить его выход уже не к микрофонному, а к линейному входу адаптера; либо использовать микрофон со встроенными предусилителем и питанием (батарейкой). При наличии радиотехнических навыков можно собрать несложный усилитель самостоятельно - варианты схем довольно часто встречаются в книгах и в Интернете.

Кроме того, профессиональные микрофоны обычно имеют разъемы типа XLR, а компьютерные звуковые адаптеры - mini-DIN, так что потребуется переходник; иногда такие переходники продаются в музыкальных магазинах, однако может статься, что придется паять его самостоятельно.

И наконец, вполне может так случиться, что любой профессиональный микрофон будет намного превосходить ваш звуковой адаптер по качественным параметрам и звук, который вы получите с помощью такого микрофона, в итоге будет не лучше того, что может обеспечить простой электретный. Поэтому если у вас есть сомнения в высоком качестве своего адаптера (а простые адаптеры ценой порядка 10 долл., тем более встроенные, имеют весьма посредственные параметры), то вам имеет смысл договориться в магазине о возможном возврате купленного микрофона, если не удастся получить с его помощью достаточно качественный звук.

Технология записи

В отличие от источников фиксированного сигнала, микрофон имеет ряд особенностей, которые необходимо учитывать при работе с ним. Прежде всего, он любит «фонить»: если усиленный сигнал с микрофона поступает на колонки, то микрофон воспринимает его, сигнал вновь усиливается и т.д., то есть образуется так называемая положительная обратная связь, которая «раскачивает» звуковой тракт, вводит его в режим самовозбуждения, что проявляется посредством громкого свиста, звона или рокота. Даже если тракт не войдет в режим самовозбуждения, положительная связь может давать звенящий или свистящий призвук, который заметно портит сигнал. При этом чувствительный микрофон может успешно ловить сигнал даже с наушников, если звук в них достаточно громкий, а наружная звукоизоляция слаба. Поэтому необходимо экспериментальным путем определить такое положение/направление микрофона и громкость усиленного звука, при котором положительная связь проявляется меньше всего. Окончательную запись рекомендуется производить при отключенных или хотя бы максимально приглушенных колонках.

Чувствительные микрофоны, особенно простые и дешевые, отлично воспринимают посторонние звуки вроде шороха пальцев по корпусу микрофона или легкого поскрипывания самого корпуса даже от незначительного сжатия (наверняка вам приходилось слышать подобные звуки при телефонных разговорах). Чтобы избежать таких помех, микрофон лучше установить на удобной подставке либо держать его свободно, не сдавливая пальцами.

Еще один неприятный момент в использовании микрофона - так называемое заплевывание потоком воздуха, которое особенно ярко проявляется на взрывных согласных, таких как «п», «б», «т» и им подобных. В результате попадания на мембрану интенсивного звукового импульса образуется резкий бросок амплитуды сигнала, перегружающий усилитель и/или АЦП. Профессиональные микрофоны имеют против этого ветрозащиту - сетку или мягкую прокладку, расположенную на некотором расстоянии от капсюля, но даже она не всегда спасает, поэтому к каждому микрофону приходится приноравливаться, привыкая держать его либо под правильным углом, чтобы прямые воздушные потоки проходили мимо, либо на достаточном расстоянии, чтобы они достигали микрофона в уже ослабленном состоянии.

Экспериментируя с микрофоном, вы обнаружите, что тембр записанного голоса довольно сильно зависит от расстояния ото рта до микрофона и от угла наклона микрофона относительно лица. Это вызвано тем, что низкочастотные составляющие голоса больше всего рассеиваются и ослабляются с расстоянием, тогда как высокочастотные ослабляются меньше, зато имеют более выраженную направленность. Наиболее сочный и бархатистый тембр голоса можно получить, расположив микрофон непосредственно у рта, но тогда придется изрядно повозиться с углом наклона и немало потренироваться, чтобы избежать «заплевывания».

Запись посредством внешних устройств

Последнее время появились весьма экзотические способы записи звука с микрофона и переноса его в компьютер. Так, Creative выпускает цифровой проигрыватель Jukebox, содержащий миниатюрный накопитель на жестком диске, автономный контроллер и интерфейс USB. Основная функция проигрывателя - воспроизведение звуковых файлов, которые перекачиваются в него из компьютера, однако встроенный микрофон позволяет использовать его в качестве автономного диктофона: звук записывается на жесткий диск, что обеспечивает непрерывную запись в течение нескольких часов, а впоследствии фонограмма может быть перенесена в компьютер. Другое изделие Creative - PC Cam представляет собой гибрид цифрового фотоаппарата, видеокамеры и диктофона и позволяет записывать звук во встроенную Flash-память, откуда он извлекается с помощью того же интерфейса USB.

Удаление шумов и помех

оскольку голосовой сигнал имеет достаточно узкий спектр (сотни герц - единицы килогерц), к нему можно применять операцию удаления шума с большей глубиной, чем в случае произвольного музыкального сигнала. При записи может также оказаться, что в наиболее удачно записанном фрагменте (с художественной точки зрения) микрофон все-таки оказался «заплеванным» в одном или в нескольких местах и попытки повторить фразу или куплет песни со столь же удачной расстановкой акцентов не дают желаемого результата. В таких случаях можно попробовать скруглить импульсы перегрузки, сохранив или уменьшив их амплитуду. При незначительном количестве импульсов это удобно делать вручную, укрупнив изображение до появления узловых точек, которые можно цеплять мышью.

Методы обработки голоса

ак мы уже говорили, сложный музыкальный сигнал содержит множество разнородных составляющих, на которые большинство методов обработки звука воздействует с различным эффектом, поэтому спектр универсальных методов обработки сигнала весьма узок. Наиболее популярен метод реверберации, имитирующий множественное отражение звуковых волн и создающий эффект пространства - комнаты, зала, стадиона, горного каньона и т.п.; реверберация позволяет придать «сухому» звуку сочность и объем. Остальные универсальные методы обработки сводятся к манипуляции АЧХ (эквалайзер), чистке фонограммы от шумов и помех.

В отношении же первичного, простого звукового сигнала может быть достаточно успешно применен весь спектр существующих методов обработки - амплитудных, частотных, фазовых, временных, формантных и т.п. Те методы, что на сложном сигнале рождают неблагозвучную какофонию, на простых сигналах нередко способны привести к созданию очень интересных и ярких эффектов, широко используемых в звуковой индустрии.

Монтаж

Компьютерный монтаж речевых фонограмм - типичное занятие журналиста после записи интервью - одновременно и прост, и сложен. Поначалу он кажется простым, благодаря удобной для визуального анализа структуре речи, наличию заметных пауз между словами, всплескам амплитуды в местах акцентов и т.п. Однако при попытке, например, переставить местами две фразы, разделенные буквально секундами, выясняется, что они не желают стыковаться - успели измениться интонация, фаза дыхания, фоновый шум, и на стыке отчетливо прослушивается сбивка. Такие сбивки легко различимы практически в любом радиоинтервью, когда записывается речь человека, не являющегося профессиональным радиожурналистом и, следовательно, не умеющего говорить только то, что должно пойти в эфир. Из речи вырезают лишнее, некоторые фрагменты переставляют местами для большего соответствия смыслу, в результате чего слух постоянно «удивляется», поскольку в потоке естественной человеческой речи таких интонационных и динамических переходов не бывает.

Для сглаживания эффектов перехода можно воспользоваться методом взаимоперекрытия (crossfade), хотя он позволит состыковать фрагменты речи лишь по амплитуде, но не по интонации и фоновым шумам. Поэтому считаем нужным предостеречь тех, кому компьютерный монтаж покажется удобным способом фальсификации записи, например, переговоров: экспертиза способна без труда выявить даже неразличимые ухом места склейки, как и в случае с подделкой документов при помощи сканера и принтера.

Амплитудная обработка

Простейший вид динамической амплитудной обработки голоса - модуляция его периодическим сигналом, когда амплитуды сигналов перемножаются и голос приобретает амплитудные характеристики модулирующего сигнала. Модулируя низкочастотным (единицы герц) синусоидальным сигналом, получаем «булькающий» голос, повышая частоту сигнала - вибрирующий. Используя вместо синусоидальной формы прямоугольную, треугольную или пилообразную, можно придать голосу металлические, искаженные, «роботизированные» интонации.

Амплитудная модуляция выделенного фрагмента фонограммы выполняется как часть операции генерации периодических сигналов Generate g Tones. В поле Base Frequency задается основная частота сигнала в герцах, в поле Flavor - вид импульса, в поле Duration - длительность в секундах. Регуляторы Volume задают уровень сигнала.

Группа движков Frequency Components определяет уровни гармоник основного сигнала с указанными при движках номерами. Частотную модуляцию сигнала можно получить, используя поля Modulate By - смещение от основной частоты в герцах - и Modulation Frequency - частота модуляции. При помеченном поле Lock... все эти параметры, включая основную частоту, стационарны; при снятии пометки можно задать их начальные/конечные значения в закладках Initial/Final Settings - они будут линейно изменяться в течение генерируемого отрезка.

Группа полей Source Modulation определяет, как будет использоваться сгенерированный сигнал. По умолчанию, когда ни одно из этих полей не отмечено, сигнал вставляется в фонограмму или заменяет собой выделенный фрагмент; в противном случае он используется для выполнения заданной операции с выделенным фрагментом: Modulate - обычная модуляция (перемножение), Demodulate - демодуляция (деление), Overlap (mix) - простое смешивание сигналов. Последовательные модуляция и демодуляция с одним и тем же сигналом восстанавливают исходный сигнал (возможно, с измененным общим уровнем). Эксперименты с различными сочетаниями параметров порой дают весьма забавные и неожиданные результаты.

Временная обработка

Этот вид обработки основан на сдвиге исходного сигнала во времени и смешивании результата с исходным сигналом, после чего снова могут применяться сдвиг и смешивание. При сдвигах на малые промежутки времени, сравнимые с длительностью периода исходного сигнала, возникают фазовые эффекты типа интерференции, отчего звук приобретает специфическую окраску; этот эффект получил название фленжера (flanger) и используется как с фиксированной величиной сдвига, так и с периодически изменяющейся или даже вовсе со случайной. При сдвигах на интервалы, превышающие длительность периода, но не более 20 мс, возникает хоровой эффект (chorus). Благодаря общности технологии, эти два эффекта нередко реализуются одним программным блоком с различными параметрами.

При множественных сдвигах с интервалами 20...50 мс возникает эффект реверберации (reverb) - гулкости, объема, оттого что слуховой аппарат трактует задержанные копии сигнала как отражения от окружающих предметов. При интервалах свыше 50 мс ухо перестает четко связывать отдельные копии между собой, вследствие чего возникает эффект эха (echo).

В Cool Edit 2000 эффекты, основанные на временных задержках, объединены в группу Transform g Delay Effects. Эффекты flanger и chorus создаются операцией flanger:

Движок Original/Delayed управляет соотношением исходного и задержанного сигналов (интенсивность, или глубина эффекта). Initial/Final Mix Delay - начальная и конечная задержка копии - изменяется в этих пределах циклически. Stereo Phasing - угол фазового сдвига между каналами - позволяет создать любопытный эффект «скручивания» звука, особенно в наушниках. Feedback - глубина обратной связи (количество результирующего сигнала, подмешиваемого к исходному перед применением операции) - позволяет управлять выраженностью, резкостью эффекта.

Группа Rate задает параметры цикличности эффекта. Period - интервал времени, за который фленжер проходит от начальной задержки до конечной и обратно; Frequency - обратная величина, частота проходов туда-обратно; Total Cycles - количество полных проходов по выделенному фрагменту. Задание любого параметра вызывает автоматический пересчет остальных.

Группа Mode управляет особенностями эффекта: Inverted - инверсия задержанного сигнала, Special EFX - дополнительная инверсия исходного и задержанного сигналов, Sinusoidal - синусоидальный закон изменения задержки от начальной до конечной (если он отключен - задержка изменяется линейно).

Набор пресетов позволяет наглядно изучить особенности операции. Попробуйте выбрать несколько пресетов, меняя в каждом из них предустановленные параметры и не забывая всякий раз «откатываться» (Undo), чтобы сравнить влияние на звук различных комбинаций параметров.

Эффект реверберации в Cool Edit 2000 может быть реализован двумя способами: с помощью Echo Chamber - имитатора комнаты с заданными размерами и акустическими свойствами, и Reverb - генератора эффекта объема на основе встроенного в редактор алгоритма имитации множественных отражений в пространстве. Поскольку данный вид обработки является универсальным и применяется к любому звуковому материалу, опишем кратко второй способ как наиболее популярный.

Поле/движок Total Reverb Length определяет время реверберации, в течение которого отраженные сигналы полностью затухают; оно косвенно связано с объемом пространства, в котором распространяется звук. Attack Time - время нарастания глубины реверберации до номинального уровня; служит для плавного проявления эффекта на протяжении обрабатываемого фрагмента. High Frequency Absorbtion Time - время поглощения объемом высокочастотных составляющих, пропорционально «мягкости» и «заглушенности» объема. Perception - степень разборчивости: меньшие значения (smooth) - слабые и мягкие отражения, не перебивающие основного сигнала, большие значения (echoey) - четкие и сильные, отчетливо слышимые отражения, способные ухудшить разборчивость речи.

Движки/поля Mixing определяют соотношение исходного (dry) и обработанного (wet) сигналов в результирующем.

Эффект эха реализуется операцией Echo и добавляет к сигналу его постепенно затухающие копии, сдвинутые на равные промежутки времени. Регулятор Decay задает величину затухания - уровень каждой очередной копии в процентах от уровня предыдущей. Initial Echo Volume - уровень первой копии в процентах от уровня исходного сигнала. Delay - задержка между копиями в миллисекундах. Группа регуляторов Successive Echo Equalization управляет эквалайзером, через который пропускается каждая очередная копия, что позволяет задавать различные акустические характеристики имитируемого пространства.

Поскольку эффект является «продолжающимся» во времени, он может создать звуковой фрагмент, по длительности превышающий исходный. Для этого предусмотрен пункт Continue echo beyond selection - разрешение подмешивать эхо-сигнал к участку фонограммы, продолжающемуся за границей выделенного фрагмента. При этом в качестве исходного сигнала будет взят только выделенный фрагмент, а оставшаяся часть фонограммы будет использована исключительно для размещения «хвоста». Если в фонограмме не хватает места для «хвоста» - будет выдано сообщение об ошибке и придется добавить в конец фонограммы участок тишины операцией Generate g Silence.

Эффект лучше всего воспринимается на относительно коротких звуках. На длинных словах или фразах, чтобы исключить возникновение «тарабарщины» - множественных повторений различных слогов или слов, перебивающих друг друга, эффект лучше делать «концевым», выбирая для повторения только короткий завершающий фрагмент фразы или даже последний ударный слог слова. Попробуйте поэкспериментировать с различными словами и фразами, чтобы почувствовать, какую завершающую часть лучше использовать для «размножения» в каждом конкретном случае.

Спектральная обработка

Наиболее ярким и интересным эффектом из этого класса, реализованным в Cool Edit 2000, является изменение высоты и скорости. Всем известен эффект повышения или понижения высоты сигнала при изменении скорости протяжки ленты в магнитофоне или вращения пластинки. С развитием цифровых методов обработки сигналов стало возможным правдоподобно реализовать каждый из этих эффектов по отдельности - изменение высоты при сохранении временных характеристик либо наоборот.

Обработку этого типа в Cool Edit 2000 осуществляет операция Transform g Time/Pitch g Stretch . Возможно два варианта - с постоянным (constant) либо со скользящим (gliding) коэффициентом. Коэффициенты задаются полями Initial/Final Ratio, которые связаны также с движками для удобства изменения. Коэффициент может, кроме того, задаваться косвенно полем Transpose в виде количества музыкальных хроматических полутонов вверх (диез) или вниз (бемоль). В режиме изменения длительности наряду с этим доступно поле Length, в котором можно задать требуемую длину результирующего фрагмента.

Переключатель Precision задает точность обработки: низкую (Low), среднюю (Medium) и высокую (High) - это необходимо потому, что операция спектральной обработки требует множества вычислений и снижение точности позволяет добиться ускорения обработки - хотя бы на этапе экспериментов. Переключатель Stretching Mode задает вид обработки: Time Stretch - ускорение/замедление во времени, Pitch Shift - сдвиг по высоте, Resample - простая передискретизация, аналогичная изменению скорости ленты/пластинки.

Группа параметров Pitch and Time Settings управляет особенностями операции. Обработка выполняется путем разбиения фрагмента на маленькие звуковые блоки; параметр Splicing Frequency задает количество таких блоков в одной секунде фрагмента. Увеличение этой «частоты дискретизации» делает блоки более мелкими, повышая натуральность обработки, но одновременно усиливается и эффект дробления, порождая неприятные призвуки. Параметр Overlapping задает степень перекрытия соседних блоков при сборке результирующего сигнала - небольшое взаимное перекрытие позволяет сгладить призвуки от их стыковки. Пункт Choose appropriate defaults служит для автоматической установки этих параметров в наиболее подходящие, с точки зрения редактора, значения.

Эта статья завершает краткий цикл, посвященный записи и обработке звука на домашнем компьютере.

КомпьютерПресс 12"2002

Преобразователи динамического диапазона звуковых сигналов на осн о ве модул и рующих функций

Харитонов Владимир Борисович,

кандидат технических наук, профессор

Зирова Юлия Константиновна,

аспирант кафедры з вукотехники

Санкт-Петербургский государственный уни верситет кино и телевидения.

Преобразование динамического диапазона звуковых сигналов на основе модулирующих функций в теории модуляционного анализа-синтеза является безынерционным. Причем речь идет не о нелинейной обработке мгновенных значений сигнала, которая обладает безынерционностью, но вносит в обработанный сигнал нелинейные искажения. Обработка сигналов по их модулирующим функциям теоретически в ряде случаев решает проблему преобразования динамического диапазона сигналов без внесения в них искажений. На практике, как отмечают авторы , выполнившие аналоговую реализацию устройств обработки модулирующих функций, невозможно добиться теоретических результатов из-за ограниченной точности и нестабильности параметров аналоговых устройств выделения и обработки модулирующих функций. В данной статье изложены результаты исследования цифровой реализация устройства преобразования динамического диапазона на теоретической основе модуляционного анализа-синтеза, позволившей выяснить потенциал метода средствами точной цифровой обработки сигналов.

Изначально преобразователи динамического диапазона (ПДД) звуковых сигналов применялись в радиовещании для защиты звуковых трактов от перегрузок, согласования диапазона уровней сигналов с динамическим диапазоном каналов, по которым они передаются, и ослабления влияния шума носителей записи. По схожим причинам компрессировали звук для кинематографического канала звукопередачи, поскольку динамический диапазон аналоговых фотофонограмм, как правило, составляет 35–45 дБ, а диапазон уровней звуковой программы (воспринимаемый слухом) может достигать почти 110 дБ. Часто прибегают к компрессированию как речи, так и музыки для сглаживания динамики звука и повышения разборчивости речи на «живых» выступлениях, когда, например, выступающий по каким-то причинам значительно удаляется от микрофона или приближается к последнему. Можно привести еще много примеров применения только амплитудных компрессоров. Но преобразование динамического диапазона не ограничивается его сжатием, а включает еще лимитирование, шумоподавление и экспандирование звуковых сигналов. Все эти виды обработки звука сейчас широко применяются и предположительно еще долгое время будут помогать звукорежиссерам воплощать их творческие идеи и решать технические задачи.

Некоторые причины включения ПДД в звуковые тракты с переходом к цифровым способам записи потеряли свою актуальность: динамический диапазон цифровых носителей записи и звуковых трактов сопоставим с динамическим диапазоном человеческого слуха. Но в кинотеатре, если не сжимать динамический диапазон звукового сопровождения кинофильма при его прослушивании, то тихие фрагменты просто потонут в шумах зрительного зала. Также, если не ограничивать верхнюю границу уровня сигнала, можно оглушить зрителей или перегрузить усилители мощности и кинотеатральные громкоговорители. Таким образом, преобразованиединамического диапазона кинематографического звука необходимо для обеспечения комфортного прослушивания в зале кинотеатра. В формате цифрового звука Dolby Digital , применяемом для записи фонограмм большинства современных фильмов, предусмотрено формирование специального сигнала управления динамическим диапазоном. В аппаратуре воспроизведения предусмотрено использование этого сигнала для регулирования динамического диапазона, причем имеется возможность изменения степени компрессирования в зависимости от условий конкретного зрительного зала. В связи с этим сохраняет актуальность разработки преобразователей динамического диапазона, обеспечивающих высокое качество обработки звуковых сигналов при минимальном вмешательстве звукооператора.

По критерию быстродействия ПДД делятся на две группы: инерционные (с динамически изменяющимся коэффициентом передачи) и безынерционные (мгновенного действия).

Инерционные преобразователи используются в звукотехнике уже в течение многих десятилетий, принцип их работы, достоинства и недостатки достаточно подробно описаны в литературе . Их работа основана на выделении из сигнала огибающей, формировании на основе огибающей управляющего сигнала и последующем перемножении этих двух сигналов: входного звукового и управляющего:

где – входной сигнал, – управляющий сигнал, – выходной сигнал.

Перемножению во временной области соответствует свертка спектров названных сигналов в частотной области.

где – частотный спектр входного сигнала, – частотный спектр управляющего сигнала, – частотный спектр выходного сигнала.

Для формирования сигнала управления применяется низкочастотная фильтрация максимальных или среднеквадратичных значений входного сигнала. В результате такой фильтрации сигнал управления изменяется инерционно, по отношению к изменениям амплитудного или среднеквадратичного значения сигнала. Из-за противоречивости требований, предъявляемых к фильтрации функции коэффициента передачи, возникают недостатки инерционных преобразователей:

· плавное нарастание сигнала управления приводит к выбросам выходного сигнала при резком увеличении сигнала на входе. Эти выбросы могут выйти за пределы линейного участка характеристики передачи звукового тракта. При этом появятся нелинейные искажения;

· резкое нарастание сигнала управления избавит от выбросов, но в то же время сигнал управления приобретет крутой фронт – это обогатит его спектр, а значит, после свертки спектров входного сигнала и сигнала управления значительно обогатится спектр выходного сигнала. Это обусловит появление слышимых эффектов работы ПДД;

· замедленный процесс восстановления коэффициента передачи при резком уменьшении сигнала приводит к появлению эффекта «дыхания шума паузы». Этот эффект выражается в заметном на слух снижении громкости тихого фрагмента сигнала с постепенным последующим ее увеличением;

· резкое восстановление коэффициента передачи обусловит появление пульсаций в управляющем сигнале при обработке звукового сигнала с интенсивными низкочастотными составляющими. Эти пульсации вызывают амплитудную модуляцию обрабатываемого сигнала и приводят к появлению нелинейных искажений.

Для того чтобы перечисленные искажения не были заметны на слух, необходимо подбирать оптимальные параметры фильтра для определенного вида звукового материала: речи или музыки.

Известны безынерционные ограничители уровня сигнала, в них ограничению подвергаются мгновенные значения сигнала, превышающие некоторое заданное пороговое значение сигнала. При этом изменяется форма сигнала и появляются большие нелинейные искажения, поэтому такие устройства практически не используются. Их применяют, в основном, как средство защиты от перегрузки тракта передачи сигнала.

Безынерционное преобразование динамического диапазона звуковых сигналов на основе модулирующих функций в теории модуляционного анализа-синтеза свободно от перечисленных недостатков инерционных устройств и вышеупомянутых безынерционных ограничителей уровня сигнала. В теории модуляционного анализа-синтеза все преобразования, в том числе преобразование динамического диапазона, основываются на выделении из сигнала и последующей обработки модулирующих функций: амплитудной и/или частотной. Кроме преобразования динамического диапазона сигнала, на основе модуляционных преобразований возможно осуществить: безынерционное управление тембром звуковых сигналов , сжатие частотного диапазона звуковых сигналов на основе выделения и нелинейной обработки их мгновенной частоты и другие виды преобразований .

Аналоговый безынерционный компрессор на основе модулирующих функций оказался довольно сложным в реализации. Результаты его работы, представленные в , показывают, что все недостатки инерционных компрессоров в данном случае отсутствуют. Но из-за ограниченной точности и нестабильности параметров аналоговых устройств выделения и обработки модулирующих функций результаты далеки от теоретически возможных. В связи со сложностью аналоговой реализации, безусловно, огромный интерес представляет создание цифрового безынерционного ПДД на основе модулирующих функций. Во-первых, это позволит улучшить качество обработки звука за счет использования алгоритмов преобразования динамического диапазона, недоступных или труднореализуемых с необходимой точностью в аналоговой форме. Во-вторых, в связи с повсеместным использованием цифровых способов записи, обработки и воспроизведения звука наиболее естественно выполнять преобразование динамического диапазона также в цифровой форме. Точная цифровая реализация ПДД на основе модуляционного анализа-синтеза позволит в полной мере выяснить потенциальные возможности метода, чему до сих пор препятствовали принципиально неустранимые погрешности аналоговой реализации.

Перед изложением результатов работы цифрового безынерционного компрессора имеет смысл рассмотреть подробнее модулирующие функции и основы модуляционных преобразований сигналов.

Согласно теории модуляционного анализа-синтеза, произвольный сигнал можно представить как результат совместного применения амплитудной и частотной модуляции:

,

если удачно выбрать пару модулирующих функций – амплитудную модулирующую функцию и – частотную модулирующую функцию. В теории доказано, что для однозначного выбора этой пары функций необходимо исходный сигнал дополнить опорным с помощью преобразования Гильберта. Понятия о модулирующих функциях сигнала были введены еще в 1945 г. Д. Габором .

Огибающей (амплитудной модулирующей функцией) пары сигналов, сопряженных по Гильберту , называют неотрицательную функцию времени

.(1)

Мгновенной частотой (частотной модулирующей функцией) пары сигналов называют производную от текущей фазы:

Введенные Д. Габором понятия нашли широкое применение при описании преобразований узкополосных сигналов.

Ю. М. Ишуткин в предложил обобщить введенные Д. Габором определения модулирующих функций, не накладывая ограничений на ширину частотного спектра сигналов.

Идея обработки звукового сигнала путем воздействия на его модулирующие функции, предложенная Ю. М. Ишуткиным, состоит в том, чтобы:

1. По известному вещественному сигналу с помощью преобразования Гильберта создать комплексный сигнал

,

где – Гильбертово отображение сигнала .

2. Для этой пары сигналов вычислить модулирующие функции: амплитудную модулирующую функцию и частотную модулирующую функцию сигнала.

3. Преобразовать модулирующие функции в целях обработки с помощью линейных и нелинейных цепей.

4. По измененным модулирующим функциям синтезировать новый звуковой сигнал.

Совокупность первых двух операций, в результате которых становятся известными модулирующие функции сигнала, называют модуляционным анализом. Последняя операция носит название модуляционного синтеза. Структура канала полного модуляционного анализа-синтеза представлена на рис.1 .

.

Для построения цифровой системы необходимо произвести требуемые преобразования цифрового представления звукового сигнала. Цифровой безынерционный ПДД может быть построен по схеме с прямым регулированием. С учетом дискретизации аналоговых сигналов его структурная схема изображена на рис.2.


Рис.2. Структурная схема цифрового безынерционного компрессора с прямым регулированием.

Исходный сигнал представлен как

,

где - дискретная мгновенная амплитудная модулирующая функция, а - дискретная мгновенная фаза сигнала. В демодуляторе огибающей выполняется преобразование Гильберта и вычисление амплитудной модулирующей функции. Частотный спектр исходного сигнала, в соответствии со свойством спектра произведения образов, будет равен

,(2)

где - частотный спектр амплитудной модулирующей функции, - символ прямого преобразование Фурье, его выполнение в данном выражении формирует в качестве второго операнда свертки частотный спектр косинуса мгновенной фазы сигнала, а - частотный спектр сигнала.

В результате нелинейного преобразования мгновенной амплитудной модулирующей функции, выполняемого в блоке возведения в степень, получаем новую дискретную амплитудную модулирующую функцию , где - некоторая нелинейная функция, в данном случае - степенная, реализующая амплитудную характеристику ПДД требуемого вида. Новой амплитудной модулирующей функции будет соответствовать новый частотный спектр . Частотный спектр синтезированного по измененной амплитудной модулирующей функции сигнала будет иметь вид

Введение линии задержки необходимо для синхронизации исходного сигнала с сигналом огибающей, вычисление которой неизбежно сопровождается временной задержкой.

Добавление к новой огибающей постоянного сигнала необходимо для того, чтобы преобразование начиналось со значения огибающей, превышающих пороговый уровень, задаваемый постоянным слагаемым.

Для частного случая реализации амплитудной характеристики компрессора со сжатием динамического диапазона в два раза сигнал на выходе безынерционного ПДД можно представить следующим соотношением:

.

Выполнение большинства требуемых математических операций цифровой системой осуществляется с высокой точностью. Пожалуй, наиболее сложным элементом цифрового ПДД является широкополосный цифровой преобразователь Гильберта (ЦПГ), входящий в состав блока демодуляции огибающей. От него во многом зависит качество ПДД. Для достижения высокого качества преобразования ЦПГ должен в широкой полосе частот, от 32 Гц до 16000 кГц, обеспечивать частотно-независимый фазовый сдвиг сигнала на с погрешностью порядка . Величина фазовой погрешности выбирается такой, чтобы возникающие из-за нее пульсации мгновенной амплитуды тонального сигнала не были заметны на слух. При такой фазовой погрешности их уровень не превысит -80 дБ. Реализация такого преобразователя рассмотрена в [ 10 ].

Компьютерная модель цифрового безынерционного компрессора на основе модулирующих функций, построенная по схеме рис.2, при проверке работоспособности на тестовых однотональных сигналах дала положительные результаты, показав тем самым правильность найденных алгоритмических решений, а также успешное решение проблем, неизбежно возникающих при переходе от аналогового представления сигналов к цифровому. Амплитудная модулирующая функция исходного однотонального сигнала представляет собой постоянную функцию времени. В результате нелинейного преобразования амплитудной модулирующей функции получается новая временная амплитудная модулирующая функция, но в случае с однотональным сигналом это будет снова постоянная функция времени. Спектр исходной амплитудной модулирующей функции и нелинейно преобразованной для однотонального сигнала состоит из одной гармоники на частоте сигнала. Результат свертки синтезированного по измененной амплитудной модулирующей функции однотонального сигнала заведомо будет подобен по форме исходному сигналу.

Проверка работы безынерционного ПДД на реальном звуковом сигнале дала неожиданные результаты, а именно временами очень плохое качество звука прошедшего нелинейную обработку. Для поиска причины, вызывающей заметные на слух артефакты при прослушивании обработанного сложного звукового сигнала, был выполнен анализ форм модулирующих функций (сравнение значений на выходе цифровой модели с расчетными значениями), а также сопоставление форм их частотных спектров. В качестве тестового сигнала для такой проверки был выбран сигнал, состоящий из двух гармонических компонентов с частотами Гц и Гц:

где, - частота дискретизации сигнала, равная 44 100Гц.

Ниже приведена расчетная временная диаграмма тестового сигнала и его частотный спектр (рис. 3а), а также временные диаграммы и частотные спектры его амплитудной модулирующей функции (рис. 3б) и косинуса фазы (рис. 3в). Спектры амплитудной модулирующей функции и косинуса фазы состоят из множества компонент, но в результате свертки таких спектров остаются всего две составляющие.

Рис.3. Временные функции (справа) и частотные спектры (слева): а) сигнала биений с частотами 1000 и 1500Гц; б) амплитудной модулирующей функции сигнала биений; в) косинуса фазы сигнала биений.

Аналитическое выражение для временной амплитудной модулирующей функции имеет вид:


Для вычисления ее спектра удобно воспользоваться табличным косинус-преобразованием Фурье функции при

(3)

Табличные значения гамма-функции для аргументов в диапазоне от 0 до 2, а также формулы для вычисления гамма-функции для больших и отрицательных значений аргументов представлены в . В таблице 1 сведены результаты аналитического расчета спектральных составляющих амплитудной модулирующей функции на угловых частотах от 0 до с периодом равным . В дискретной области частоте соответствует частота , равная отношению частоты дискретизации к количеству отсчетов на периоде сигнала. Практически полное совпадение значений, обозначенных на диаграммах рис. 3, с результатом аналитического расчета подтверждает правильность построений рис. 3.

Таблица 1.

Аналитические значения спектра амплитудной модулирующей функции.

Дискретная частота

–3,93

–13,47

1000

–27,45

1500

–34,82

2000

–39,94

2500

–43,88

3000

–47,1

Сжатию динамического диапазона в два раза соответствует степенная обработка амплитудной модулирующей функции с показателем степени равным 1/2. Для этого случая на рис. 4 показаны различия временных функций и частотных спектров исходного (штриховая линия) и обработанного (сплошная линия) сигналов (рис. 4а), а также их амплитудных модулирующих функций (рис. 4в). Спектры исходных и обработанных сигналов сдвинуты на диаграмме относительно друг друга на 30 отсчетов для более наглядного представления их различий.

В табл. 2 представлены результаты аналитического расчета спектра нелинейно преобразованной огибающей, вычисленные по формуле (3) для . Они практически точно совпадают со значениями, обозначенными на диаграммах рис. 4, что подтверждает точность последних.


Рис.4. Временные функции (справа) и частотные спектры (слева): а) сигналов на входе и выходе безынерционного преобразователя; б) амплитудной модулирующей функции входного сигнала и результата ее степенной обработки.

Таблица 2.

Аналитические значения спектра нелинейно преобразованной амплитудной модулирующей функции (степень 1/2).

Дискретная частота

2,35

16,33

1000

25,87

1500

31,25

2000

35,03

2500

37,95

3000

40,33

Нелинейное преобразование амплитудной модулирующей функции видоизменило ее спектр (рис. 3б). В результате свертки такой нелинейно преобразованной огибающей и входного сигнала выходной сигнал будет иметь существенно обогащенный спектр по сравнению со входным (рис. 3а). В синтезированном по измененной огибающей сигнале биений появятся дополнительные составляющие, которые можно рассматривать как интермодуляционные искажения. Они меняют субъективное восприятие преобразованного сигнала. Очевидно, что в любом другом случае, кроме обработки однотонального сигнала, из-за изменения только одного из операндов в выражении (2) будет получен спектр преобразованного сигнала, отличающийся от исходного. Степень обогащения спектра выходного сигнала зависит от широкополосности огибающей: чем шире спектр нелинейно преобразованной огибающей, тем сильнее обогащается частотный спектр преобразованного сигнала.

Таким образом, в чистом виде безынерционное преобразование динамического диапазона звуковых сигналов на основе модулирующих функций непригодно из-за изменений частотного спектра преобразованного сигнала, в ряде случаев, отчетливо заметных на слух. Можно, конечно, отфильтровать спектр нелинейно преобразованной огибающей, примерно до ширины критической полосы слуха в низкочастотной части звукового диапазона. Тогда дополнительные составляющие окажутся впределах одной критической полосы с составляющими спектра исходного сигнала и окажутся замаскированными. Но ПДД при этом потеряет свойство безынерционности из-за ограниченной длительности переходной функции фильтра мгновенной огибающей.

Выводы:

· Цифровая модель ПДД позволила избавиться от неустранимых погрешностей аналоговой реализации и выяснить потенциальные возможности метода ПДД на основе нелинейной обработки модулирующих функций.

· Прослушивание фонограмм после обработки цифровым ПДД на основе модулирующих функций обнаружило возникновение в некоторые моменты слышимых грубых искажений звукового сигнала.

· Анализ временных функций и частотных спектров сигналов, возникающих при ПДД с использованием модулирующих функций, позволил объяснить возникновение слышимых искажений обогащением частотного спектра обработанного сигнала вследствие изменения спектра амплитудной модулирующей функции. Для уменьшения заметности искажений необходимо фильтровать преобразованную амплитудную модулирующую функцию. При этом ее спектр сужается, и при условии, что дополнительные составляющие оказываются в одних критических полосах слуха с основными составляющими, первые эффективно маскируются вторыми. Правда при этом ПДД теряет свойство безынерционности.

· В связи с наличием у безынерционных ПДД на основе модулирующих функций принципиальных недостатков, представляется, что создание более совершенных ПДД должно идти по пути улучшения инерционных преобразователей.

Литература.

1. Основы модуляционных преобразований звуковых сигналов: Монография/ Ишуткин Ю. М., Уваров В. К.; Под ред. В. К. Уварова. – СПб.: СПбГУКиТ, 2004.

2. Радиовещание и электроакустика: Учебник для вузов/ А. В. Выходец, М. В. Гитлиц, Ю. А. Ковалгин и др.; Под ред. М. В. Гитлица. – М.: Радио и связь, 1989.

3. Udo Zoelzer. Digital Audio Signal Processing. John Willey & Sons. Chichester , New York , Weinheim, Brisbane , Singapore , Toronto , 1997.

4. Осташевский Е. Н. Разработка метода и аппаратуры управления нестационарными фазами сигналов для преобразования тембра при создании звуковых эффектов: Автореф. дис. канд. тех. наук. – Л.: ЛИКИ, 1987.

5. Уваров В. К. Точное компандирование частотного и динамического диапазонов звуковых сигналов. – СПб.:СПбГУКиТ, 2002.

6. Плющев В. М. Разработка метода и устройств безынерционного преобразования динамического диапазона звуковых сигналов: Автореф. дис. канд.тех.наук. –Л.: ЛИКИ, 1986.

7. Применение модуляционных преобразований звуковых сигналов: Монография/ В. К. Уваров, В. М. Плющев, М. А. Чесноков; Под ред. В. К. Уварова – СПб.:СПбГУКиТ, 2004.

8. Перспективы обработки звуковых сигналов по их модулирующим функциям. Ишуткин Ю. М. Труды Ленинградского института киноинженеров, 1977 г., вып. . –с. 102-115.

9. D.Gabor, J.IEE 93, (pt3), (1946).

10. Журнал научных публикаций аспирантов и докторантов, ISSN 1991-3087, 2008 г., № 9. – с. 213-218.

11. Интегральные преобразования и операционное исчисление, В. А. Диткин, А. П. Прудников, Главная редакция физико-математической литературы изд-ва «Наука», М., 1974 г.

12. Справочник по математике (для научных работников и инженеров). Г. Корн, Т. Корн. – М., 1977.