Сам себе сисадмин. Победа над «домашним» компьютером - Андрей Кашкаров
Шрифт:
Интервал:
Закладка:
На практике существуют проблемы, связанные с созданием базы HRTF функций при помощи манекена. Результат будет соответствовать ожиданиям, если манекен и слушатель имеют головы одинакового размера и формы, а также ушные раковины одинакового размера и формы. Только тогда можно корректно воссоздать эффект звучания в вертикальной плоскости и гарантировать правильное определение источников звука в пространстве. Записи, сделанные с использованием HRTF (binaural recordings), обеспечивают высококачественный SD-звук. Слушать такие записи желательно в специальных наушниках. CD с такими записями стоят существенно дороже стандартных музыкальных CD (имеется в виду лицензионная продукция). Корректно воспроизводить их через акустические системы позволяет техника CC. Главный недостаток метода – отсутствие интерактивности. Без механизмов, отслеживающих положение головы пользователя, обеспечить интерактивность при использовании HRTF нельзя. Бытует поговорка, что использовать HRTF для интерактивного 3D звука – это все равно, что использовать ложку вместо отвертки: инструмент не соответствует задаче.
Sweet Spot
Значения HRTF можно получить не только с помощью установленных в ушах манекена специальных внутриканальных микрофонов (inter-canal microphones). Используется еще и так называемая искусственная ушная раковина. В этом случае прослушивать записи нужно в специальных внутриканальных (inter-canal) наушниках, которые представляют собой маленькие шишечки, размещаемые в ушном канале, так как искусственная ушная раковина уже перевела всю информацию о позиционировании в волновую форму. Однако, согласитесь, удобнее слушать звук в наушниках или через колонки. При записи через inter-canal (микрофоны вокруг них, над ними и под ними) происходит искажение звука. Аналогично при прослушивании звук искажается вокруг головы слушателя. Поэтому и появилось понятие sweet spot, т е. области, при расположении внутри которой слушатель будет слышать все эффекты, которые он способен слышать от рождения. Соответственно, если голова слушателя расположена в таком же положении, как и голова манекена при записи (и на той же высоте), тогда будет получен лучший результат при прослушивании. Во всех остальных случаях будут возникать искажения звука как между ушами, так и между колонками. Необходимость расположения слушателя в sweet spot накладывает дополнительные ограничения и создает новые проблемы. Чем больше область sweet spot, тем большую свободу действий имеет слушатель. Поэтому разработчики постоянно ищут способы увеличить область действия sweet spot.
Частотная характеристика
Действие HRTF зависит от частоты звука; только звуки со значениями в пределах от 3 kHz до 10 kHz могут успешно интерпретироваться с помощью функций HRTF. Определение местоположения источников звука с частотой ниже 1 kHz основывается на определении времени задержки прибытия
разных по фазе сигналов, что позволяет определить общее расположение слева/справа источников звука и не помогает пространственному восприятию звучания. Восприятие звука с частотой выше 10 kHz почти полностью зависит от ушной раковины, поэтому не каждый слушатель может различать звуки с такой частотой. Определить местоположение источников звука с частотой от 1 kHz до 3 kHz очень сложно. Число ошибок при определении местоположения источников звука возрастает при снижении разницы между соотношениями амплитуд (чем выше пиковое значение амплитуды звукового сигнала, тем труднее определить местоположение источника). Поэтому надо использовать частоту дискретизации (вдвое большую значения частоты звука), соответствующей как минимум 22050 Hz при 16 бит для реальной действенности HRTF. Дискретизация 8 бит не обеспечивает достаточной разницы амплитуд (всего 256 вместо 65536), а частота 11025 Hz не обеспечивает приемлемой характеристики (так как максимальная частота звука соответствует 5512 Hz). Чтобы применение HRTF было эффективным, необходимо использовать частоту 22050 Hz при 16-битной дискретизации.
К чему мы идем?
Лучший метод воссоздания 3D-звука – использование минимальной частоты дискретизации 22050 Hz при 16 битах и использования дополнительных тыловых колонок при прослушивании. Такая платформа обеспечит пользователю реалистичное воспроизведение звука за счет воспроизведения через достаточное количество колонок (минимум три) для создания настоящего surround звучания. Преимущество такой конфигурации заключается в том, что когда слушатель поворачивает голову для фокусировки на звуке какого-либо объекта, пространственное расположение источников звука остается неизменным по отношению к окружающей среде, т. е. отсутствует проблема sweet spot.
Суть другого метода, который разработан Sensaura и называется MultiDrive, заключается в использовании HRTF функций на передней и на тыловой паре колонок (и больше) с применением алгоритмов CC. Sensaura называет алгоритмы СС– Transaural Cross-talk cancellation (TCC), заявляя, что они обеспечивают лучшие низкочастотные характеристики звука. Инженеры Sensaura взялись за решение проблемы восприятия звучания от источников звука, которые перемещаются по бокам от слушателя и по оси фронт/тыл. Sensaura для вычисления HRTF функций использует так называемое «цифровое ухо» (Digital Ear) и в их библиотеке уже хранится более 1 100 функций. Использование цифрового уха обеспечивает точное кодирование звука. Sensaura создает технологии, а использует интерфейс DS3D от Microsoft.
Технология MultiDrive воспроизводит звук с использованием HRTF функций через четыре или более колонок. Каждая пара колонок создает фронтальную и тыловую полусферу соответственно.
Фронтальные и тыловые звуковые поля специальным образом смещены с целью взаимного дополнения друг друга и за счет применения специальных алгоритмов улучшают ощущения фронтального/тылового расположения источников звука. В каждом звуковом поле применяется собственный алгоритм cross-talk cancellation (CC). Вокруг слушателя будет плавное воспроизведение звука от динамично перемещающихся источников до эффективного расположения тыловых виртуальных источников звука. Так как воспроизводимые звуковые поля основаны на применении HRTF функций, каждое из создаваемых sweet spot (мест с наилучшим восприятием звучания) способствует хорошему восприятию звучания от источников по сторонам от слушателя, а также от движущихся источников по оси фронт/тыл. Благодаря большому углу перекрытия результирующее место с наилучшим восприятием звука (sweet spot) покрывает область с гораздо большей площадью, чем конкурирующие четырехколоночные системы воспроизведения. В результате качество воспроизводимого 3D-звука существенно повышается.
Если бы не применялись алгоритмы cross-talk cancellation (CC), никакого позиционирования источников звука не происходило бы. Вследствие использования HRTF функций для технологии MultiDrive необходимо использовать алгоритмы CC для четырех колонок, требующие чудовищных вычислительных ресурсов. А значит, возникает возможность ошибки – это очень сложная задача, в некоторых системах применяются высокочастотные фильтры, которые срезают компоненты высокой частоты. Касательно технологии MultiDrive, Sensaura заявляет, что фирма применяет специальные фильтры собственной разработки, которые обеспечивают позиционирование источников звука, насыщенных высокочастотными компонентами, в тыловой полусфере. Главный минус подхода – это необходимость точного позиционирования тыловых колонок относительно фронтальных. В противном случае толка от HRTF на четырех колонках не будет.
Существуют и другие инновации Sensaura, а именно технологии ZoomFX и MacroFX, которые призваны улучшить восприятие трехмерного звука.
MacroFX
Большинство измерений HRTF производится в «дальнем» поле (far field), что существенным образом упрощает вычисления. Если источники звука располагаются на расстоянии до 1 метра от слушателя, т. е. в ближнем поле (near field), тогда функция HRTF неэффективна. Для воспроизведения звука от источников в ближнем поле с помощью HRTF функции и создана технология MacroFX. Идея в том, что алгоритмы MacroFX обеспечивают воспроизведение звуковых эффектов в near-field, в результате создается ощущение, что источник звука расположен очень близко к слушателю, так будто источник звука перемещается от колонок вплотную к голове слушателя, вплоть до шепота внутри уха слушателя. Достигается такой эффект за счет точного моделирования распространения звуковой энергии в трехмерном пространстве вокруг головы слушателя из всех позиций в пространстве и преобразования с помощью высокоэффективного алгоритма. При моделировании важна оптимизация уровней громкости и модифицированной системы расчета задержек по времени при восприятии звуковых волн от одного источника звука (ITD, Interaural Time Delay). Например, если источник звука находится посередине между ушами слушателя, то разница по времени при достижении звуковой волны обоих ушей будет минимальна, а вот если источник звука смещен вправо, эта разница будет существенной. Пока только MacroFX принимает разницу во внимание при расчете акустической модели. MacroFX предусматривает 6 зон, где зона 0 (это дистанция удаления) и зона 1 (режим удаления) будут работать точно так же, как работает дистанционная модель DS3D. Другие 4 зоны это и есть near field (ближнее поле), покрывающие левое ухо, правое ухо и пространство внутри головы слушателя.