El cambio climático es la principal prioridad de investigación de NSF Engineering Alliance

El cambio climático es la principal prioridad de investigación de NSF Engineering Alliance

Y, sin embargo, incluso ahora, después de 150 años de desarrollo, el sonido que escuchamos incluso de un sistema de audio de alta gama es muy inferior al que escuchamos cuando estamos físicamente presentes en una actuación de música en vivo. En tal evento, estamos en un campo de sonido natural y podemos percibir fácilmente que los sonidos de diferentes instrumentos provienen de diferentes lugares, incluso cuando el campo de sonido está entrecruzado con el sonido mezclado de múltiples instrumentos. Hay una razón por la cual la gente paga sumas considerables para escuchar música en vivo: es más agradable, emocionante y puede generar un mayor impacto emocional.

Hoy en día, los investigadores, las empresas y los empresarios, incluidos nosotros mismos, se están acercando por fin al audio grabado que realmente recrea un campo sonoro natural. El grupo incluye grandes empresas, como Apple y Sony, así como empresas más pequeñas, como
Creativo. Netflix reveló recientemente una asociación con Sennheiser bajo el cual la red ha comenzado a utilizar un nuevo sistema, Ambeo 2-Channel Spatial Audio, para realzar el realismo sonoro de programas de televisión como “Cosas extrañas” y “El brujo”.

Ahora hay al menos media docena de enfoques diferentes para producir audio altamente realista. Usamos el término “soundstage” para distinguir nuestro trabajo de otros formatos de audio, como los denominados audio espacial o audio inmersivo. Estos pueden representar el sonido con un efecto más espacial que el estéreo normal, pero normalmente no incluyen las señales detalladas de ubicación de la fuente de sonido que se necesitan para reproducir un campo de sonido realmente convincente.

Creemos que el escenario sonoro es el futuro de la grabación y reproducción de música. Pero antes de que se produzca una revolución tan radical, será necesario superar un enorme obstáculo: el de convertir de forma cómoda y económica las innumerables horas de grabaciones existentes, independientemente de si son sonido envolvente mono, estéreo o multicanal (5.1, 7.1 , y así). Nadie sabe exactamente cuántas canciones se han grabado, pero según la empresa de metadatos de entretenimiento Gracenote, más de 200 millones Las canciones grabadas están disponibles ahora en el planeta Tierra. Dado que la duración media de una canción es de unos 3 minutos, esto equivale a unos 1.100 años de música.

Después de separar un grabando en sus pistas componentes, el siguiente paso es remezclarlos en una grabación de sonido. Esto se logra mediante un procesador de señal de escenario sonoro. Este procesador de escenario sonoro realiza una función computacional compleja para generar las señales de salida que impulsan los altavoces y producen el audio del escenario sonoro. Las entradas al generador incluyen las pistas aisladas, las ubicaciones físicas de los altavoces y las ubicaciones deseadas del oyente y las fuentes de sonido en el campo de sonido recreado. Las salidas del procesador de sonido son señales multipista, una para cada canal, para controlar los múltiples altavoces.

El campo de sonido puede estar en un espacio físico, si es generado por parlantes, o en un espacio virtual, si es generado por audífonos o audífonos. La función realizada dentro del procesador de escenario sonoro se basa en la acústica computacional y la psicoacústica, y tiene en cuenta la propagación de ondas de sonido y la interferencia en el campo de sonido deseado y los HRTF para el oyente y el campo de sonido deseado.

Por ejemplo, si el oyente va a utilizar auriculares, el generador selecciona un conjunto de HRTF en función de la configuración de las ubicaciones de fuentes de sonido deseadas y, a continuación, utiliza las HRTF seleccionadas para filtrar las pistas de fuentes de sonido aisladas. Finalmente, el procesador de escenario de sonido combina todas las salidas HRTF para generar las pistas izquierda y derecha para auriculares. Si la música se va a reproducir en altavoces, se necesitan al menos dos, pero cuantos más altavoces, mejor será el campo sonoro. El número de fuentes de sonido en el campo de sonido recreado puede ser mayor o menor que el número de altavoces.

Lanzamos nuestra primera aplicación de escenario sonoro, para iPhone, en 2020. Permite a los oyentes configurar, escuchar y guardar música en el escenario sonoro en tiempo real; el procesamiento no provoca ningún retraso perceptible. La aplicación, llamada
Música 3D, convierte música estéreo de la biblioteca de música personal de un oyente, la nube o incluso la transmisión de música a un escenario sonoro en tiempo real. (Para karaoke, la aplicación puede eliminar voces o emitir cualquier instrumento aislado).

A principios de este año, abrimos un portal web,
3dsoundstage.com, que proporciona todas las funciones de la aplicación 3D Musica en la nube más una interfaz de programación de aplicaciones (API) que pone las funciones a disposición de los proveedores de música en tiempo real e incluso para los usuarios de cualquier navegador web popular. Cualquiera puede ahora escuchar música en audio de escenario en prácticamente cualquier dispositivo.

Cuando el sonido viaja a sus oídos, las características únicas de su cabeza (su forma física, la forma de sus oídos externo e interno, incluso la forma de sus cavidades nasales) cambian el espectro de audio del sonido original.

También desarrollamos versiones separadas del software 3D Soundstage para vehículos y sistemas y dispositivos de audio domésticos para recrear un campo de sonido 3D utilizando dos, cuatro o más altavoces. Más allá de la reproducción de música, tenemos grandes esperanzas puestas en esta tecnología en videoconferencia. Muchos de nosotros hemos tenido la fatigosa experiencia de asistir a videoconferencias en las que teníamos problemas para escuchar claramente a otros participantes o estábamos confundidos acerca de quién estaba hablando. Con Soundstage, el audio se puede configurar para que cada persona se escuche desde una ubicación distinta en una sala virtual. O simplemente se puede asignar la “ubicación” según la posición de la persona en la cuadrícula típica de Zoom y otras aplicaciones de videoconferencia. Para algunos, al menos, las videoconferencias serán menos fatigosas y el habla será más inteligible.

como audio movido de mono a estéreo, y de estéreo a sonido envolvente y espacial, ahora está comenzando a pasar al escenario sonoro. En esas épocas anteriores, los audiófilos evaluaban un sistema de sonido por su fidelidad, basándose en parámetros tales como ancho de banda,
distorsión armónica, resolución de datos, tiempo de respuesta, compresión de datos sin pérdida o con pérdida y otros factores relacionados con la señal. Ahora, el escenario sonoro se puede agregar como otra dimensión a la fidelidad del sonido y, nos atrevemos a decir, la más fundamental. Para los oídos humanos, el impacto del escenario sonoro, con sus señales espaciales y su inmediatez apasionante, es mucho más significativo que las mejoras incrementales en la fidelidad. Esta característica extraordinaria ofrece capacidades que antes estaban más allá de la experiencia incluso de los audiófilos más acaudalados.

La tecnología ha impulsado revoluciones anteriores en la industria del audio y ahora está lanzando otra. La inteligencia artificial, la realidad virtual y el procesamiento de señales digitales están recurriendo a la psicoacústica para brindarles a los entusiastas del audio capacidades que nunca antes habían tenido. Al mismo tiempo, estas tecnologías están brindando a las compañías discográficas y a los artistas nuevas herramientas que darán nueva vida a las grabaciones antiguas y abrirán nuevas vías para la creatividad. Por fin, se ha logrado el objetivo centenario de recrear de manera convincente los sonidos de la sala de conciertos.

Este artículo aparece en la edición impresa de octubre de 2022 como “Cómo el audio está recuperando su ritmo”.

De los artículos de su sitio

Artículos relacionados en la Web