• Hits: 31938

El nuevo sonido digital. Lo que vamos a oír.

Ratio: 5 / 5

Inicio activadoInicio activadoInicio activadoInicio activadoInicio activado
 

Dado lo mucho que se ha hablado ya de los nuevos formatos digitales, vamos a dar una vuelta de tuerca más en lo que se refiere al audio en dichos sistemas.

Texto: Redacción

Para hablar de sonido en HD, vamos a centrarnos en los últimos formatos que han aparecido en el mercado, y que pensamos que por su vigencia y cotas de calidad alcanzadas son del máximo interés para nuestros lectores. Estamos hablando del Dolby True HD y DTS HD Master Audio (en adelante, DTS HD MA).

Empecemos por hacer un repaso al funcionamiento de ambos sistemas.

En esencia, Dolby True HD es un formato digital de reproducción de sonido desarrollado por Dolby que permite hasta ocho canales de audio, en disposición 7.1, aunque en realidad tiene capacidad hasta 14. Utiliza una variante de la tecnología de codificación sin pérdidas, MLP (Meridian Lossless Packing), ofreciendo una reproducción idéntica, de ahí lo de True, bit a bit al master original de estudio. Es flexible en la estructura de los frames, Velocidad de Bits Variable (VBR), codificando a 24 bits/ 96 Khz, dando una transmisión de 18 Mbits/s, aunque es capaz de soportar 24 bits/192 Khz (para aplicaciones estéreo). El ratio de codificación es aproximadamente de 4:1. De esta manera, aumenta la capacidad de los metadatos. Utiliza la interfaz HDMI 1.3 para la transmisión de señal entre reproductor y amplificador.

En lo que se refiere al DTS HD MA, utiliza también una variante de la codificación MLP, la Coherent Acoustics plus HD Bit-for-bit Extensions, siendo el ratio variable de transmisión desde los 1,5 hasta los 24 Mbits/s. Las siglas MA provienen de Master Audio, es decir, igual al original de audio grabado en el estudio, en similitud con True de Dolby. Gracias a los metadatos, incluye la posibilidad de tener hasta siete diferentes capas de configuración de los altavoces, dependiendo de lo grabado. Posee también 7.1 canales de audio a 24 bits/ 96 Khz. Utiliza la misma interfaz que el Dolby True HD.

Veamos ahora las principales diferencias entre los dos formatos. Ambos sistemas se basan en el mismo tipo de codificación, MLP, pero con sus variantes según el fabricante. Dado el mayor número de bits de transmisión, parece ser de mayor calidad el DTS-HD MA, sin embargo, se ha impuesto en el mercado mayoritariamente el sistema Dolby True HD.

Veamos ahora las posibilidades de conexión que nos ofrecen estos formatos.

En el primer caso, el reproductor Blu-ray decodifica al formato PCM Digital Multicanal y transmite dicha señal a través de una conexión HDMI 1.1 o superior. Para ello, tanto el lector como el receptor A/V tienen que disponer de conexión HDMI lógicamente, y ésta debe ser la misma en ambos dispositivos.

La segunda opción es que la fuente HD convierta de digital a analógico la señal PCM multicanal obtenida anteriormente, y la transmita al amplificador a través de las salidas RCA. Se requiere que tanto la fuente como el amplificador tengan entradas analógicas multicanal.

Por último, podemos hacer que el reproductor transmita la señal de audio de alta resolución directamente por la conexión HDMI y que sea el amplificador el encargado de decodificarla. En este caso, necesitamos que tanto el lector como el receptor dispongan de conexión HDMI 1.3, ya que esta versión es la única en la que está habilitada la transmisión de datos Dolby True HD como DTS HD MA, debido a la gran cantidad de información a soportar.

Hablemos ahora de los metadatos, cuya importancia es trascendental en estos formatos, y cuya relevancia aún no ha sido mostrada con la suficiente precisión.

Básicamente, es un conjunto de bits predefinidos que contiene instrucciones para el decodificador. Son datos que no incluyen audio, pero sí instrucciones sobre, por ejemplo, normalización de diálogos o para el control del rango dinámico.

En el pasado, los productores que trabajaban con audio multicanal tenían problemas con las bandas sonoras cuyo volumen estaba muy por encima o por debajo del resto de la emisión. Era algo frecuente cuando el contenido surround se retransmitía desde estudios de TV con salidas de sonido mono o estéreo. Con el Dolby Digital, los ingenieros pueden mezclar contenido de audio de manera independiente para varios sistemas y niveles de reproducción. Así se puede crear una señal más consistente y de esta forma garantizar la presencia de los contenidos más importantes. Los metadatos se añaden durante la fase de producción o postproducción.

De esta manera, proporcionan un número de parámetros clave que se utilizan específicamente para modificar el sonido de la emisión adaptada al entorno de escucha específico del espectador. Son conocidos como nivel de diálogo (también llamado normalización de diálogo o dialnorm), control de rango dinámico y downmixing. Aunque técnicamente no es un parámetro individual de metadatos, éste último se efectúa en el decodificador del espectador a través de parámetros específicos, como sucede con los otros dos. Hay que tener especial precaución en monitorizar y seleccionar los parámetros de los metadatos que lo hacen. El ingeniero de sonido es el responsable último de optimizar la mezcla multicanal para la mejor reproducción posible en un entorno de escucha perfecto. Sin embargo, también hay que vigilarla en los entornos menos preparados. Por el contrario, disfrutar de un programa de televisión no debería estar limitado sólo a aquellos consumidores con sistemas cine en casa completos. Dolby Digital y los metadatos se combinan para proporcionar un método sencillo y fácil de usar que garantice una reproducción de la mejor calidad sin tener en cuenta el número de canales, el nivel de ruido ambiente o la calidad del equipo del consumidor. Veamos ahora los distintos parámetros de los metadatos uno por uno:

Nivel de diálogo

Proporciona un valor de normalización al decodificador doméstico. Éste disminuye el volumen a una señal preestablecida, que se ajusta dependiendo de los programas y contenidos. Su presencia es crucial para su uso en los decodificadores, y proporciona tres funciones principales:

- Durante la producción de audio para DTV, el mezclador ajusta el nivel de grabación de audio al de la representación escénica. En la postproducción televisiva, este nivel permite distintos contenidos (publicidad, informativos, sitcoms, etc.) intercalados mientras se mantiene el mismo volumen en los hogares.

- Los requerimientos para los consumidores para el disfrute del audio multicanal varían extraordinariamente. Por ejemplo, no todo el mundo que ve DTV lo escucha en un entorno multicanal. Hay que tener en cuenta que cada espectador procederá con lo que considere razonable para sus oídos, dentro de su propio sistema. De manera adicional a la coincidencia de nivel entre diferentes programas y medios, el de diálogo proporciona el beneficio de convertirse en una suerte de medida de protección contra el clipping digital, disminuyendo el volumen general en un porcentaje muy bajo, y proporcionando algo similar a un “volumen maestro”.

- Un valor adecuado del dialnorm proporciona la “banda nula” en el perfil de rango dinámico donde el nivel de audio no es incrementado ni disminuido. Sin el dialnorm, los rangos dinámicos reducidos podrían no funcionar correctamente.

El término normalización de diálogo fue desarrollado por la industria del cine. Las películas son mezcladas con este parámetro en un nivel específico, y el resto de elementos de audio están subordinados a los diálogos. Además, en el mundo del cine, se reproduce por el canal central, proporcionando al técnico de sonido un medio muy sencillo para medir este nivel. Simplemente, mide la salida del canal central y se asegura que la conversación procedente de este canal no está enmascarada por la música o los efectos de sonido.

Esto no significa que el dialnorm solamente sea un parámetro válido para los diálogos. En las producciones estrictamente musicales, este parámetro puede ser descrito como el volumen medio principal del programa.

El nivel de diálogo es, en su forma más sencilla, como disminuir el volumen en un equipo doméstico. Sin embargo, simplemente ajustando el volumen en un conjunto estéreo no tenemos las otras ventajas que nos proporciona el nivel de diálogo, por ejemplo la reducción dinámica del rango en las condiciones de escucha, compresión ajustada y musicalmente dinámica, y la extensión virtual headroom prioritaria a la circuitería digital analógica.

El nivel de diálogo en un decodificador Dolby Digital correctamente instalado no debe ser modificado. Eso no implica ninguna compresión o expansión en el material del programa, sino que sencillamente disminuye el volumen de audio a un nivel estandarizado.

Rango de control dinámico

El rango de control dinámico (también conocido como compresión dinámica de rango o modo medianoche) proporciona al espectador la flexibilidad de escuchar un programa de audio con un rango dinámico reducido. La compresión permite a los espectadores ver la TV sin molestar a los vecinos. Este control es opcional y se puede desconectar en muchos decodificadores Dolby Digital.

El rango de control dinámico en el flujo de datos Dolby Digital consta de dos parámetros o perfiles: el modo RF y el modo Línea. Estos dos parámetros no modifican el contenido de sonido codificado en el flujo de audio. Se utilizan para ajustar los extremos del material de emisión en el entorno de escucha para aquellas estancias en las que es preferible o necesario oír el programa con un rango dinámico reducido.

El modo RF está diseñado para situaciones de límite de pico, donde el programa decodificado se emite a través de una entrada RF en una televisión, como si fuera a través de una salida de antena de un equipo de sobremesa. El perfil RF también se utiliza en los decodificadores, lo que garantiza que la compresión de rango dinámico en una película de acción no despertará a los vecinos (de ahí lo de modo medianoche).

El modo Línea proporciona un tipo más ligero de compresión, y además permite el ajuste del usuario en las explosiones de los niveles más bajos y más altos de los parámetros de un decodificador doméstico, pudiendo el espectador personalizar la reproducción de audio a su entorno de escucha específico.

A volúmenes bajos, los silbidos o diálogos en susurros son más complicados de oír. Sin embargo, si el espectador aumenta el volumen, los tonos más graves (explosiones, disparos) se convierten en demasiado fuertes para una audición cómoda.

Cuando los perfiles del rango dinámico están incluidos en el decodificador, éste incrementa el nivel de los volúmenes más suaves del programa, mientras disminuye el de los tonos más agudos, permitiendo al usuario disfrutar de la película sin tener que estar constantemente pendiente del control de volumen. Una vez más, esta habilidad para escalar la cantidad de compresión sólo se aplica al perfil modo Línea, y depende del nivel de personalización de que disponga el usuario en su decodificador.

El downmixing es una característica del Dolby Digital que permite a un programa multicanal ser reproducido a través de menos altavoces. Dicho de una manera mucho más sencilla, permite disfrutar de una emisión de TV digital sin requerir una instalación multicanal 5.1.

Igual que en la mezcla estéreo, donde es monitorizada en mono para mantener la compatibilidad, la mezcla de audio multicanal requiere al ingeniero referenciarla con menos canales para establecer la compatibilidad en situaciones de downmixing. En este caso, los metadatos permiten al Dolby Digital ser una tecnología “de igualdad de oportunidades”, de modo que todos aquellos espectadores que reciben un flujo de datos en Dolby Digital podrán disfrutar de la mejor reproducción de audio posible, independientemente del número de canales de un sistema.

Los equipos para televisión digital terrestre, de cable o satélite, normalmente ofrecerán una señal mono en la salida RF/antena, una señal de línea estéreo analógica y una salida digital coaxial y óptica para convertir el flujo Dolby Digital a un decodificador.

Las señales estéreo analógicas que salen desde estas unidades normalmente hacen el downmix interno de la señal de audio original multicanal Dolby Digital. Esta salida analógica puede ser uno de los dos tipos de señal estéreo. Uno es la Rt Lt estéreo compatible downmix, disponible para Dolby Surround Pro Logic. El otro tipo es un downmix estéreo sencillo Lo/Ro, disponible para grabaciones en un estéreo hifi o vía auriculares.

Durante el downmixing, los ajustes de los parámetros de control del rango dinámico están limitados, y no es diferente cuando se utilizan las señales presentes en el estéreo de las salidas RF/antena.

Sabemos que hemos ido un paso más adelante en la información ya de por sí técnica que ofrecemos. La trascendencia, hasta ahora poco tratada, de los metadatos así nos ha obligado a hacerlo. Su importancia en el desarrollo de los nuevos formatos de audio digital es máxima, en palabras de acreditados ingenieros de sonido. Además, son el principio de todo lo que pueda venir en el futuro, sobre el que, como siempre, les mantendremos al corriente.