28 de marzo de 2010

Mezclando 5.1 en Pro Tools - Primera Parte

Por Andres Mayo*
Quiero aprovechar este espacio para transmitirles algunos conocimientos sobre mezcla de audio en formato 5.1 que me parecen interesantes, porque no se encuentran en los libros sino que son sacados directamente de la experiencia. Usaré como ejemplo la mezcla del DVD “En vivo gira la vida”, del multipremiado artista argentino Jorge Rojas.

Es importante hacer algunas aclaraciones: este disco (a diferencia de muchos otros que se graban hoy en día) fue cuidadosamente planeado con el objetivo de realizar un DVD. Esto permitió que la toma de sonido se hiciera en muy buenas condiciones, contando con microfonía adecuada y con el tiempo necesario para las pruebas y ensayos previos.

El Ingeniero a cargo de la grabación (Sergio Chapur, mucho más conocido como El Turco) me entregó una sesión de Pro Tools sumamente prolija y completa, en la que él ya había invertido muchas horas de trabajo para pulir todos los detalles inevitables de cualquier grabación en vivo. El otro detalle sorprendente de este disco es que carece de desafinaciones, y no porque se hayan regrabado las voces, sino porque se trata de un cantante excepcional con una producción de voces muy cuidada tanto para la voz líder como para los coros. Este hecho también simplificó muchísimo la etapa de post-producción, ya que las voces tienen siempre el mismo “color” y suenan realmente naturales a lo largo de todo el disco.

Para comenzar esta mezcla 5.1, tomamos como punto de partida la sesión de mezcla stereo original con todas las pistas abiertas, es decir sin “bounces” ni submezclas de ningún tipo. Esta es una forma de hacerlo que lleva un poco más de tiempo pero asegura un resultado óptimo en cuanto a la “traducción” que se hace al formato 5.1. Muchas veces la mezcla 5.1 se toma como un simple transfer en el cual se envía a las cajas traseras (Surround Left & Right) aproximadamente el mismo contenido que en las cajas frontales (Front Left & Right), simplemente agregándole una dosis de reverb y los aplausos del público.

En mi opinión, esa es una forma demasiado elemental de buscar un resultado sencillo y muy poco sorprendente. Creo que la única razón de existencia del sonido surround es la de poder envolver al oyente con el mayor grado de “hipnosis acústica” posible. No me parece tan necesario el hiper-realismo como sí el conservar y si es posible intensificar la sensación de captura que permite este formato. Quiero decir que si logramos que el oyente quiera volver a escuchar el disco para sentir nuevamente esa sensación de estar “atrapado” por la música, entonces la mezcla 5.1 cumple su cometido. Si en cambio lo único que aporta el surround es un “falso doblaje” en las cajas traseras, lo más probable es que el espectador se canse rápidamente y prefiera la versión stereo original, mucho más rica en detalles y también más limpia.

Algunas consideraciones importantes antes de comenzar la mezcla están relacionadas con la capacidad de DSP de nuestro sistema. Esto es válido para cualquier plataforma de audio profesional; en el caso particular de que trabajemos en un sistema Pro Tools, la herramienta que deberemos consultar con mucha frecuencia es la denominada System Usage, que entrega datos fundamentales como el porcentaje de utilización de cada uno de los chips de DSP (circuitos integrados dedicados exclusivamente a Digital Signal Processing), la cantidad de voces que utliza nuestra mezcla, el porcentaje de ocupación de recursos de nuestra CPU, etc.

Intencionalmente voy a referirme al caso en que tengamos recursos de DSP relativamente escasos, porque es el más complejo de resolver. Cuando la mezcla comienza a complicarse, un sistema Pro Tools en su configuración básica (HD1 Accel) puede resultar poco. La cantidad de plug-ins que normalmente se utilizan para poner a punto todos los detalles (compresores, ecualizadores, de-essers, etc) va consumiendo recursos de nuestro sistema rápidamente.

Particularmente hay que tener cuidado con el uso de plug-ins descargados de Internet o “crackeados” porque cada uno puede llegar a consumir un chip de DSP entero, anulándolo por completo para otras funciones.

Aquí es donde tenemos que tener claras las diferencias entre los distintos tipos de plug-ins que ofrece el Pro Tools. Básicamente son dos familias, TDM y RTAS, con diferencias esenciales de arquitectura: mientras que los plug-ins TDM hacen uso de los chips de DSP, los RTAS son comandados directamente por el microprocesador o CPU. Por lo tanto los TDM operarán siempre bajo una arquitectura de 48 bits de punto fijo, provista por los chips dedicados de DSP, que garantiza alta capacidad de resolución de algoritmos complejos.

Lógicamente, como punto en contra, cada plug-in TDM consume un porcentaje de nuestros recursos DSP disponibles, variable según la complejidad del algoritmo. En cambio, un plug-in de la familia RTAS no tiene garantizado un rendimiento estable, sino que depende enteramente de la ocupación de la CPU en cada momento. En una máquina poderosa (por ejemplo una G5 Dual Core PCI Xpress, con arquitectura de 64 bits de punto flotante), los recursos de DSP aportados por el CPU pueden equivaler a dos chips dedicados en un determinado momento, pero se pueden reducir al 60% en momentos de mucha ocupación del microprocesador. Precisamente, el punto flotante es el que le permite al CPU asignar recursos variables a cada tarea de acuerdo con su complejidad y con la superposición de actividades de cada momento. Sin embargo, como punto a favor, los plug-ins RTAS pueden ser nuestra solución de compromiso cuando nos estamos quedando cortos de recursos DSP en nuestro sistema Pro Tools.

Sobre todo si no disponemos de un sistema con demasiada capacidad de procesamiento, hay que cuidar de no malgastar la ocupación de las voces: tengamos en cuenta que un track conteniendo audio ocupa una voz, aún cuando el track esté por momentos en silencio. Resulta práctico entonces observar la asignación dinámica de las voces y recortar sólo las porciones de audio válido, eliminando los silencios para dar lugar a que otra voz ocupe este lugar. En Pro Tools, la asignación dinámica se realiza siempre en orden de aparición de las voces, de arriba hacia abajo.

Es fundamental también, antes de comenzar a trabajar, poner en claro qué presentación le vamos a dar a la nueva mezcla, es decir cómo vamos a organizar la espacialización de los distintos elementos de ésta. Mi criterio más común a la hora de elegir la presentación de una mezcla 5.1 es que los canales L y R frontales deben contener una mezcla autónoma, que sea entendible aún si quitamos todas las demás cajas.

Por ejemplo, considero un error derivar la voz del cantante únicamente al canal Central, porque es el que más posibilidades tiene de estar mal colocado en el Home Theatre del espectador, ya sea por ignorancia o simplemente por imposibilidad, ya que el lugar destinado a esa caja suele ser el del televisor.

Por lo tanto, si hacemos que nuestra mezcla 5.1 sea excesivamente “centro-dependiente” vamos a oír cómo el stereo frontal se corre para un costado cuando la caja C no está exactamente en el medio de las L y R. También me parece problemático dejar la voz como único elemento en el C, sin instrumentos que la acompañen, porque pone demasiado en evidencia los problemas de la toma en vivo: ruidos, compuertas y posibles desafinaciones. Siempre recomiendo “abrigar” un poco la voz haciendo una pequeña mezcla mono de varios instrumentos, aunque no exactamente en la proporción en que lo haríamos para una mezcla mono real.
Por ejemplo,
la voz y la tarola tienen que sobresalir un poco para ganar presencia en el frente. En mi concepto, si la mezcla stereo suena razonablemente bien en las cajas L y R, sin elementos que le falten por completo, entonces el canal C debería aportar entre un 10% y un 20% de presencia al stereo, es decir que deberemos notar la ausencia pero tampoco tiene que desintegrarse la mezcla si el C no está o está mal colocado.

Muchos DVD musicales tienen la voz pura colocada en el centro y no asignada a L y R (caso de James Taylor) pero hay por lo menos dos explicaciones váliidas para esto: en primer lugar se trata de un DVD creado para el mercado norteamericano, en donde el porcentaje de Home Theatres correctamente instalados es muy superior al de América Latina y en segundo lugar la calidad de grabación de la voz en ese DVD es tan excepcionalmente buena que no existe ninguno de los problemas mencionados, que sí son comunes en la enorme mayoría de nuestras grabaciones. Con respecto al canal LFE, prefiero que no esté activo todo el tiempo sino que sea un elemento de refuerzo del color del bajo y kick o de algún efecto de sonido. Idénticamente a lo comentado con relación al canal Central, el peso de la mezcla no debería desaparecer si no tenemos instalado el sub-woofer en nuestro sistema de reproducción hogareño.

A partir de la definición de estos lineamientos, urge la necesidad de crear buses a medida (5.1, 5.0, LCR, stereo y mono). El bus 5.0 no incluye al sub-woofer y es principalmente utilizado para las voces y otros instrumentos que no contienen presencia de frecuencias sub graves. Sería un error enviar todo el contenido de la mezcla al canal LFE, porque éste no está capacitado para reproducirla y sólo lograremos incrementar el contenido de armónicos en el sub-woofer, resultado absolutamente indeseado porque de esa manera favorecemos la localización de las frecuencias graves. Recordemos que todo el sistema 5.1 se basa en que el refuerzo de graves proviene de una sola fuente emisora (el sub-woofer) y que éstos serán percibidos como omnidireccionales en tanto su frecuencia sea suficientemente baja. Cuando la frecuencia emitida por el sub-woofer supera cierto límite, el cerebro comienza a ser capaz de discriminar la dirección desde donde proviene esa información y por lo tanto todo el concepto de graves envolventes se pierde porque nos damos cuenta que en realidad vienen desde un único punto emisor.

Por lo general organizo la mezcla con algunos elementos estáticos y otros de paneo activo. No suelo utilizar el paneo de instrumentos en forma excesivamente variable, porque tiende a confundir y la mezcla se vuelve incoherente. Si se trata de efectos especiales entonces sí, toda la creatividad que se pueda poner al servicio de la mezcla tenderá a realzar el efecto, sin perjuicio de la coherencia.

Como típicos elementos estáticos de una mezcla de pop/rock, la batería es tratada en forma muy similar a una mezcla stereo convencional, asignando todos los tracks que la componen (Overheads, Ride, HiHat, Snare, Toms, Kick, etc) a un bus stereo que se recoge en un auxiliar y se envía de manera uniforme al paneo standard, con algunas salvedades: El Kick, cuyo nivel nos interesa controlar particularmente, tiene un doble envío en su salida: por un lado va a un auxiliar (Kick Level) que nos permite un ajuste fino y automatización de nivel y simultáneamente va a otro auxiliar que recibe todos los envíos al canal Central (C Sends).

Esta asignación doble nos da mayor facilidad de control sobre la presencia del Kick en los canales L, C y R. Puede hacersede muchas maneras diferentes, lo importante es que tengamos siempre disponible una opción de control sobre este parámetro,dado que es de mucha relevancia en el balance de las cajas frontales. También, por supuesto, hay que asignar el Kick al canal LFE (sub-woofer) pero este tema y muchos otros serán tratados en la segunda parte de esta nota. Hasta entonces!!

* Ingeniero de Mastering y realizador de DVD musicales. Es reconocido en Argentina por sus trabajos de masterización stereo y 5.1. Es Vicepresidente de A.E.S. Región América Latina. Contacto: aam@aes.org

0 comentarios: