longe vai
longe vai

O que está acontecendo?

20/02/2015

Mixando com fones de ouvido

O que usar e como fazer

Sujeito usando fones

Às vezes no homestudio é preciso trabalhar usando fones de ouvido (headphones), mesmo durante a mixagem. Então, qual fone deve ser usado e como obter melhores resultados?

Em algum momento, todos recorremos aos fones quando tentamos avaliar uma mix. Existem inúmeras ocasiões em que tal prática é necessária: trabalhando tarde da noite, quando usar monitores causa incomodo, ou mesmo gravando com equipamentos portáteis, o que torna impraticável o uso de amplificação. Pode ser que a sala de mixagem tenha acústica deficiente ou que não estejamos familiarizados com o equipamento de monitoração disponível, e não confiemos ou não podemos confiar no que ouvimos através dele. Também podemos estar gravando na mesma sala em que estamos monitorando e, novamente, alto-falantes devem ser evitados. Seja qual for a razão, trabalhar com fones de ouvido é uma prática comum. Neste artigo, vou versar um pouco sobre as técnicas que podem fazer o uso de fones mais confiável e produtivo.

Os prós e contras de mixar usando fones de ouvido

A primeira coisa a se dizer é que, de modo geral, monitorar com fones de ouvido é quase sempre apenas a “segunda melhor” opção. A grande maioria das gravações sonoras é destinada a ser ouvida via alto-falantes e isso é importante para entender esse fato. As diferenças simples de amplitude que codificamos no nosso sinal estéreo para fornecer informação de posição (usando o famoso botão de pan — panorama) criam uma impressão verossímil de posicionamento espacial apenas quando se faz uma audição através de um par de alto-falantes corretamente posicionados.

monitores
Ouvir com alto-falantes é diferente de ouvir com fones, não só porque cada canal não chega ao ouvido oposto, mas também porque há uma importante contribuição dada pelo som refletido que chega de diferentes ângulos.

O modo como nossos ouvidos interpretam os sons vindos dos alto-falantes é intrinsecamente muito diferente do que é interpretado dos sons de um par de fones de ouvido simples. Estereofonia é uma ilusão auditiva — assim como assistir 25 imagens estáticas por segundo em rápida sucessão cria a ilusão de movimento natural. Ao escutar um alto-falante, seu som direto chega em ambas as orelhas, e se ele estiver posicionado mais perto de um determinado lado (o alto-falante esquerdo, por exemplo) seu som chegará primeiro ao ouvido mais próximo. As diferenças fixas de tempo de chegada para cada orelha se combinam com as diferenças na variação de amplitude codificada entre os canais do áudio estéreo, e enganam nosso senso de audição levando-nos a perceber diferentes tempos de chegada para cada som reproduzido como vindos de direções distintas.

Ouvir com fones de ouvido funciona de um modo totalmente diferente. Nos fones, cada orelha ouve apenas o som de seu próprio fone — não há caminho natural em que o som do fone esquerdo chegue a orelha direita, por exemplo. Como resultado, as diferenças de amplitude definidas entre os canais esquerdo e direito não criam as diferenças de tempo de chegada necessários. A consequência é que a maioria de nós percebe os sons como vindos de dentro de nossas cabeças, espaçadas numa linha que vai de orelha a orelha.

Existem alguns sistemas que tentam contornar essa deficiência ao introduzir os efeitos de diafonia inerentes aos alto-falantes. No entanto, emular um ambiente de audição com alto-falantes é mais complexo do que simplesmente vazar um pouco de cada canal para o fone oposto. A diafonia precisa ter um atraso (delay) numa quantidade de tempo adequada e modelada espectralmente para refletir os artefatos acústicos naturais introduzidos quando o som passa pela cabeça humana. Essa combinação de processamento é muitas vezes referida como “funções de transferência relativas à cabeça” (head-related transfer functions ou HRTF), mas eu não tenho conhecimento de quaisquer exemplos comerciais que funcionem bem o suficiente para serem usados em mixagens precisas. Dito isto, o sofisticado processamento digital de sinais de convolução tem muito a oferecer nesse contexto, e ao menos um sistema experimental extremamente promissor vem sendo desenvolvido, como descrito no box “simulador de sala binaural”.

O resultado é que, se quisermos usar fones de ouvido para monitoração crítica, temos que aprender a interpretar o que se ouve através deles e relacionar isso aos efeitos obtidos por alto-falantes convencionais.

Mixagem surround em fones de ouvido: Desenvolvendo um simulador de sala binaural

Se mixar estéreo em fones de ouvido é suficientemente difícil, como poderemos então desejar uma mixagem surround? Bem, há uma solução mas atualmente é impraticavelmente cara e continua sendo um projeto em desenvolvimento. O German Research Institute, o IRT e a Studer codesenvolveram um simulador de sala binaural (BRS). Essencialmente, um par de fones de ouvido estéreo muito precisos equipado com um sensor de posicionamento que informa ao equipamento o que o operador está "vendo". Este é um dos elementos mais caros do sistema atualmente, mas é crucial para sua eficácia.

O sistema envolve dois estágios separados — fase de programação e fase de reprodução. Na fase de programação, um sistema de microfones binaural em formato de cabeça (como o Neumann KU100) é colocado na posição ideal de audição de uma sala de monitoramento real. Sinais de impulsos de teste especiais são reproduzidos nos alto-falantes um de cada vez e os sinais captados pelos dois microfones das orelhas da cabeça são armazenados para análise posterior. Esse processo é repetido com a cabeça sendo rotacionada cerca de cinco graus por vez, num total de mais ou menos 45 graus. Os dados armazenados são então traduzidos para diagramas de convolução altamente detalhados, mostrando como a sala de monitoramento específica reage para cada canal de som surround.

A fase de reprodução utiliza esses dados de convolução para processar cada um dos sinais de entrada do canal surround para gerar o campo de som estéreo binaural correspondente, e todos os campos de som binaural de cada canal são combinados antes de serem reproduzidos nos fones estéreo. O sensor de posição nos fones de ouvido diz aos processadores de convolução qual determinado conjunto de dados utilizar, de modo que, conforme o usuário move sua cabeça, os dados de convolução correspondentes são aplicados, e o som percebido permanece estacionário para o ouvinte, assim como seria na vida real. Embora isso tudo adicione uma quantidade enorme de complexidade extra ao sistema, é um requisito essencial para que a ilusão de ouvir um sistema de monitoração surround verdadeiro funcione de forma confiável.

A enorme quantidade de poder de processamento necessário para convoluir seis canais de áudio com precisão e definição suficientes para o monitoramento de alta qualidade, faz esse modelo demasiado caro para uma aplicação comercial viável atualmente, mas algumas unidades de teste foram construídas e eu fui sortudo em ter acesso a uma delas. Embora tenha sido possível identificar pequenos defeitos na qualidade de áudio do protótipo em que fiz o teste, sua capacidade de retratar um exemplo totalmente crível e estável de som surround foi incrível e claramente esta técnica tem muito a oferecer nos próximos anos.

Parece que seu mais recente teste prático foi a transmissão do concerto do Dia de Ano Novo de Viena no início deste ano. A emissora estatal ORF, decidiu lançar um novo serviço de transmissão de som surround com este evento. Como a sala de controle de som do seu caminhão Outside Broadcast era pequena demais para criar um monitoramento de som surround adequado, o engenheiro de mixagem obteve sucesso ao utilizar o sistema Studer BRS experimental durante os ensaios para estabelecer a mixagem em surround.

Esta é certamente uma tecnologia a ser acompanhada. Como o custo do processamento digital de sinais continua a cair, ela vai tornar-se brevemente uma tendência comercial mais viável, seja para aplicações de som estéreo ou surround. Quando isso acontecer, o monitoramento com fones repentinamente se tornará muito mais preciso e confiável do que através de alto-falantes convencionais, para aqueles de nós que dependem de salas de monitoramento com acústica imperfeita. Afinal de contas, o sistema pode ser programado com dados convolucionais recolhidos a partir de uma ou mais das melhores salas de monitoramento de estúdio do planeta, que todos poderíamos compartilhar então no conforto de nossos estúdios caseiros!

Diferenças entre fones de ouvido e monitores

A diferença mais óbvia entre monitoramento via fones de ouvido e alto-falantes é a impressão de posicionamento estéreo, assumindo o uso convencional de técnicas de diferença de amplitude via pan. Se usarmos um dos sistemas mais complexos que envolvem diferenças de tempo de chegada e até mesmo HRTF (algo que só é praticável em alguns consoles digitais high-end), então a imagem sonora será traduzida mais facilmente. No geral, porém, quando se ouve via fones, a imagem espacial percebida fica espalhada ao longo de uma linha entre as orelhas, dentro da cabeça. Nós todos nos acostumamos facilmente com isso, mas o verdadeiro problema é que a linearidade das proporções de panorama sonoro é bastante diferente daquela experimentada em alto-falantes. Não há jeito simples de se adaptar a esta outra que não através de experiência construída.

Regulagens de pan são particularmente muito difíceis de se julgar usando fones de ouvido, por isso é importante comparar as suas percepções nos fones com o resultado nos alto-falantes, a fim de ganhar experiência.
Regulagens de pan são particularmente muito difíceis de se julgar usando fones de ouvido, por isso é importante comparar as suas percepções nos fones com o resultado nos alto-falantes, a fim de ganhar experiência.

É preciso um tempo considerável para ser capaz de se julgar valores de pan usando fones de ouvido. Não é impossível de se fazer, mas é muito difícil. Para ser honesto, eu acho que a maioria de nós provavelmente confia mais em nossos olhos quando a mixagem é feita usando fones, observando as posições dos botões de pan visualmente em vez de analisar com os ouvidos, como seria quando monitoramos em alto-falantes. Claro, pans extremos não são o problema — o “miolo” é que é vago e difícil de mesclar com precisão. Mesmo decidir sobre uma posição precisa no centro pode se mostrar difícil para algumas pessoas!

O truque é praticar primeiro com uma única pista (melhor usar um sinal mono com um amplo espectro de frequência) e comparar a posição que você percebe quando monitorando com fones de ouvido com a posição percebida em alto-falantes. Uma vez que você se acostume a forma como essas duas coisas se relacionam, então você pode relacioná-las com a característica de pan específica do mixer que você está usando — essas características variarão em diferentes equipamentos.

Outra grande diferença entre monitorar com fones de ouvido e alto-falantes é a forma como o cérebro processa a informação que recebe através das orelhas. Com o monitoramento dos alto-falantes, por ambas as orelhas ouvirem ambas as fontes, o cérebro processa a informação que recebe em conjunto e aplica uma espécie de máscara estéreo. Por sua vez, quando ouvindo com fones, o cérebro processa os dados de uma maneira completamente diferente, tratando as informações de cada orelha independentemente, desconstruindo a imagem estéreo. O resultado é que certos elementos e mudanças abruptas na mix, que podem ser inaudíveis quando ouvidas em alto-falantes, se tornam claramente nítidas em fones de ouvido. E às vezes o inverso também acontece.

Por fim, a ausência evidente de qualquer impacto físico (ou “vibração” para os mais refinados) dos sinais de baixa frequência pode criar a impressão de que falta alguma coisa no resultado da mix — e isso pode ser agravado pelas características bastantes estranhas das frequências graves em alguns fones de ouvido.

Usando fones de ouvido com segurança

Obviamente, ouvir sons altos durante longos períodos não é uma boa ideia porque dano auditivo é cumulativo e pode ser permanente. Para piorar a situação, quanto melhor o equipamento de monitoramento (em outras palavras, quanto menores os níveis de distorção), mais silencioso ele parece ser, e por isso é mais fácil terminar ouvindo em níveis perigosamente elevados. Com alto-falantes, mesmo os realmente bons, você tende a saber quando está ficando muito alto porque seus órgãos internos começam a vibrar a cada batida do bumbo, coisas começam a cair da mesa e os vizinhos chamam a polícia! Nenhum desses efeitos colaterais acontece quando se usa fones de ouvido, e até mesmo o sangue jorrando dos tímpanos rompidos fica escondido pelas almofadas dos fones! (Estou brincando. O sangue vai pingar, não jorrar…)

A Canford Audio não apenas vende uma variedade de diferentes modelos de limitadores para fones de ouvido, mas também oferece serviço de montagem de limitadores passivos tipo BBC para pares de fones individuais.
A Canford Audio não apenas vende uma variedade de diferentes modelos de limitadores para fones de ouvido, mas também oferece serviço de montagem de limitadores passivos tipo BBC para pares de fones individuais.

O ponto é que você precisa ter cuidado extra ao usar fones de ouvido. A fonte de som está muito próxima, você pode ficar tentado a ouvir em volume alto para minimizar o ruído ambiente e não vai sentir os efeitos físicos causados por níveis elevados de som, o que pode, por sua vez, inconscientemente incentivá-lo a elevar o nível ainda mais. Com o tipo de amplificação de saída de fones da maioria dos equipamentos atuais, combinado com o uso de fones de baixa impedância, é muito fácil gerar níveis perigosamente elevados.

Naturalmente um grau mínimo de bom senso é necessário, mas como a percepção humana é facilmente enganada, eu recomendo pausas de cinco ou dez minutos a cada meia hora ou menos para descansar as orelhas e reestabelecer um nível de referência sensata. Vá preparar uma xícara de chá ou tomar um ar fresco — o que for preciso para sair do estúdio por um tempo e deixar as orelhas se recuperarem. Se, quando você voltar, o volume dos fones parecer alto demais, tome isso como um sinal: você está exagerando e corre o risco de sofrer danos auditivos! Obviamente haverá momentos, especialmente se você estiver editando faixas de áudio, em que você precisará elevar o nível para perceber detalhes sutis. Apenas lembre-se de baixar o nível depois, tanto para obter uma apreciação realista da edição quanto para preservar sua audição.

Atualmente é cada vez mais comum nos círculos profissionais usar limitadores passivos em fones de ouvido para garantir que os níveis não excedam um volume pré-determinado (normalmente entre 85 dBA e 110 dBA, valores determinados pela quantidade de tempo que usuários podem ser expostos a altos níveis sonoros). A Canford Audio manufatura e instala esses dispositivos originalmente concebidos e implementados pela BBC. Você pode comprar alguns modelos de fones de ouvido com limitadores já instalados, incluindo o Beyerdynamic DT100s e o Sennheiser HD480s, ou pode fornecer seus próprios fones de ouvido para a Canford, que irá testá-los e selecionar, instalar e calibrar um dispositivo limitador adequado para eles. Recomendo totalmente estes dispositivos, embora a montagem do limitador pode ser tão cara quanto comprar fones de ouvido já equipados, e isso só é viável em uso comercial, onde se seguem regulamentos de saúde e segurança.

Escolhendo os fones de ouvido certos

Há diversos tipos de fones de ouvido, mas os dois principais usados em estúdios e salas de monitoramento são os do tipo circumaural fechado ou semiaberto. Estes termos referem-se ao tipo de montagem dos transdutores (nesse caso, é como são chamados os pequenos alto-falantes dos fones). Os fechados são os fones em que praticamente nenhum som escapa para o ambiente, da mesma forma que pouco do som externo penetra. Esse tipo de fone é a melhor escolha para salas de gravação, permitindo que os músicos ouçam o que está sendo tocando sem que vazamentos dos fones sejam captados pelos microfones.

Estes Sennheiser HD600s fornecem som de extrema qualidade em mixagens, mas o seu design semiaberto os torna inadequados em muitas tarefas de gravação em estúdio, e com seu cabo em forma de Y requer cuidado ao ser retirado da cabeça.
Estes Sennheiser HD600s fornecem som de extrema qualidade em mixagens, mas o seu design semiaberto os torna inadequados em muitas tarefas de gravação em estúdio, e com seu cabo em forma de Y requer cuidado ao ser retirado da cabeça.

Porém, até pouco tempo a maioria dos fones fechados soava muito triste — quadradões, maçantes ou embotados, e com falta de ar e ambiência. Isso não é realmente um problema em gravações ou sessões com outros músicos pois nesses casos só é necessário um retorno isolado, mas a tomada de decisões críticas de mixagem é quase impossível se a qualidade do som for pobre. No entanto, alguns dos designs mais modernos podem produzir um som bastante respeitável, e modelos dignos de consideração e de audição incluem AKG K271, Beyerdynamic DT150, Sennheiser HD250, e Sony MDR7506 e MDR7509. Os dois últimos modelos são particularmente impressionantes, muitas vezes eu uso os MDR7509s em mixagens.

Alternativamente, o design semiaberto tem tradição em oferecer a melhor qualidade sonora no monitoramento com fones de ouvido. A desvantagem é que esse tipo de fone vaza bastante som e também atenua pouco o som ambiente. Essas características podem ser um problema dependendo da circunstância. Para mixagem à noite, fones semiabertos podem ser perfeitamente aceitáveis, enquanto que para gravações provavelmente não serão. As melhores opções encontradas incluem AKG K240, Beyerdynamic DT990, Sennheiser HD600, e Ultrasone HFI2000. Eu confiei no onipresente K240s por muitos anos até substituí-lo pelo HD600, mas o modelo austríaco ainda tem muito a oferecer!

Sem nenhuma surpresa: quanto melhores os fones de ouvido, maior o preço. Para mixagens precisas eu sugeriria pares que custam cerca de £100 no Reino Unido, para o mínimo necessário em termos de qualidade, com os melhores modelos custando em torno de duas vezes esse valor. Enquanto alguns podem inicialmente hesitar com tal custo, na realidade, até mesmo £200 é trivial em comparação com um par de alto-falantes de estúdio decentes e um amplificador de definição equivalente.

Apesar de fones de ouvido fechados geralmente terem um som sofrível, o Sony MDR7509s apresenta uma reversão nessa tendência e pode ser uma boa escolha para mixagem. O cabo único saindo do fone esquerdo faz com que este modelo seja fácil de colocar e retirar, mas alguns usuários podem ter dificuldade e desconforto por causa de seu cabo espiral.
Apesar de fones de ouvido fechados geralmente terem um som sofrível, o Sony MDR7509s apresenta uma reversão nessa tendência e pode ser uma boa escolha para mixagem. O cabo único saindo do fone esquerdo faz com que este modelo seja fácil de colocar e retirar, mas alguns usuários podem ter dificuldade e desconforto por causa de seu cabo espiral.

Ao comprar fones de ouvido é fundamental ter em mente como eles devem ser confortáveis de usar. Quando estiver mixando, você irá usá-los por períodos de tempo consideráveis, por isso vale a pena se dar ao trabalho de experimentar os diversos modelos selecionados, por um período razoável de tempo, para obter uma verdadeira impressão de como será trabalhar com eles. Além disso, certifique-se de que eles se ajustam corretamente a sua cabeça. Que fiquem onde você colocá-los e não escorreguem quando você olhar para baixo. Também pode ser um problema caso sejam muito pesados ou apertem excessivamente as orelhas ou os lados da cabeça. Vale a pena procurar modelos que não esquentem e façam os ouvidos suarem, com almofadas substituíveis, uma grande vantagem para fins de limpeza.

Se você está investindo em fones de ouvido caros, verifique se peças de reposição podem ser obtidas facilmente, de modo a manter seu equipamento funcionando caso seja necessário. Fones são puxados pra lá e pra cá e caem da mesa com bastante frequência, alguma manutenção é de se esperar!

A confiabilidade do cabo e conectores é, obviamente, muito importante, embora as pessoas discordem sobre qual o tipo de cabo preferido. Alguns não gostam de cabos espiralados principalmente porque eles exercem uma tensão considerável sobre o fone de ouvido quando esticados, sendo também mais pesados do que os cabos lisos. No entanto, eu realmente prefiro este tipo, desde que seja longo o suficiente para permanecer encolhido durante o uso normal. Eu acho o trecho extra muito útil quando preciso me mover, para mim os cabos lisos sempre parecem perigosos de serem esticados!

Há também a escolha entre um com cabo que sai de apenas um dos fones ou um em formato Y. Eu prefiro fones de ouvido onde a conexão do cabo sai apenas de um lado puramente por conveniência prática. No entanto, há um argumento que diz que este pode ser tecnicamente inferior por causa da necessidade de um trecho de fio a mais passando sobre a cabeça até o fone do lado oposto. Em contraste, os modelos com cabo Y são mais suscetíveis a danos quando deslizam para trás da cabeça e sofrem tensão pelo peso do conjunto!

Táticas práticas de mixagem

Se você está investindo sério num par de fones para uso em mixagem, faz sentido optar por algo com um conjunto completo de peças de reposição. Afinal, fones de ouvido muitas vezes sofrem uma quantidade razoável de abusos no homestudio e você não vai querer ter que substituir todo o conjunto se apenas um único componente precisa de conserto.
Se você está investindo sério num par de fones para uso em mixagem, faz sentido optar por algo com um conjunto completo de peças de reposição. Afinal, fones de ouvido muitas vezes sofrem uma quantidade razoável de abusos no homestudio e você não vai querer ter que substituir todo o conjunto se apenas um único componente precisa de conserto.

Em termos práticos, o requisito mais óbvio para a mixagem em fones de ouvido é passar algum tempo se acostumando com os fones escolhidos, antes de mixar qualquer coisa pra valer. Ouça criticamente uma grande quantidade de material comercial. Acostume-se com o equilíbrio espectral dos diferentes fones de ouvido — muitos tendem a parecer um pouco mais brilhantes e agudos que alto-falantes convencionais — e aprenda a relacionar isso com o que você ouve nos alto-falantes. Descubra como os instrumentos de baixas frequências soam nos fones. Em particular, a forma como a frequência fundamental e os harmônicos se erguem e se equilibram com as frequências dos outros instrumentos. Tenha em mente que parte do impacto visceral e peso das baixas frequências experimentado com alto-falantes estará ausente, por isso é importante aprender a perceber a diferença.

Já que bons fones de ouvido muitas vezes têm níveis de distorção menores que de alto-falantes, você pode perceber detalhes em médio baixo com bem mais clareza do que com caixas de som modestas. Isso pode levá-lo erroneamente a mixar instrumentos de frequência média com menos presença do que eles precisam ter ou aplicar menos equalização do que faria de outra forma.

Mixar com fones de ouvido é um desafio. Eles são, de muitas formas, inerentemente inferiores aos monitores. No entanto, essas deficiências são muitas vezes deixadas de lado pela praticidade. Com treino é possível criar mixagens perfeitamente aceitáveis a partir de fones de ouvido, mas, assim como familiarizar-se com a sonoridade de um par de monitores desconhecido leva tempo e esforço, o monitoramento com fones é uma habilidade que, para ser adquirida, requer uma percepção diferente do que se ouve.

Hugh Robjohns, publicado em dezembro de 2003 no SOS. Tradução de Roberto Strabelli