AC-3

De MediaWiki do Campus São José
Ir para navegação Ir para pesquisar
Audio Coding 3 (AC-3)


Ivon Eduardo Esser Rosa, Juliana Camilo Inácio
Centro Federal de Educação Tecnológica de Santa Catarina
Curso Superior de Tecnologia em Sistemas de Telecomunicações

Resumo

O AC-3 é uma tecnologia que revolucionou o sistema de áudio. Pelo fato de seu sistema ser multicanais, e todos independentes, proporcionou alta qualidade no áudio dos DVDs-Vídeo, videogames e cinemas. Atualmente já existem tecnologias melhores do que o AC-3, porém são de alta complexidade, o que torna o AC-3 de 5.1 canais uns dos mais utilizados na indústria dos cinemas.

Introdução

O Audio Coding 3, ou AC-3, é uma tecnologia de compressão de áudio que utiliza o sistema de canais 5.1. Onde são aplicados 5 canais com toda a larguda de banda, representando (Centro, Direita, Esquerda, Surround Esquerda (Traseiro Esquerda) e Surround Direita (Traseiro Direita), e um sexto canal limitado para as baixas freqüências, operando como um sub-woofer. Apesar de operar com múltiplos canais de áudio independentes, o AC-3 é de alta qualidade e baixa complexidade, por codificar uma multiplicidade de canais como uma única entrada. Ele é capaz de operar em taxas de dados baixas, como 320kbps.

Desenvolvido pela DOLBY LABORATORIES, o AC-3 vem sendo cada vez mais utilizado na indústria do cinema e em home theatres. Devido à disposição de suas caixas (centrais, frontais e traseiras), permite ao espectador a sensação de estar dentro do filme.

Funcionamento do CODEC

O AC-3 usa a propriedade de mascaramento de sons para alcançar a sua compressão. Um fluxo AC-3 é feito sobre uma série de fluxos sincronizados, que são compostos por seis blocos de áudio. Cada bloco de áudio contém 256 amostras de áudio por canal, ou seja, 6 x 256 = 1536 = tamanho do fluxo de áudio. O sinal de entrada é obtido por amostras PCM que podem ser de 32, 44.1 ou 48 khz codificados em 20 bits. Os 5 primeiros canais vão de 20Hz à 20000Hz (frontal direito, central, esquerdo dianteiro, traseiro direito e esquerdo da retaguarda) e o último canal vai de 20Hz à 120Hz (para os sons graves).


Codificação/Decodificação

O primeiro passo no processo de codificação é a transformação do áudio a partir da sequência de amostras PCM para uma sequência de blocos de freqüências. Isso é feito no banco de filtros apresentado na imagem (Analysis Filter Bank). Blocos de sobreposição de 512 amostras temporais são multiplicadas pela janela de tempo e transformadas para o domínio da freqüencia. Depois da sobreposição, cada amostra PCM na entrada, é transformada em dois blocos seqüenciais. E cada bloco contém 256 coeficientes de freqüencia.

Blocos Lógicos de Codificação

  1. ===== Buffer de Entrada (Input Buffer) =====

Como o AC-3 é um codificador estruturado para blocos, o Buffer de entrada serve para captar as amostras PCM, e armazená-las em um bloco, mais exatamente 512 amostras por bloco.

  1. ===== Filtro de Entrada =====

Os sinais de entrada são individualmente filtrados sob a ação de um filto passa-alta de freqüência de corte de 3Hz, para remover a tensão de Offset. Já o sinal que é do canal de subwoofer é filtrado também por um filtro passa-baixa com freqüencia de corte de 120Hz aproximadamente.

  1. ===== Detecção de Transientes =====

O sinal depois de filtrado é analisado para verificar se existe a presença de transientes[1], que podem ocasionar um ruido de quantização por um curto espaço de tempo, tornando o sinal na decodificação diferente do sinal de entrada.

  1. ===== Banco de Filtros TDAC =====

O sinal de entrada de cada canal é alocado em uma janela e filtrado em um banco de filtros com a técnica TDAC. A técnica TDAC é uma FFT (Transformada Rápida de Fourier) seguida por um estágio Twiddle, com essa implementação lógica o sistema de banco de filtros TDAC recorre a uma baixa taxa de processamento e um bom nível de seletividade das freqüências.

  1. ===== Conversão para Notação de Ponto Flutuante =====

A transformação TDAC pode usar pontos fixos ou flutuantes, para o AC-3 os coeficientes, caso necessário, são convertidos para a notação de ponto flutuante para posterior processamento.

  1. ===== Pré-Combinação de Portadora =====

A pré-combinação seletiva de componentes da portadora de alta freqüência é usada para prover ganho de codificação, tendo em vista a propriedade de que a taxa média de bits para se codificar múltiplos canais é proporcional a raíz quadrada do número de canais, fazendo com que a maioria dos sinais de sistemas multicanais possam ser codificadas pela técnica de alocação de bits. O fato do sistema auditivo humano detectar os sons baseados principalmente na envoltória dos sinais que atingem os ouvidos, é implementado na tecnologia Dolby AC-3, através da separação de sinais de alta freqüência em componentes de envoltória e portadora, sendo que a codificação da informação da envoltória é feita com maior precisão que a codificação da informação da portadora.

  1. ===== Alocação de Bits =====

A principal vantagem da codificação multicanais é a habilidade da alocação em distribuir os bits de quantização entre os vários canais e freqüências conforme o necessário para atender o deslocamento requerido para os sinais e sua percepção pelo se humano, tornando a percepção espacial sonora próxima da realidade. AC-3 analisa os coeficientes TDAC e considera os seus efeitos de mascaramento auditivo e sua relação com o limiar da audição humana para computar a precisão da quantização.

  1. ===== Quantização =====

Os resultados do cálculo mencionado anteriormente são usados para quantizar os dados da mantissa TDAC. Ao invés de simplesmente enviar os bits mais significativos de um dado valor, é feito um escalamento do mesmo e uma operação de offset para prover níveis de quantização de simetria ímpar, com igual largura e com centro em zero, a fim de minimizar a distorção.

  1. ===== Empacotamento dos Dados =====

Como parte final do processo de codificação é feito o empacotamento dos dados, todos os vetores e escalares que foram originados na converção dos seis canais no domínio do tempo, e também os expoentes e mantissas quantizadas do TDAC, informações sobre a alocação de bits e coeficientes de casamento. Nesse último bloco um último cuidado é tomado, o de empacotar os dados de forma lógica, a fim de que o decodificador possa desempacotá-los e efetuar o processo que será descrito posteriormente.

Blocos Lógicos de Decodificação

Buffer de Entrada
Como o codificador, o decodificador Dolby AC-3 é estruturado em blocos, então ele

estabiliza e mantém um sincronismo com o fluxo de dados de entrada, armazenando um bloco codificado inteiro em um buffer de entrada antes de proceder com sua decodificação.

Ocultação de Erros

Cada bloco de entrada do decodificador é analisado para assegurar a ausência de erros. Mas caso um erro seja detectado, o decodificador utilizará o último bloco íntegro no lugar do atual para ocultar o erro.

Desempacotamento de Dados de Formato Fixo

Os dados de formato fixo são desempacotados, incluindo os expoentes e coeficientes de casamento. Porções relevantes destes dados são então utilizadas pelo decodificador para recuperar a alocação de bits, que é utilizada para desempacotar os dados de formato variável,principalmente os vetores de mantissas da transformação TDAC.

Decodificação da alocação de Bits

Ela utiliza os resultados intermediários transmitidos pelo codificador para economizar tempo e, opcionalmente, modificar a alocação de bits encaminhada pelo codificador. Isto também permite que o decodificador compute a alocação de bits de cada canal por vez, o que reduz os requisitos de memória do mesmo.

Desempacotamento dos Dados de Formato Variável

A alocação de bits recuperada pela decodificação, que especifica o nível de quantização de cada mantissa, é utilizada para desempacotar os dados de formato variável de cada feixe de bits codificados.

Conversão para a Notação de Ponto Fixo

As mantissas e os expoentes recebidos são combinados para converter os coeficientes da transformação TDAC novamente para a notação de ponto fixo.

Reinserção da Portadora de Alta Freqüência

Os coeficientes de alta freqüência que foram codificados como informações de envoltória e portadora são reconstruídos pela combinação das portadoras com seus respectivos coeficientes de casamento.

Transformação TDAC Inversa

Os coeficientes convertidos da transformação TDAC de cada canal são inversamente transformados para o domínio do tempo e postos em janelas para produzir sinais de saída digitais no domínio do tempo. Os coeficientes do sinal do subwoofer são preenchidos com zeros nas freqüências médias e altas antes da transformação inversa, de forma que a saída no domínio do tempo do subwoofer contenha a taxa de amostragem completa. O resultado na saída do decodificador são 5.1 canais de áudio.






[1] Transientes - Picos de tensão com duração muito curta (5 a 300 milisegundos), que podem alterar a características do sinal. [2] Twiddle

Comparação com outros CODECs

A principal vantagem desta tecnologia é o uso do som digital em placas de som, que comparadas as outras, como PCM stereo ou multicanais analógicas, esta possui uma qualidade superior. Pela norma, o AC-3 permite uma codificação máxima de 640kbit/s. O HD-DVD e o DVD-Vídeo são limitados em 448kbit/s. Já o BLU-RAY Disc, o Sony Playstation 3 e o jogo do console Microsoft Xbox podem chegar à um sinal de saída pleno em 640kbit/s. O AAC (Advanced Audio Coding), considerado sucessor do MP3, supera o AC-3 em qualquer taxa de bit, porém é mais complexo. E ainda, o AC-3 é suportado em HD-DVD como codec obrigatório e em BLU-RAY Disc como um codec opicional.

Aplicações

O AC-3 é muito utilizado na indústria do cinema. As trilhas sonoras passam por um codec AC-3, transformando-as em uma fonte de áudio de 5.1 canais associados as imagens do vídeo digital. O mesmo sistema é utilizado em DVD-Vídeos, BLU-RAY Disc e em aparelhos Home Theatres, dando mais emoção e realidade à quem assiste o vídeo. Numa outra versão, na Dolby Digital Live (DDL), um AC-3 é aplicado na codificação em tempo real de tecnologias de mídia interativa, como por exemplo os videogames.

Referências

  1. Cite as referencias precedidas pelo (#)
  2. Cite as referencias precedidas pelo (#)