MP2

De MediaWiki do Campus São José
Ir para navegação Ir para pesquisar
Modelo de Artigo para Telefonia 1: Codificador de voz Mp2


Paulo Sergio Alves, Claudir Farias
Centro Federal de Educação Tecnológica de Santa Catarina
Curso Superior de Tecnologia em Sistemas de Telecomunicações

Resumo

A utilização de técnicas e ferramentas de compressão cada vez mais eficientes tem sido uma das principais preocupações a serem levadas em conta no desenvolvimento de novos codificadores. Esse fato tem possibilitado uma rápida evolução de algoritmos e técnicas propostas que hoje em dia fazem parte dos principais codificadores de sinais de som. As primeiras técnicas de compressão de áudio digital apareceram aproximadamente no começo dos anos 80 e foram baseadas na codificação do sinal no domínio do tempo. Com o passar dos anos apareceu a idéia de se codificar os sinais no domínio da freqüência utilizando-se para esse caso os chamados modelos psico-acústicos do sistema de audição humano. Esses modelos exploram o fenômeno de mascaramento do ouvido e, portanto, permitem identificar aproximadamente as componentes de freqüência audíveis ou pouco audíveis que fazem parte do espectro auditivo. A partir dessa discriminação é possível a determinação da informação que deverá ser posteriormente quantizada, codificada e transmitida, obtendo-se logicamente um ganho considerável de compressão. Hoje em dia, com o avanço da tecnologia de circuitos integrados de alta velocidade e com o desenvolvimento de algoritmos cada vez mais eficientes, é possível implementar esse tipo de codificadores para aplicações em tempo real (codificadores Dolby AC-2, Dolby AC-3, MPEG-1, MPEG-2, etc), os quais já estão sendo utilizados nos diferentes sistemas de telecomunicações para aplicações em radiodifusão (broadcasting), armazenamento e transmissões via internet. O diagrama de blocos do esquema de codificação no domínio da freqüência ou da transformada é mostrado abaixo:

Esquema de codificação de áudio no domínio da frequência.

Introdução

MP2 Deu inicio em 1980, é um codec de áudio e vídeo registrado na ISO/IEC 11172-3 MPEG (Moving Picture Experts Group). Foi idealizado no intuito de padronizar a transmissão de áudio e vídeo digital e utilizado também em Vídeo cd. A MPEG inclui 3 categorias de áudio conhecidas como técnicas de codificação mp1, mp2,mp3 . Na internet os arquivos de vídeo são reconhecidos com extensão mpeg e para áudio extensão mp2,mp3. Este codec utiliza a codificação Perceptual um modelo Psicoacústico que explora as limitações do ouvido Humano. Os fatores Psico-Acústicos definem características e limitações da audição humana que são exploradas por sistemas de compressão de sinais de alta qualidade. O primeiro fator a ser levado em conta é a sensibilidade variável do ouvido frente às componentes de freqüência que formam o espectro auditivo. Sabe-se que a percepção do ouvido para os distintos tons gerados é diferente, sendo que algumas freqüências são percebidas com maior intensidade do que outras. O maior nível de percepção apresenta-se na faixa de 1 a 5 kHz. O segundo fator tem característica importante é o chamado fenômeno de mascaramento, o qual se apresenta quando componentes de alta potência mascaram ou tornam quase inaudíveis componentes vizinhas de menor nível de potência reproduzidas simultaneamente. Essa característica constitui um beneficio direto para os processos de compressão, já que componentes ou grupo de componentes que são fortemente mascaradas são codificados com poucos bits. O mascaramento pode ser devido a um tom isolado de alta potência (mascaramento tonal) ou devido a um grupo de componentes vizinhas com nível regular de potência (mascaramento não tonal). Os modelos psico-acústicos são, portanto, baseados em algoritmos de identificação de componentes tonais e não tonais, assim como também em procedimentos de cálculo dos níveis de mascaramento. Finalmente, outro fator de característica muito importante é a divisão do espectro auditivo (por parte do ouvido) em bandas de largura variável, as quais são chamadas de bandas críticas do ouvido humano. Essa forma de divisão constitui a máxima resolução que o ouvido apresenta para detectar componentes ou sons que fazem parte do espectro. Dessa forma, pode-se comprovar também que a sensibilidade do ouvido é variável para cada banda crítica, sendo que, geralmente, assume-se que as componentes de freqüência que formam cada uma delas são percebidas com igual intensidade. Os modelos psico-acústicos geralmente fazem os cálculos de mascaramento levando-se em conta as bandas críticas a fim de também diminuir a carga computacional do codificador.

Funcionamento do CODEC

O modelo Psico-acústico MP2 caracteriza-se por não fazer uma distinção dicotômica entre componentes tonais e não tonais. Em lugar disso, o espectro é transformado para o domínio de uma partição, onde a fração das componentes tonais e não tonais serão determinadas. A partição suporta uma relação quase linear com o espaço das bandas críticas. Assim, ela provê uma resolução de quase uma linha espectral (ou aproximadamente 1/3 de uma banda crítica) na divisão do espectro auditivo . O sinal de entrada no modelo psico-acústico deverá estar segmentado em blocos de 1024 amostras, sendo que os cálculos de mascaramento serão realizados uma vez para cada bloco a ser codificado. O espectro auditivo é determinado utilizando-se uma janela convencional de Von Hann e aplicando-se logo em seguida a transformada rápida de Fourier FFT. Portanto, definindo-se ( n x ) como sendo uma amostra de áudio que forma o bloco de entrada, então pode-se dizer que o espectro de áudio segundo padrão MP2 é dado por:

                   formula   ****

Comparação com outros CODECs

Cite algumas vantagens e desvantagens do CODEC.

Aplicações

Exemplifique algumas aplicações nas quais ele é usado.

Referências

  1. http://www.midiacom.uff.br/~debora/fsmm/pdf/parte5.pdf (#)
  2. Cite as referencias precedidas pelo (#)