MP2

De MediaWiki do Campus São José
Ir para: navegação, pesquisa
Modelo de Artigo para Telefonia 1: Codificador de voz Mp2


Paulo Sergio Alves, Claudir Farias
Centro Federal de Educação Tecnológica de Santa Catarina
Curso Superior de Tecnologia em Sistemas de Telecomunicações
As imagens já podem ser inseridas --Marcos Moecke 19:07, 16 Dezembro 2008 (BRST)

Resumo

A utilização de técnicas e ferramentas de compressão cada vez mais eficientes tem sido uma das principais preocupações a serem levadas em conta no desenvolvimento de novos codificadores. Esse fato tem possibilitado uma rápida evolução de algoritmos e técnicas propostas que hoje em dia fazem parte dos principais codificadores de sinais de som. As primeiras técnicas de compressão de áudio digital apareceram aproximadamente no começo dos anos 80 e foram baseadas na codificação do sinal no domínio do tempo.

Com o passar dos anos apareceu a idéia de se codificar os sinais no domínio da freqüência utilizando-se para esse caso os chamados modelos psico-acústicos do sistema de audição humano. Esses modelos exploram o fenômeno de mascaramento do ouvido e, portanto, permitem identificar aproximadamente as componentes de freqüência audíveis ou pouco audíveis que fazem parte do espectro auditivo. A partir dessa discriminação é possível a determinação da informação que deverá ser posteriormente quantizada, codificada e transmitida, obtendo-se logicamente um ganho considerável de compressão.

Hoje em dia, com o avanço da tecnologia de circuitos integrados de alta velocidade e com o desenvolvimento de algoritmos cada vez mais eficientes, é possível implementar esse tipo de codificadores para aplicações em tempo real (codificadores Dolby AC-2, Dolby AC-3, MPEG-1, MPEG-2, etc), os quais já estão sendo utilizados nos diferentes sistemas de telecomunicações para aplicações em radiodifusão (broadcasting), armazenamento e transmissões via internet.

O diagrama de blocos do esquema de codificação no domínio da freqüência ou da transformada é mostrado abaixo:

**figura01

Esquema de codificação de áudio no domínio da frequência.

Introdução

MP2 Deu inicio em 1980, é um codec de áudio e vídeo registrado na ISO/IEC 11172-3 MPEG (Moving Picture Experts Group). Foi idealizado no intuito de padronizar a transmissão de áudio e vídeo digital e utilizado também em Vídeo cd. A MPEG inclui 3 categorias de áudio conhecidas como técnicas de codificação mp1, mp2,mp3 . Na internet os arquivos de vídeo são reconhecidos com extensão mpeg e para áudio extensão mp2,mp3. Este codec utiliza a codificação Perceptual um modelo Psicoacústico que explora as limitações do ouvido Humano.

Os fatores Psico-Acústicos definem características e limitações da audição humana que são exploradas por sistemas de compressão de sinais de alta qualidade.

O primeiro fator a ser levado em conta é a sensibilidade variável do ouvido frente às componentes de freqüência que formam o espectro auditivo. Sabe-se que a percepção do ouvido para os distintos tons gerados é diferente, sendo que algumas freqüências são percebidas com maior intensidade do que outras. O maior nível de percepção apresenta-se na faixa de 1 a 5 kHz.

O segundo fator tem característica importante é o chamado fenômeno de mascaramento, o qual se apresenta quando componentes de alta potência mascaram ou tornam quase inaudíveis componentes vizinhas de menor nível de potência reproduzidas simultaneamente. Essa característica constitui um beneficio direto para os processos de compressão, já que componentes ou grupo de componentes que são fortemente mascaradas são codificados com poucos bits. O mascaramento pode ser devido a um tom isolado de alta potência (mascaramento tonal) ou devido a um grupo de componentes vizinhas com nível regular de potência (mascaramento não tonal). Os modelos psico-acústicos são, portanto, baseados em algoritmos de identificação de componentes tonais e não tonais, assim como também em procedimentos de cálculo dos níveis de mascaramento.

Finalmente, outro fator de característica muito importante é a divisão do espectro auditivo (por parte do ouvido) em bandas de largura variável, as quais são chamadas de bandas críticas do ouvido humano.

Essa forma de divisão constitui a máxima resolução que o ouvido apresenta para detectar componentes ou sons que fazem parte do espectro. Dessa forma, pode-se comprovar também que a sensibilidade do ouvido é variável para cada banda crítica, sendo que, geralmente, assume-se que as componentes de freqüência que formam cada uma delas são percebidas com igual intensidade. Os modelos psico-acústicos geralmente fazem os cálculos de mascaramento levando-se em conta as bandas críticas a fim de também diminuir a carga computacional do codificador.

Funcionamento do CODEC

O modelo Psico-acústico MP2 caracteriza-se por não fazer uma distinção dicotômica entre componentes tonais e não tonais. Em lugar disso, o espectro é transformado para o domínio de uma partição, onde a fração das componentes tonais e não tonais serão determinadas. A partição suporta uma relação quase linear com o espaço das bandas críticas. Assim, ela provê uma resolução de quase uma linha espectral (ou aproximadamente 1/3 de uma banda crítica) na divisão do espectro auditivo . O sinal de entrada no modelo psico-acústico deverá estar segmentado em blocos de 1024 amostras, sendo que os cálculos de mascaramento serão realizados uma vez para cada bloco a ser codificado. O espectro auditivo é determinado utilizando-se uma janela convencional de Von Hann e aplicando-se logo em seguida a transformada rápida de Fourier FFT. Portanto, definindo-se ( n x ) como sendo uma amostra de áudio que forma o bloco de entrada, então pode-se dizer que o espectro de áudio segundo padrão MP2 é dado por:

                   formula   ****

Especificações do Codec

MP2 é definido na norma ISO / IEC 11172-3

  • Frequências de amostragem: 32, 44,1 e 48 kHz Taxas de amostragem: 32, 44,1 e 48 kHz
  • Bitrate: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 e 384 kbit / s

Sofreu alteração para MPEG-2 Layer II e é definido na norma ISO / IEC 13818-3

  • Taxas adicional de amostragem: 16, 22,05 e 24 kHz .Outras taxas de amostragem: 16, 22,05 e 24 kHz
  • Adicional bitrates: 8, 16, 24, 40 e 144 kbit / s

O modelo é baseado em sucessivas molduras digitais de 1152 intervalos de amostragem com quatro formatos possíveis:

  • formato Mono
  • Formato Estéreo
  • Dois canais

Aplicações

Todos os leitores de DVD nos países que usam o sistema PAL contém decodificadores MP2, o MP2 tornou-se um possível concorrente para o padrão Dolby Digital nesses mercados. Leitores de DVD nos paises que usam o sistema NTSC não são obrigados a usar decodificares áudio MP2, embora a maioria possua. MP2 é o formato padrão de áudio usado no Vídeo CD e Super Vídeo CD formatos (VCD e SVCD também suportam bitrate variável e MPEG Multicanal, tal como editado pelo MPEG-2). MP2 é o formato padrão de áudio utilizadas na norma MHP para set-top boxes. MP2 é o formato de áudio utilizado em filmadoras HDV.

Referências

  1. http://www.midiacom.uff.br/~debora/fsmm/pdf/parte5.pdf
  2. http://en.wikipedia.org/wiki/MPEG-1_Audio_Layer_II
  3. http://pt.wikipedia.org/wiki/Compress%C3%A3o_com_perda_de_dados
  4. http://www.img.lx.it.pt/~fp/cav/ano2006_2007/MEEC/Trab_15/CAV_MP3/pages/questoestecnicas.html
  5. http://libdigi.unicamp.br/document/?code=vtls000215223