MP3

De MediaWiki do Campus São José
Revisão de 19h37min de 17 de dezembro de 2008 por Kalebe (discussão | contribs)
Ir para navegação Ir para pesquisar
MP3 (MPEG 1 – LAYER III)


André M. da Silveira, Kalebe A. Espindola
Centro Federal de Educação Tecnológica de Santa Catarina
Curso Superior de Tecnologia em Sistemas de Telecomunicações



RESUMO

Neste artigo tenta-se passar de uma forma sucinta as questões técnicas mais relevantes do MP3 e mostrar o percurso desde o seu aparecimento até aos dias de hoje. O MP3 começou a ser desenvolvido na Alemanha, no Centro de Investigação Fraunhofer Institut Integrierte Schaltungen, em 1987, tendo sido criado o primeiro leitor MP3 de sucesso em 1997. Em 1999 foi criado um programa de compartilhamento de arquivos denominado Napster, e neste mesmo ano surgiram os primeiros leitores MP3 portáteis. O algoritmo implementado baseia-se essencialmente nos princípios da audição humana, tentando assim, através da exploração de efeitos como psicoacustica e mascaramento, deixar passar uma determinada quantidade de ruído que não é detectada audivelmente.

1. INTRODUÇÃO

Este artigo pretende abordar vários aspectos associados à tecnologia do mp3, desde sua criação até os princípios físicos (sistema auditivo humano) em que foi baseada, passando pelos algoritmos de codificação. O MP3 é um formato de compressão de arquivos de áudio, semelhante à compressão zip, nos computadores comuns. Utiliza codificação perceptiva de áudio para comprimir som com qualidade de CD e praticamente com a mesma fidelidade. Pretende-se assim que o leitor consiga entender de onde veio e sua funcionalidade.


2. MÉTODO DE COMPRESSÃO MPGE ÁUDIO

Depois de termos, no capítulo anterior, definido alguns conceitos teóricos utilizados no método de compressão MPEG áudio, e depois de apresentado o modelo em que este se baseia, vamos de seguida explicar como se desenvolve o algoritmo de compressão MPEG. O MPEG áudio, no fundo, consiste num grupo de três diferentes esquemas de codificação em sub-bandas (SBC), chamadas layers’s. Cada layer é um codificador SBC com os seus próprios componentes que o caracterizam como o bloco de mapeamento tempo/frequência, o modelo psico-acústico e quantificador, como foi descrito no capítulo anterior o codificador SBC. A Layer I é a mais simples, mas aquela que é mais pobre em termos de compressão. A Layer III é a mais complicada e também a de maior exigência em termos de computação, mas permite-nos obter a melhor compressão.

3. IMPLEMENTAÇÃO TÉCNICA

3.1. Codificação MP3

O diagrama da Figura 6 apresenta a arquitetura do processo de codificação do MP3. A entrada de áudio é transformada trama por trama em componentes espectrais — há uma transformação de tempo em freqüência. No bloco híbrido de transformação, o MP3 utiliza um banco de filtros polifásicos seguido de uma DCT modificada (MDCT, Modified Discrete Cosine Transform) para melhorar a resolução espectral. O sinal de entrada áudio segue para o PAM II (Modelo Psicoacústico) para determinar o limiar da relação da energia do sinal e o mascaramento. O débito binário de codificação é limitado pelo controlador de débito, o qual faz variar o passo de quantificação de tal maneira que quantifica os valores espectrais, e conta o número de bits do código de Huffman necessários para codificar os valores quantificados. O código de Huffman é escolhido como a ferramenta codificadora sem perdas, usando tabelas de Huffman pré-definidas. O MP3 também adapta os fatores de escala para amplificar a energia da banda espectral quando o ruído de quantificação ultrapassa o limiar de mascaramento. O controlo de distorção ajusta os fatores de escala de modo a controlar a qualidade. Finalmente, a informação necessária ao descodificador é adicionada ao áudio comprimido, resultando assim um conteúdo válido de MP3. Na Figura 2 pode ver-se o ciclo do controlador de débito. Este ciclo aloca bits para cada linha espectral, através de uma quantificação contínua dos dados áudio, aplicar a codificação de Huffman e avaliar o número de bits. O desafio é encontrar um parâmetro de quantificação óptimo – ganho global – e selecionar a tabela de Huffman apropriada. São testadas muitas iterações no processo de quantificação de modo a assegurar uma saída para a codificação de Huffman possa ser aplicada.

Arquivo:Ficheiro 6

Figura 1 - Processo de Codificação MPEG [6].

Arquivo:Ficheiro 7

Figura 2 - Ciclo de iterações do Controlo de Débito [6].


4. DECODIFICAÇÃO MP3

O processo de descodificação do MP3 tem três partes principais: descodificação de seqüências de bits, desquantificação e mapeamento freqüência - tempo (Figura 3). A primeira parte sincroniza a seqüência de bits codificada e extrai os coeficientes de freqüência quantificados e qualquer outra informação sobre cada trama (Figura 4).

Arquivo:Ficheiro 7

Figura 3- Diagrama de blocos da descodificação MP3 [6].

Arquivo:Ficheiro 11

Figura 4 - Diagrama de blocos da primeira etapa da descodificação [6].

A desquantificação reconstrói os dados (perceptualmente idênticos) a partir dos coeficientes de freqüência gerados pelo bloco da MDCT durante a descodificação. A última parte abrange um conjunto de operações inversas da MDCT e a análise do banco de filtros da sub-banda, no descodificador. O mapeamento freqüência-tempo constrói o sinal de saída áudio PCM a partir dos coeficientes desquantificados. A MDCT Inversa (IMDCT) transforma os coeficientes em sinais de sub-banda no domínio do tempo. É aplicada então, a inversão na freqüência, de modo a compensar a redução do número de amostras na análise do banco de filtros da sub-banda. Após esta etapa, a síntese do banco de filtros da sub-banda é aplicada aos sinais da sub-banda para formar o sinal áudio PCM de saída.


Na descrição do algoritmo de codificação, foi referido que era aplicada uma redução do efeito de aliasing no bloco MDCT. Para obter uma correta reconstrução do sinal de áudio nos blocos de descodificação seguintes, é necessário voltar a inserir os artefatos de aliasing. Isso é feito neste bloco.


5. CONTEÚDO DOS ARQUIVOS .MP3

Todos os srquivos MP3 estão divididos em fragmentos mais pequenos designados por "tramas". Cada trama guarda 1152 amostras de áudio tendo uma duração fixa de 26ms quando é descodificado. O tamanho de cada trama depende do bitrate com que o sinal foi codificado e da freqüência de amostragem de acordo com a seguinte fórmula:

Arquivo:Ficheiro 13

Figura 5. Formula para amostragem de acordo com o bitrate.

Ao codificar um arquivo com uma bitrate de 128 kbps e uma freqüência de amostragem de 44.100 Hz, vamos obter tramas de 417 bytes2. Para que a stream codificada cumpra exatamente o bitrate especificado, é necessário que algumas tramas tenham 418 bytes, sendo neste caso utilizado um byte de padding. Cada trama é constituída por cinco partes (Header, CRC, Side Information, Main Data e Ancillary Data) estando representada na Figura 6.

Arquivo:Ficheiro 14

Figura 6. Estrutura de cada trama MP3.



6. APLICAÇÔES

Uma solução como o MPEG Layer III é muito útil para um largo número de aplicações. Praticamente qualquer sistema que tenha uma capacidade de canal limitada beneficia no uso desta solução. Esta técnica abrange pelo menos três grandes áreas: transmissão; radiodifusão e teledifusão; Armazenamento de Dados. No caso da transmissão temos como exemplo as rádios. Um programa de rádio que precise de fazer uma entrevista com uma celebridade ou fazer uma cobertura de um evento desportivo ou concerto de música, necessita de ter uma ligação entre o local onde está a rádio e o evento, para poder transportar o sinal de áudio de um sitio para o outro. Pode utilizar uma ligação em RDIS e usando um codificador MPEG para garantir um transporte de alta qualidade. No caso da radiodifusão, muitas vezes é utilizada a compressão de áudio para reduzir as tramas de dados e conseguir assim transmitir mais áudio utilizando o mesmo canal. No caso do armazenamento de dados apresentamos de seguida um exemplo de como a compressão de arquivos de música pode permitir guardar num único CDROM a musica existente em cerca de 12 CD Áudio sem apreciável perda de qualidade.[12]

7. IMPACTO SOCIOLÓGICO

A associação do formato MP3 com a Internet permitiu uma poderosa distribuição de música online, o que revolucionou o mundo da música [5]. Alimentado pelo crescimento explosivo da Internet tornou-se o formato mais popular de ficheiros de música, tanto legais como ilegais. Foi bem sucedido porque o consumidor pensou nele como ?CDs na Internet, ou, em muitos casos, ?CDs grátis na Internet. A procura deste formato criou um ciclo: mais produtores de conteúdo criam conteúdo no formato MP3, o que por sua vez gera um aumento na procura de software e hardware MP3 [7]. A atração do consumidor pelo MP3 levou a indústria eletrônica a criar o leitor portátil de música digital, com ele as pessoas passaram a poder localizar rapidamente a música pretendida, através da utilização de software que organiza a sua biblioteca musical e a ouvi-la onde querem: em casa, na praia, nos transportes públicos, na rua, a praticar desporto, etc. [5], [7]. A razão pela qual o MP3 se tornou o formato de áudio mais utilizado na Internet prendeu-se com o fato de os detentores da patente terem permitido, durante algum tempo, que qualquer pessoa desenvolvesse um decodificador ou reprodutor gratuitamente. Por isso, no início, muitas pessoas desenvolveram reprodutores e outro software que se espalhou rapidamente. Em contrapartida, muitos outros formatos de áudio digital, que são mais eficientes ou têm um som melhor que o MP3, têm restrições sobre a forma como se pode empregar a sua tecnologia [2]. Uma das vantagens do MP3 é ter uma perda insignificante de qualidade para um grande grau de compressão, permitindo o armazenamento online de ?CDs com qualidade musical, para não falar do aumento de capacidade dos discos rígidos e a sua diminuição de preço [5]. Outra vantagem deste formato é não ter segurança associada aos ficheiros, por isso milhões deles são colocados diariamente na Internet. Os ficheiros são suficientemente pequenos para serem descarregados facilmente, ou até mesmo enviados em anexo num e-mail para um amigo [2]. O impacto tecnológico do MP3 na sociedade, assemelha-se ao impacto que o rádio teve anteriormente.

7.1 Licenças e Patentes

Em Setembro de 1998, o Instituto Fraunhofer enviou uma carta a vários criadores de software MP3 afirmando que era necessária uma licença para distribuir e/ou vender decodificadores e/ou codificadores, e que os produtos não licenciados violavam os direitos sobre a patente do Instituto Fraunhofer e da Thomson Consumer Electronics, portanto para produzir, vender e/ou distribuir produtos que utilizassem o MPEG Layer-3 seria necessário obter uma licença. A Thomson Consumer Electronics é a entidade que controla o licenciamento da patente do MPEG-1/2 Layer 3 em muitos países, incluindo os Estados Unidos, Japão, Canadá e alguns países da União Européia. Estas questões da patente abrandaram significativamente o desenvolvimento de software MP3 sem licenciamento, o que levou à criação de novas alternativas, tais como Vorbis, AAC e WMA.

Apesar das restrições colocadas em relação às patentes, o formato MP3 continua a ser o preferido por muitas razões:

Familiaridade com o formato;

  • A grande quantidade de música disponível no formato MP3;
  • A grande variedade de software e hardware que utiliza o formato MP3;
  • A fraca restrição do DRM, o que torna fácil editar, copiar e distribuir ficheiros MP3;

A maioria dos utilizadores domésticos não sabem ou não se importam com a polemica em torno das patentes, que muitas vezes não têm em consideração estas questões jurídicas na escolha do seu formato musical para uso pessoal [3].


8. REFERÊNCIAS

[1] http://inventors.about.com/od/mstartinventions/a/MPThree.htm

[2] http://www.webmonkey.com/00/31/index3a.html

[3] http://en.wikipedia.org/wiki/Mp3

[4] http://www.mp3licensing.com/mp3/history.html

[5] M. McCandless, ”The MP3 Revolution” IEEE Intelligent Systems, pp. 8-9, May/June 1999.

[6] C.H. Yen, Y.S. Lin, B.F. Wu, ?” Low-complexity MP3 Algorithm that Uses a New Rate Control and a Fast Dequantization” IEEE Transactions on Consumer Electronics, Vol. 51 Nº 2, pp. 571-579, May 2005.

[7] B. Ponce, ?The Impact of MP3 and the Future of Digital Entertainment Products?, IEEE Communications Magazine, pp. 68-70, Sept 1999.

[8] ?Colecção de Caderno de Políticas Culturais?, Brasília 2006.

[9] Oliveira, Pedro Miguel, ?”Uma Revolução Chamada MP3” Exame Informática, pp. 10-13, Agosto 2005, Ed. 122.

[10] http://www.img.lx.it.pt/~fp/cav/ano2006_2007/MERC/Trab_7/G7-MP3/SITE/mpeg1LayerIII.html

[11]http://www.img.lx.it.pt/~fp/cav/ano2007_2008/MEEC/Trabalho_18/MP3/Artigo.pdf

[12] http://pwp.net.ipl.pt/isel/pribeiro/MPEGAudio/