Aínda que existen diversos formatos de compresión musical, o máis exitoso é sen dúbida MPEG-1 Audio Layer 3, moito máis coñecido como MP3. MPEG é un grupo de traballo da Organización Internacional paira a Estandarización (ISO) que creou o famoso MP3.
Paira conservar o son dixital é necesario un gran número de datos que, comprimidos en formato MP3, poden reducirse considerablemente sen que se produzan perdas na calidade do son. Esa é a clave do éxito do mp3. Pero este éxito tamén está directamente relacionado con Internet. De feito, grazas a este formato, os arquivos musicais fixéronse accesibles na rede.
Os arquivos MP3 comezan a aparecer na rede a partir de mediados dos 90. A finais desa década, coa aparición de software como Winamp (1997) ou Napster (1999), a compresión musical converteuse en algo moi sinxelo paira calquera persoa, así como a reprodución, o compartir en rede ou simplemente baixalo. Isto supuxo un gran abrazo paira os usuarios, xa que permitiu obter unha chea de música gratis. O uso compartido da música a través das redes P2P ou peer-to-peer converteuse nunha práctica habitual, o que deu lugar a diversas polémicas e problemas legais. Tamén influíu notablemente na industria musical.
Os reprodutores de MP3 tamén tiveron un gran éxito. Non é de estrañar, teñen un prezo razoable e pódese gardar unha chea de música nun sitio moi pequeno paira escoitalo onde e cando queiras. Grazas ao MP3 creouse música de peto.
Estes son algúns dos factores que influíron no éxito do MP3. Pero, como dixemos, a clave está no nivel de compresión alcanzado sen perda apreciable de calidade. E onde está o misterio? Como consegue o MP3, a música que necesita tanto espazo, entrar nun lugar tan pequeno? Como se poden escoitar 20.000 cancións no peto? Pois porque os algoritmos que se utilizan paira comprimir en formato MP3 traballan á medida do noso oído. Estes algoritmos eliminan a información que o noso oído non detectará e pode ser moito.
Paira saber como se comprime o son, antes hai que entender como se dixitaliza o son. O son é una onda e paira dixitalizala hai que representala con números. Segundo o teorema de Nyquist, a expresión numérica da onda a unha frecuencia determinada require a adopción de 2 medidas por ciclo. Por tanto, para que un son composto por varias frecuencias exprésese con números será necesario dúas veces a frecuencia máis elevada. O home pode ouvir un son máximo de 20 kHz (20.000 ciclos por segundo). A dixitalización deste son requiriría 40.000 medidas por segundo. Por exemplo, nos CDs utilízanse 44.100 medidas por segundo, o estándar de calidade establecido paira o son dixital é 44,1 kHz.
Ademais, paira gardar a información da intensidade do son, é necesario asignar un valor a cada una destas medidas. Cun bit indícanse os valores 0 e 1, é dicir, si o son existe ou non existe. Cos dous bits, ademais do cero, pódense representar 3 intensidades diferentes e con 16 bits 65.536. Pois ben, todos os avatares e matices da música exprésanse correctamente en 16 bits por medida.
Ademais, si quérese conservar a música estéreo débense utilizar 2 canles. Finalmente, o son de calidade de CD require 1.411,2 Kbps (16 bits/talla x 44.100 medidas/s x 2 canles). Ou o que é o mesmo, paira gardar un segundo de son desa calidade necesítanse 1.411,2 kb (176 kB).
Esta calidade de CD é moi boa, quizais demasiado boa, porque o ser humano non é capaz de recibir toda a información que contén. Iso é o que di polo menos a psicoacústica. A psicoacústica analiza a percepción das características do son. E esa percepción, por suposto, ten os seus límites. Por exemplo, só podemos ouvir sons que están entre 20 e 20.000 Hz e coa idade a capacidade de escoitar altas frecuencias diminúe. En realidade son poucos os adultos capaces de ouvir máis de 16 kHz, cun límite de 10 kHz paira 60-70 anos.
Pois ben, os algoritmos MPEG utilizan modelos psicoacústicos paira medir os datos sobrantes e eliminar os que non podemos escoitar. Por unha banda, pódense eliminar directamente todos os sons que estean por baixo de 20 Hz e por encima de 20 kHz. Por outra banda, cando o son está en estéreo, adoita haber información repetida en ambas as canles. Por baixo dunha determinada frecuencia non somos capaces de distinguir de onde vén o son, polo que por baixo desas frecuencias basta con codificar unha soa canle.
Pero os modelos psicoacústicos son os que máis traballan co efecto de recubrimiento. Un son de certa frecuencia cobre un son máis débil cunha frecuencia similar e non somos capaces de escoitar o máis débil. É o que se coñece como efecto de recubrimiento, e canto máis próximas estean as frecuencias, maior é o tapado. Por exemplo, si cun son de 1 kHz temos outro de 1,1 kHz, pero este último ten 18 dB menos, só poderemos escoitar o primeiro. Se o segundo son é de 2 kHz, aínda que sexa 18 dB menos, ouvirase, xa que neste caso sería necesaria una diferenza de 45 dB paira cubrir o segundo.
O efecto de recubrimiento pode ser simultáneo, pero tamén ocorre entre sons moi próximos ao tempo. Ademais, a capacidade de resolución do noso oído varía moito en función da frecuencia. A maior sensibilidade atopámola entre 2 e 4 kHz, no mesmo rango que a voz humana. Pois todo isto teno en conta o codificador que comprime o son.
Paira iso, o espectro de frecuencias de 20 Hz a 20 kHz divídese primeiro en varias subcategorías, e posteriormente, aplicando modelos psicoacústicos en cada banda, calcúlase que información é máis importante e que menos. Dependendo da súa importancia, o número de bits que se utilizan paira almacenar esta información é diferente, é dicir, algúns datos poden ser eliminados directamente e moitos outros poden ser almacenados utilizando menos de 16 bits que outros.
Así, tras eliminar o que sobra e codificar o que se pode expresar con menos datos, cun algoritmo estándar só queda comprimir esa información. Finalmente pódese conseguir comprimir de 1.411,2 kbps de son non comprimido a 32-320 kbps. Con todo, a partir dun nivel de compresión, a perda de calidade é significativa e normalmente non supera os 128 kbps.
Por outra banda, a calidade da compresión varía moito segundo o codificador utilizado, xa que non todos codifican do mesmo xeito. Cun bo codificador, con 128 kbps a maioría non notará perda de calidade. Con todo, naqueles casos nos que o material que se vai a comprimir é máis difícil, ou nos que o oído do oínte está formado, poden ser necesarios 192 kbps paira evitar perdas. Con todo, o grao de compresión pode variar. Cada parte dos arquivos MP3 pode ter un grao de compresión diferente, de forma que cando o son ten máis dinamismo pódense utilizar máis bits paira obter una mellor calidade.
En definitiva, o mp3 é un formato á nosa medida. Preparado paira os nosos oídos. Capaz de facer música pequena sen tocar a súa grandeza.