Los reproductores de CD, DVD y, si me apuráis, Bluray agonizan. El abaratamiento que los dispositivos de almacenamiento han venido experimentado en los últimos años, a pesar de las recientes inundaciones en Tailandia, ha hecho que muchos audiófilos y videófilos nos hayamos lanzando de cabeza a trasladar nuestras colecciones en soporte óptico a grandes discos duros que, bien se conectan por medio de populares interfaces como USB o eSata directamente a los nuevos reproductores digitales, bien pueblan las tripas de servidores audiovisuales domésticos más o menos glamurosos como estos:
Vortexbox, o cómo convertir un PC en un servidor de medios basado en software libre.
ReadyNas Ultra4, un NAS de tomo y lomo.
Naim UnitiServe, un servidor / reproductor de medios con p€digrí.
Las ventajas de transmigrar o ripear los soportes físicos y darles un nuevo hogar digital en las entrañas de espaciosos discos duros son muchas: ahorro de espacio en casa, inmediatez en la reproducción, seguridad del medio, disponibilidad en varios puntos de escucha, reducción en muchos casos del jitter, etc. etc.
No deja de parecerme curioso, sin embargo, que esta tendencia hacia lo práctico conviva hoy en día con el auge de los vinilos, cuya experiencia de uso es la antítesis de la que aportan las tecnologías anteriormente descritas. Modernidad y tradición, lo Viejo y lo Nuevo, Yin y Yang... En fin, vamos al grano porque como suele ser habitual me estoy perdiendo entre las nubes.
Llevo unos días de trifulca amistosa con unos compañeros de Audio Planet discutiendo acerca de cuál es el mejor modo de convertir nuestra música almacenada en los cedeses de-los-de-toda-la-vida a un formato susceptible de ser almacenado en la pila de discos duros que los audiofriquis como nosotros acumulamos en casa. En concreto hablábamos de las bondades de un formato de codificación musical denominada flac y de lo aconsejable que resulta emplearlo en detrimento de otros más populares como es el caso de mp3.
Como quizás sepáis, flac es un formato de compresión de audio sin pérdidas. Esto quiere decir que reduce el tamaño de las pistas de música que extraemos de nuestros CDs sin que se pierda ni un ápice de información ni, por tanto, calidad. Ni un solo bit. De este modo se consigue reducir en torno a un 50% el espacio ocupado en disco pero permaneciendo totalmente fiel a la información original. Su funcionamiento es, salvando las distancias, similar al de los programas que nos permiten comprimir archivos en nuestro ordenador. Al comprimir se reduce el tamaño del archivo pero todo sigue ahí, basta con realizar el proceso simétrico (descomprimir) para recuperar el original.
Frente a esta estrategia, la compresión mp3 utiliza una serie de principios psicoacústicos para reducir enormemente el tamaño del archivo original a costa de descartar parte de la información auditiva, en teoría aquella que estadísticamente no puede ser percibida por el ser humano o, al menos, no resulta demasiado importante a la hora de preservar la calidad de la experiencia musical. Además, el proceso de extracción y conversión de audio es muy parametrizable puesto que se puede establecer de antemano la tasa de bits que deseamos que tenga el archivo mp3 resultante. La tasa de bits es por tanto un factor variable que puede tomar valores entre 16 Kbps y 320 Kbps. A mayor tasa de bits menor será la cantidad de información eliminada, mayor será la calidad percibida en el archivo mp3 resultante y su grado de fidelidad al original pero también mayor su tamaño. No es raro obtener tasas de compresión cercanas al 80% o 90% manteniendo una calidad razonable. Habitualmente se considera que una tasa de bits de 192 Kbps permite obtener una calidad cercana a la de un CD, pero reduciendo a una séptima parte el tamaño en disco.
Por todo ello el formato mp3 es inmensamente popular. Desde su creación en 1995 en el instituto Fraunhofer de Alemania (que ha ganado un cantidad indecente de dinero gracias a sus variadas patentes sobre él) su uso ha explotado a nivel mundial, siendo el estándar de facto para la transmisión de audio en Internet y contándose por millones los gadgets (portátiles, de automóvil, domésticos y profesionales) compatibles con él. Aunque existen alternativas similares de mayor calidad ya se sabe, quien golpea primero lo hace dos veces.
Por todo ello el formato mp3 es inmensamente popular. Desde su creación en 1995 en el instituto Fraunhofer de Alemania (que ha ganado un cantidad indecente de dinero gracias a sus variadas patentes sobre él) su uso ha explotado a nivel mundial, siendo el estándar de facto para la transmisión de audio en Internet y contándose por millones los gadgets (portátiles, de automóvil, domésticos y profesionales) compatibles con él. Aunque existen alternativas similares de mayor calidad ya se sabe, quien golpea primero lo hace dos veces.
Se suele afirmar que la compresión mp3 descarta todas las frecuencias existentes en el audio original por encima de los 16 Khz. Como probablemente sepáis los CDs de audio contienen información auditiva hasta los 22 Khz aproximadamente. Esto quiere decir que al comprimir un CD en mp3 perderíamos toda la información presente en el espectro entre 16 Khz y 22 Khz, lo que no deja de ser un buen agujero a pesar de que no muchas personas disponen de equipos de reproducción capaces de emitir audio en estas frecuencias correctamente ni, en cualquier caso, probablemente pudieran oirlas con claridad. No nos olvidemos de que la audición se va deteriorando con la edad y que una audiometría nos puede dar más de una sorpresa.
Al hilo de todo esto he realizado una serie de experimentos caseros para tratar de comparar la codificación sin pérdidas propia de formatos como flac o m4a (el equivalente al primero en el ecosistema Apple) con la correspondiente a mp3.
Lo primero que se me ha ocurrido ha sido ver cómo afecta la codificación en mp3 al espectro en frecuencia de un tono de prueba. Para ello he generado mediante Audacity una señal de ruído blanco con una frecuencia de 44 Khz y 5 segundos de duración para, a continuación, obtener una versión codificada en mp3@320 Kbps y su correspondiente análisis espectral comparado con el original. El ruido blanco está construido de forma que su energía espectral se distribuye de modo uniforme a lo largo de todas las frecuencias que oímos; es decir, contiene componentes en frecuencia variaditos (todos) y con la misma potencia, lo que lo hace ideal para probar cositas como la que nos ocupa.
El espectro del audio original y el convertido a mp3 resultan prácticamente idénticos hasta las inmediaciones de los 19,5 Khz, como podéis ver en las gráficas anteriores. Efectivamente hay un corte claro y contundente pero desde luego no en 16 Khz.
Como quiera que a pesar de su idoneidad para este tipo de pruebas un tono sintético no es lo que normalmente escucharmos cuando encendemos el equipo de música, he realizado también sendos experimentos de codificación a partir de un par de CDs para comparar el espectro en frecuencia de los archivos obtenidos empleando codificación sin pérdidas con sus correspondientes versiones mp3.
Vayamos con el primero. Se trata de un tema de Ana Caram denominado Africando que se puede encontrar en un CD recopilatorio de Chesky Records. A partir de la pista disponible en el CD original he obtenido una versión en formato flac, sin pérdidas, idéntica a la versión registrada en el CD, y otras dos en formato mp3:
- La primera empleando XLD, un estupendo software de conversión para Mac, y codificando a 260 Kbps con una tasa de bits variable (VBR). Cuando se codifica en VBR el algoritmo adapta dinámicamente la tasa de bits en función de las características de la muestra de audio, aumentándolo cuando lo estima necesario a partir del mínimo establecido, para maximizar la calidad de sonido manteniendo elevadas tasas de compresión. Esta estrategia permite obtener archivos de muy alta calidad y un tamaño óptimo. XLD utiliza internamente el excelente codificador LAME en su versión 3.99.3 para realizar la conversión.
- La segunda mediante iTunes en su versión para Mac y configurando el codificador con una tasa de bits de 320 Kbps. Daos cuenta de que en este caso activar la opción de VBR no tiene efecto alguno puesto que 320 es la tasa máxima admitida.
Ajustes XLD.
Ajustes iTunes.
Y aquí tenéis los resultados. Comencemos trazando potencia frente a frecuencia de los archivos resultantes gracias a unas estupendas FFT de 16384 puntos:
Flac 44 Khz / 16 bits.
mp3@260 Kbps VBR (XLD).
mp3@320 Kbps (iTunes).
Prácticamente no hay diferencias entre la versión flac y la versión mp3@320 Kbps y muy pequeñas entre la primera y la mp3@260 Kbps VBR obtenida con XLD. Veamos ahora los espectrogramas de la versión flac frente a la generada por iTunes:
Flac 44 Khz / 16 bits.
mp3@320 Kbps (iTunes).
Estas dos últimas gráficas, trazadas mediante Spek, muestran la evolución temporal de la señal en el eje horizontal y la potencia de una determinada componente en frecuencia en el vertical, utilizando colores más cálidos para indicar valores más altos. Este mapa es algo así como una radiografia temporal en el domino de la frecuencia de los archivos analizados. De nuevo nos encontramos con resultados muy similares y ni rastro de un enmudecimiento en torno a los 16 Khz.
¿Es entonces aquello del corte en 16 Khz un mito? Veamos ahora qué pasa si reducimos la calidad de la conversión mp3 hasta los 128 Kbps:
mp3@128 Kbps (XLD).
Hemos tenido que optar por una codificación mucho mas modesta para apreciar un claro efecto de corte de la señal entre los 16 Khz y 17 Khz. Empleando codificaciones más altas nada de nada. Tampoco resulta descabellado pensar que algunos de los mp3 que nos podemos encontrar en Internet han sido generados tras aplicar a la señal de audio un filtro paso - bajo con un corte cercano a 16 Khz precisamente para limitar su espectro, eliminando frecuencias poco relevantes para el común de los mortales, y conseguir que el algoritmo de codificación mp3 haga un mejor trabajo con el resto.
El segundo tema musical cuya codificación ha sido sometido a análisis es De Sentir, de Mª del Mar Bonet, que se puede encontrar en su maravilloso trabajo titulado Raixa. En este caso he optado, para darle un poco de color al asunto, por utilizar una codificación m4a (sin pérdidas de Apple) cuyas características son muy similares a flac por cuanto ambos algoritmos nos ofrecen compresión sin pérdidas y nos permiten obtener archivos cuya fidelidad al original es total consiguiendo una reducción muy parecida de su tamaño en disco. En este caso la versión codificada en mp3 se ha generado utilizando iTunes con sus ajustes de máxima calidad (320 Kbps).
Vamos a ver sin mayor preámbulo cuáles han sido los resultados.
m4a 44 Khz / 16 bits.
mp3@320 Kbps (iTunes).
m4a 44 Khz / 16 bits.
mp3@320 Kbps (iTunes).
Y nos encontramos aquí más de lo mismo: sutiles diferencias en las gráficas a partir de frecuencias muy elevadas. Os dejo con fines puramente experimentales algunas de las muestras de audio utilizadas por si queréis sacar a partir de ellas vuestras propias conclusiones. No perdáis de vista el tamaño, puede ser también un factor a tener muy en cuenta a la hora de comparar y tomar decisiones
- Ana Caram - Africando (flac, 44 Khz / 16 bits, 22.776 KB).
- Ana Caram - Africando (mp3@260 Kbps VBR, 7.254 KB).
- Ana Caram - Africando (mp3@320 Kbps, 8.766 KB).
- Mª del Mar Bonet - De Sentir (m4a, 44 Khz / 16 bits, 34.340 KB).
- Mª del Mar Bonet - De Sentir (mp3@320 Kbps, 12.261 KB).
Me he esforzado. Os lo juro. He escuchado atentamente y durante largo rato y de modo comparado los archivos flac y m4a por una parte y mp3@320 Kbps por otra, he intercalado y repetido fragmentos hasta el aburrimiento y he intentado fijarme en los más pequeños detalles. A pesar de eso he sido incapaz de distinguir flac y m4a de mp3 sin necesidad siquiera de orquestar una prueba ciega. Si hay diferencias audibles entre un mp3 codificado a 320 Kbps y su versión sin pérdidas, obtenidas ambas a partir de un CD convencional, yo no he sido capaz de encontrarlas en el transcurso de las pruebas aquí descritas. Quizás estas diferencias sean muy sutiles y la cacharrería artificial (DAC, amplificador, auriculares) o natural (oreja, tímpano, huesecillos, caracol) empleada no den para más. Quién sabe.
A pesar de esto hay muchas personas que dicen encontrar claras diferencias de calidad en estos casos. Curiosamente se trata a menudo de aficionados que suelen despreciar las pruebas ciegas, en las que el oyente no sabe qué está sonando en cada momento, para evaluar comparativamente la calidad percibida de dos experiencias musicales. Humildemente creo que se equivocan. Y es que o somos muy rigurosos con los ejercicios de comparación o la subjetividad que impregna el fenómeno auditivo puede acabar rápidamente con la credibilidad de las conclusiones a las que lleguemos. En cualquier caso y aún concediendo que algunas personas dotadas de un oído extraordinario y en posesión de equipos de muy alta gama pudieran ser capaces de encontrar estas diferencias de un modo repetible y congruente la conclusión, creo, sería irrelevante desde un punto de vista estadístico por infrecuente.
Dicho todo esto, y ya para concluir, mi opinión es que la codificación en mp3 a 256 Kbps VBR o 320 Kbps es perfectamente válida para almacenar archivos de audio de una razonablemente elevada calidad. Evidentemente cualquier estrategia de codificación con compresión sin pérdidas será preferible, especialmente para los puristas, cuando el espacio en disco no sea un problema... aunque solo sea por disfrutar de la tranquilidad mental que otorga tener la seguridad de que el audio original no ha sufrido mutación alguna en el proceso de codificación.
Ante la duda ya sabéis: probad, probad, porque en definitiva lo que es aceptable para algunas personas puede ser totalmente inadmisible para otras.
3 comentarios :
Muy buena explicación. Muchas gracias!!!
Hola amigo, yo te puedo decir que si encuentro diferencias audibles no a primera oida por no decir vista, pero si se llega a diferenciar aunque son por no decir minimas, uno son los graves y otra son q los mp3 suenan menos q el flac, la vibracion parece diferente tambien casi imperciptible, por lo que q como conclusion final, te puedo decir q si te gusta un disco en especial. Obten el de formato flac.
Muy buen informe. He realizado las mismas pruebas que vos, rippeando un cd original a FLAC y a MP3 320CBR. Sometí los archivos a un análisis de frecuencia con SPEK y también estuve buen rato intentando oir diferencias entre esos 2 formatos, usando foobar y auriculares Sennheiser HD 408. No logro distinguir diferencias.
Publicar un comentario