viernes, 1 de marzo de 2013

Bits y Muestreo: Entendiendo el audio digital (Parte 1)


Antes que nada definamos una diferencia: Sonido es el fenómeno físico, es la diferencia de presión que se propaga en un medio (en gran parte de los casos, el aire) cuya vibración entra en el rango audible del ser humano (por convención entre 20 Hz y 20 kHz); Audio es el registro, transmisión o proceso electrónico de ese fenómeno físico. Hablamos de audio analógico cuando ese fenómeno se representa con formas de onda análogas a la presión en el medio (aire). Y hablamos de audio digital cuando es representado por una sucesión de 1s y 0s.

Una diferencia importante entre analógico y digital es que dentro del dominio analógico la cantidad de "pasos intermedios", de variaciones entre dos puntos de una señal, es infinito. Mientras que en el audio digital se trata de una representación discreta de esos valores, de cantidad limitada.

Mucho se ha hablado y se va a seguir hablando de la fidelidad de esa representación, porque cuando uno digitaliza un sonido lo que hace es intentar representar con la mayor exactitud posible PERO en pasos discretos un fenómeno contínuo, por lo que es inevitable que en ese traspaso algo se va a perder. En todo caso lo que se intenta es que se pierda lo menos posible, lo menos significativo, lo menos identificatorio. De ahí vienen las infinitas discusiones entre los "fundamentalistas" de uno y otro lado.

Como sucede con toda la tecnología, con el paso del tiempo mejora la calidad y se abaratan los costos, logrando que los precios de un conversor A/D (de analógico a digital) sean mucho menores que años atrás.  La tecnología digital, lógicamente, cada vez suena mejor y tiene mayor capacidad de procesamiento.

Ese conjunto de "unos" y "ceros" intenta ser la mejor aproximación posible de lo que sucedió en la realidad, del fenómeno físico del sonido y de cómo interpreta el oído humano (y el cerebro) ese fenómeno.

Entonces, ¿cómo comparamos o medimos los conversores? Comencemos por intentar alejarnos un poco de la subjetividad. La mejor manera es enfocarnos en dos parámetros de la conversión: la cantidad de bits (bit depth) y la frecuencia de muestreo (sampling rate). Para tener una noción aproximada de qué representa cada una:




(c) opinosonido.blogspot.com
click en la imagen para agrandar

El conversor, entonces, parte esa línea infinita para poder transformarla en pasos discretos. Por cada segundo de sonido toma X cantidad de muestras, que determinan un período de muestreo. Entonces la frecuencia de muestreo es 1/X (la inversa del período de muestreo). Por ejemplo: si la frecuencia de muestreo es de 44.100 Hz significa que por cada segundo el conversor toma 44.100 muestras. En nuestro gráfico, significa que entre el punto "A" y el punto "B" se tomaron 44.100 muestras, espaciadas por igual en el tiempo, dentro de ese segundo.

Y cada una de esas muestras tiene una amplitud, una determinada "altura" en la onda. La cantidad de valores posibles de cada muestra está definida por el número de bits. Si la cantidad de bits es 16, entonces los valores posibles de cada muestra son 216 (65.536 valores posibles -rayas rojas en nuestro gráfico-). Ese número nos da el rango dinámico teórico que puede procesar un conversor. A mayor cantidad de bits, mayor rango dinámico.

Se ve muy fácil que teóricamente, más bits y mayor frecuencia de muestreo implicaría una mejor representación de la onda. Pero eso no significa mayor calidad ni que sea más agradable a nuestro oído, por ejemplo: un conversor 16 bits 44.1 kHz puede sonar mejor que otro 24 bits 48 kHz. La cantidad de bits y la frecuencia de muestreo sólo son indicaciones de cómo interpretar esa cadena de 1s y 0s, pero no necesariamente implican una mejor calidad de audio. Eso está definido por otras variables, como el diseño, la calidad de fabricación, la estabilidad del clock y otros factores.

(continúa en el próximo post)

1 comentario:

  1. Hermano, me dejaste con las ganas de seguir leyendo.. peor que la novela de las 4 de la tarde. Al final parece que la ley de que el tamaño (ya sea bits, hertz, cms, pulgadas, etc.) no es lo más importante sino la pasta de lo que está hecho, es universal. ;)

    ResponderEliminar