WEBVTT 1 00:00:08.252 --> 00:00:11.550 Hola, soy Monty Montgomery de Red Hat y Xiph.Org. 2 00:00:11.550 --> 00:00:18.430 Hace pocos meses, escribí un artículo sobre audio digital y por qué las descargas de música en 24bit/192kHz no tienen sentido. 3 00:00:18.430 --> 00:00:23.433 En el artículo mencioné al pasar que una forma de onda digital no es escalonada, 4 00:00:23.433 --> 00:00:28.680 y que al convertirla nuevamente en análoga ciertamente no se obtiene una onda escalonada. 5 00:00:29.865 --> 00:00:33.865 Con respecto al artículo, fue eso sobre lo que más me escribió la gente. 6 00:00:33.865 --> 00:00:37.221 De hecho, más de la mitad del correo que recibí fueron preguntas y comentarios 7 00:00:37.221 --> 00:00:39.663 sobre el comportamiento básico de las señales digitales. 8 00:00:39.894 --> 00:00:45.285 Debido a ese interés, tomémonos un poco de tiempo para jugar con algunas señales digitales sencillas. 9 00:00:49.747 --> 00:00:51.006 Supongamos, por un momento, 10 00:00:51.006 --> 00:00:54.089 que no tuviéramos la menor idea de cómo se comportan estas señales. 11 00:00:54.734 --> 00:00:56.841 En tal caso no tendría sentido para nosotros 12 00:00:56.841 --> 00:00:59.049 usar equipos de ensayo digitales. 13 00:00:59.049 --> 00:01:00.937 Afortunadamente para este ejercicio, todavía hay 14 00:01:00.937 --> 00:01:04.020 bastantes equipos analógicos de laboratorio que funcionan. 15 00:01:04.020 --> 00:01:05.972 Lo primero que necesitamos es un generador de señal 16 00:01:05.972 --> 00:01:08.190 para proporcionar señales de entrada analógicas. 17 00:01:08.190 --> 00:01:12.692 En este caso, un generador HP3325 de 1978. 18 00:01:12.692 --> 00:01:14.153 Todavía es un muy buen generador, 19 00:01:14.153 --> 00:01:15.614 así que si a uno no le preocupa el tamaño, 20 00:01:15.614 --> 00:01:16.532 el peso, 21 00:01:16.532 --> 00:01:17.577 el consumo de energía, 22 00:01:17.577 --> 00:01:18.910 y el ruido del ventilador, 23 00:01:18.910 --> 00:01:20.329 se lo puede encontrar en eBay. 24 00:01:20.329 --> 00:01:23.863 A veces por poco más que lo que se paga el envío. 25 00:01:24.617 --> 00:01:28.500 Luego observaremos nuestras señales analógicas en un osciloscopio analógico, 26 00:01:28.500 --> 00:01:31.550 como este Tektronix 2246 de los 90, 27 00:01:31.550 --> 00:01:34.761 uno de los últimos y mejores osciloscopios jamás fabricado. 28 00:01:34.761 --> 00:01:36.807 Todo laboratorio hogareño debería tener uno de éstos. 29 00:01:37.716 --> 00:01:40.852 Finalmente, veremos el espectro de frecuencias de nuestras señales 30 00:01:40.852 --> 00:01:43.177 usando un analizador de espectro analógico. 31 00:01:43.177 --> 00:01:47.732 Este HP3585, de la mísma linea de productos que el generador de señal. 32 00:01:47.732 --> 00:01:50.615 Como los otros equipos, posee un microcontrolador 33 00:01:50.615 --> 00:01:52.905 rudimentario y voluminoso hasta el ridículo, 34 00:01:52.905 --> 00:01:56.276 pero el camino de la señal desde la entrada hasta lo que se ve en la pantalla 35 00:01:56.276 --> 00:01:58.537 es completamente analógico. 36 00:01:58.537 --> 00:02:00.329 Todo este equipo es clásico, 37 00:02:00.329 --> 00:02:01.993 pero a pesar de su peso bruto, 38 00:02:01.993 --> 00:02:03.844 las especificaciones todavía son muy buenas. 39 00:02:04.536 --> 00:02:06.868 En este momento tenemos nuestro generador de señal 40 00:02:06.868 --> 00:02:12.829 generando una hermosa onda senoidal de 1 kHz y 1 V RMS 41 00:02:13.414 --> 00:02:15.220 Vemos la onda senoidal en el osciloscopio, 42 00:02:15.220 --> 00:02:21.428 y podemos verificar que realmente es de 1 kHz y 1 V RMS, 43 00:02:21.428 --> 00:02:24.108 que es lo mismo que 2,83 V pico a pico, 44 00:02:24.308 --> 00:02:27.561 y que corresponde a la medición del analizador de espectro. 45 00:02:27.561 --> 00:02:30.644 El analizador también muestra algo de ruido blanco de bajo nivel 46 00:02:30.644 --> 00:02:32.190 y apenas un poco de distorsión armónica, 47 00:02:32.190 --> 00:02:36.649 con su máximo pico unos 70 dB debajo de la fundamental. 48 00:02:36.649 --> 00:02:38.612 Esto no tendrá importancia en nuestra demostración, 49 00:02:38.612 --> 00:02:40.574 pero quería señalarlo en este momento 50 00:02:40.574 --> 00:02:42.452 por las dudas que ustedes no lo notaran. 51 00:02:44.036 --> 00:02:47.142 Ahora intercalaremos muestreo digital. 52 00:02:48.557 --> 00:02:51.024 Para la conversión utilizaremos un aburrido 53 00:02:51.024 --> 00:02:53.374 dispositivo de audio eMagic USB1 de bajo costo. 54 00:02:53.374 --> 00:02:55.337 En este momento ya cumplió más de 10 años, 55 00:02:55.337 --> 00:02:57.257 y se está voviendo obsoleto. 56 00:02:57.964 --> 00:03:02.676 Un conversor más actual puede tener fácilmente especificaciones mejores en un orden de magnitud. 57 00:03:03.076 --> 00:03:07.924 Respuesta plana, linealidad, jitter, ruido, todo... 58 00:03:07.924 --> 00:03:09.353 Tal vez no lo notaron. 59 00:03:09.353 --> 00:03:11.604 Sólo porque podemos medir una mejora 60 00:03:11.604 --> 00:03:13.609 no significa que podamos escucharla, 61 00:03:13.609 --> 00:03:16.404 e incluso estas placas de bajo costo ya alcanzaban 62 00:03:16.404 --> 00:03:18.643 el límite de la transparencia ideal. 63 00:03:20.244 --> 00:03:22.825 La eMagic se conecta a mi ThinkPad, 64 00:03:22.825 --> 00:03:26.121 que muestra la forma de onda digital y el espectro para comparación, 65 00:03:26.121 --> 00:03:28.788 luego la ThinkPad reenvía la señal digital 66 00:03:28.788 --> 00:03:30.921 a la eMagic para su reconversión a análoga 67 00:03:30.921 --> 00:03:33.332 y observación con el osciloscopio. 68 00:03:33.332 --> 00:03:35.582 De la entrada a la salida, izquierda a derecha. 69 00:03:40.211 --> 00:03:41.214 OK, vamos a empezar. 70 00:03:41.214 --> 00:03:43.924 Comenzamos convirtiendo una señal analógica a digital 71 00:03:43.924 --> 00:03:47.347 y luego nuevamente a analógica sin ningín otro paso intermedio. 72 00:03:47.347 --> 00:03:49.268 El generador de señal se configura para producir 73 00:03:49.268 --> 00:03:52.649 una onda senoidal de 1 kHz ligual que antes. 74 00:03:52.649 --> 00:03:57.428 Podemos ver la onda senoidal en la entrada con el osciloscopio. 75 00:03:57.428 --> 00:04:01.694 Digitalizamos la señal a 16 bit PCM y 44.1 kHz, 76 00:04:01.694 --> 00:04:03.828 igual que en un CD. 77 00:04:03.828 --> 00:04:07.156 El espectro de la señal digital concuerda con el que vimos antes y... 78 00:04:07.156 --> 00:04:10.836 lo que vemos ahora en el analizador de espectro analógico, 79 00:04:10.836 --> 00:04:15.154 aparte de que su alta impedancia de entrada es algo más ruidosa. 80 00:04:15.154 --> 00:04:15.956 Por ahora 81 00:04:18.248 --> 00:04:20.798 la pantalla muestra la onda senoidal digitalizada 82 00:04:20.798 --> 00:04:23.966 como un patrón escalonado con un escalón por muestra. 83 00:04:23.966 --> 00:04:26.388 Pero cuando miramos la señal de salida 84 00:04:26.388 --> 00:04:29.054 que ha sido reconvertida de digital a análoga, vemos... 85 00:04:29.054 --> 00:04:32.052 ¡Que es exactamente como la onda senoidal original! 86 00:04:32.052 --> 00:04:33.483 No hay escalones. 87 00:04:33.914 --> 00:04:37.193 De acuerdo, 1 kHz es todavía una frecuencia bastante baja, 88 00:04:37.193 --> 00:04:40.633 Puede ser que los escalones sean sólo difíciles de apreciar o que hayan sido suavizados. 89 00:04:40.739 --> 00:04:49.492 Veamos. Elijamos una frecuencia más alta, algo más cercana a Nyquist, digamos 15 kHz. 90 00:04:49.492 --> 00:04:53.545 Ahora la onda senoidal está representada por menos de tres muestras por ciclo... 91 00:04:53.545 --> 00:04:55.838 y la forma de onda digital se ve horrible. 92 00:04:55.838 --> 00:04:59.798 Bueno, las apariencias engañan. La salida analógica... 93 00:05:01.876 --> 00:05:06.033 sigue siendo una onda senoidal perfecta, igual que la original. 94 00:05:06.633 --> 00:05:09.228 Sigamos subiendo. 95 00:05:17.353 --> 00:05:20.151 16 kHz.... 96 00:05:23.198 --> 00:05:25.616 17 kHz... 97 00:05:28.201 --> 00:05:29.945 18 kHz... 98 00:05:33.822 --> 00:05:35.548 19 kHz... 99 00:05:40.457 --> 00:05:42.465 20kHz. 100 00:05:49.097 --> 00:05:52.350 Bienvenidos al límite superior de la audición humana. 101 00:05:52.350 --> 00:05:54.377 La forma de onda de salida sigue siendo perfecta. 102 00:05:54.377 --> 00:05:58.025 No hay bordes dentados, caída de tensión, ni escalones. 103 00:05:58.025 --> 00:06:01.342 ¿Adónde fueron los escalones? 104 00:06:01.342 --> 00:06:03.198 No respondan, es una pregunta capciosa. 105 00:06:03.198 --> 00:06:04.318 Nunca estuvieron allí. 106 00:06:04.318 --> 00:06:06.652 Dibujar la forma de onda digital escalonada 107 00:06:08.712 --> 00:06:10.772 no es correcto. por empezar. 108 00:06:10.942 --> 00:06:11.998 ¿Por qué? 109 00:06:11.998 --> 00:06:14.366 Una onda escalonada es una función de tiempo continuo. 110 00:06:14.366 --> 00:06:16.201 Presenta saltos y es constannte a trozos, 111 00:06:16.201 --> 00:06:19.700 pero tiene un valor definido en cualquier instante de tiempo. 112 00:06:19.700 --> 00:06:22.004 Una señal muestreada es completamente diferente. 113 00:06:22.004 --> 00:06:23.337 Es en tiempo discreto; 114 00:06:23.337 --> 00:06:27.337 sólo tiene valores en los instantes de muestreo 115 00:06:27.337 --> 00:06:32.596 y está indefinida, es decir, no posee ningun valor, en puntos intermedios. 116 00:06:32.596 --> 00:06:36.666 Una señal en tiempo discreto se dibuja más propiamente con barras. 117 00:06:40.020 --> 00:06:42.974 La contraparte análoga y continua de una señal digital 118 00:06:42.974 --> 00:06:45.364 pasa suavemente por cada muestra, 119 00:06:45.364 --> 00:06:50.153 y eso es tan cierto para alta como para baja frecuencia. 120 00:06:50.153 --> 00:06:53.033 Ahora, el detalle interesante pero para nada obvio, es: 121 00:06:53.033 --> 00:06:55.454 Hay sólo una señal limitada en banda que pasa 122 00:06:55.454 --> 00:06:57.417 exactamente por cada muestra. 123 00:06:57.417 --> 00:06:58.708 Es una solución única. 124 00:06:58.708 --> 00:07:01.246 Por lo tanto si uno muestrea una señal limitada en banda 125 00:07:01.246 --> 00:07:02.612 y luego la reconvierte a análoga nuevamente, 126 00:07:02.612 --> 00:07:06.462 la señal original es también la única salida posible. 127 00:07:06.462 --> 00:07:07.838 Y antes de que digan, 128 00:07:07.838 --> 00:07:11.721 "¡Eh! Yo puedo dibujar diferentes señales que pasan por esos puntos." 129 00:07:11.721 --> 00:07:14.283 Bueno, sí, es posible pero... 130 00:07:17.268 --> 00:07:20.521 si difiere incluso apenas de la original, 131 00:07:20.521 --> 00:07:24.905 entonces contendrá frecuencias por encima de Nyquist, 132 00:07:24.905 --> 00:07:26.185 dejará de cumplir con el requisito de estar limitada en banda 133 00:07:26.185 --> 00:07:28.358 y no será una solución válida. 134 00:07:28.574 --> 00:07:30.036 Entonces, ¿cómo es que todo el mundo se ha confundido 135 00:07:30.036 --> 00:07:32.702 y empezó a pensar en las señales digitales como escalones? 136 00:07:32.702 --> 00:07:34.900 Se me ocurren dos buenas razones. 137 00:07:34.900 --> 00:07:37.956 Primero, es sencillo convertir una señal muestreada 138 00:07:37.972 --> 00:07:39.294 en una verdadera señal escalonada. 139 00:07:39.294 --> 00:07:42.409 Basta extender el valor de cada muestra hasta el próximo periodo de muestreo. 140 00:07:42.409 --> 00:07:44.414 Esto se llama retención de orden cero, 141 00:07:44.414 --> 00:07:47.913 y es una parte importante de algunos conversores digital / analógicos, 142 00:07:47.913 --> 00:07:50.089 especialmente los más simples. 143 00:07:50.089 --> 00:07:55.591 Así, cualquiera que hace una búsqueda sobre conversión digital/analógica 144 00:07:55.592 --> 00:07:59.550 probablemente terminará encontrando alguna forma de onda escalonada, 145 00:07:59.550 --> 00:08:01.982 pero ésa no es una conversión completa, 146 00:08:01.982 --> 00:08:04.250 ni es la señal de salida del conversor. 147 00:08:04.944 --> 00:08:05.684 Segundo, 148 00:08:05.684 --> 00:08:07.529 y esta es posiblemente la razón más probable, 149 00:08:07.529 --> 00:08:09.449 los ingenieros que se supone conocen el tema, 150 00:08:09.449 --> 00:08:10.441 como yo, 151 00:08:10.441 --> 00:08:13.193 dibujan escalones aunque son técnicamente incorrectos. 152 00:08:13.193 --> 00:08:15.571 Es una especie de versión unidimensional de 153 00:08:15.571 --> 00:08:17.395 los puntos gordos en un editor de imágenes. 154 00:08:17.395 --> 00:08:19.241 Los píxeles no son cuadrados, 155 00:08:19.241 --> 00:08:23.081 son muestras de una función bidimensional así que son, también, 156 00:08:23.081 --> 00:08:26.366 conceptualmente, puntos infinitamente pequeños. 157 00:08:26.366 --> 00:08:28.500 En la práctica es un verdadero parto ver 158 00:08:28.500 --> 00:08:30.804 o manipuilar cualquier cosa infinitamente pequeña. 159 00:08:30.804 --> 00:08:32.212 De allí los cuadrados rellenos. 160 00:08:32.212 --> 00:08:35.966 Los gráficos escalonados son exactamente lo mismo. 161 00:08:35.966 --> 00:08:37.684 Es un dibujo conveniente. 162 00:08:37.684 --> 00:08:40.404 Los escalones realmente no existen. 163 00:08:45.652 --> 00:08:48.233 Cuando convertimos la señal digital nuevamente en análoga, 164 00:08:48.233 --> 00:08:50.900 el resultado es también suave independientemente de la resolución en bits. 165 00:08:50.900 --> 00:08:53.193 24 bits ó 16 bits... 166 00:08:53.193 --> 00:08:54.196 u 8 bits... 167 00:08:54.196 --> 00:08:55.486 No afecta. 168 00:08:55.486 --> 00:08:57.534 ¿Eso significa que la resolución en bit 169 00:08:57.534 --> 00:08:58.953 no hace ninguna diferencia? 170 00:08:59.245 --> 00:09:00.521 Por supuesto que sí la hace. 171 00:09:02.121 --> 00:09:06.046 El canal 2 aquí es la misma señal de entrada 172 00:09:06.046 --> 00:09:09.086 pero recuantizada con dither bajando a 8 bit. 173 00:09:09.086 --> 00:09:14.174 En el canal 2 del osciloscopio, aún vemos una forma de onda senoidal bonita y suave. 174 00:09:14.174 --> 00:09:18.014 Mirando muy de cerca, se verá también un poquito más de ruido. 175 00:09:18.014 --> 00:09:19.305 Ésa es una pista. 176 00:09:19.305 --> 00:09:21.273 Si miramos el espectro de la señal... 177 00:09:22.889 --> 00:09:23.732 ¡Ahá! 178 00:09:23.732 --> 00:09:26.398 Nuestra señal está allí inalterable, 179 00:09:26.398 --> 00:09:28.490 pero el nivel de ruido de la señal de 8 bit 180 00:09:28.490 --> 00:09:32.470 en el segundo canal ¡es mucho más alta! 181 00:09:32.948 --> 00:09:36.148 Y esa es la diferencia debida al número de bits. 182 00:09:36.148 --> 00:09:37.434 ¡Así es! 183 00:09:37.822 --> 00:09:39.956 Cuando digitalizamos una señal, primero la muestreamos. 184 00:09:39.956 --> 00:09:42.366 La etapa de muestreo es perfecta. No se pierde nada. 185 00:09:42.366 --> 00:09:45.626 Pero luego la cuantizamos, y la cuantización agrega ruido. 186 00:09:47.827 --> 00:09:50.793 El número de bits determina cuánto ruido 187 00:09:50.793 --> 00:09:52.569 y también el nivel del piso de ruido. 188 00:10:00.170 --> 00:10:03.646 ¿Cómo suena esta cuantizacioón con dither? 189 00:10:03.646 --> 00:10:06.012 Escuchemos nuestra onda senoidal de 8 bit. 190 00:10:12.521 --> 00:10:15.273 Puede ser difícil escuchar otra cosa además del tono. 191 00:10:15.273 --> 00:10:18.740 Escuchemos sólo el ruido una vez eliminado el tono 192 00:10:18.740 --> 00:10:21.683 y aumentado la ganancia un poco porque el ruido es bajo. 193 00:10:32.009 --> 00:10:35.049 Quienes hayan usado equipos de grabación analógicos 194 00:10:35.049 --> 00:10:36.670 seguramente pensaron 195 00:10:36.670 --> 00:10:40.382 "¡Por Dios! ¡Suena como el soplido de cinta!" 196 00:10:40.382 --> 00:10:41.929 Bueno, no sólo sonaba como ruido de cinta, 197 00:10:41.929 --> 00:10:43.433 sino que actúa como si lo fuera, 198 00:10:43.433 --> 00:10:45.225 y si usamos dither gaussiano 199 00:10:45.225 --> 00:10:47.646 entonces es equivalente en todos los aspectos. 200 00:10:47.646 --> 00:10:49.225 ES soplido de cinta. 201 00:10:49.225 --> 00:10:51.774 Intuitivamente esto significa que podemos medir el soplido de cinta 202 00:10:51.774 --> 00:10:54.196 y por lo tanto el piso de ruido de la cinta magnética 203 00:10:54.196 --> 00:10:56.233 en bits en lugar de en decibeles, 204 00:10:56.233 --> 00:10:59.902 para poner las cosas en una perspectiva digital. 205 00:10:59.902 --> 00:11:03.028 Cassetes compactos... 206 00:11:03.028 --> 00:11:05.449 Para quienes son suficientemente viejos para recordarlos, 207 00:11:05.449 --> 00:11:09.161 se podían alcanzar hasta 9 bits en perfectas condiciones, 208 00:11:09.161 --> 00:11:11.209 aunque 5 ó 6 era lo más típico, 209 00:11:11.209 --> 00:11:13.876 especialmente si era una grabaciuón hecha en una cassetera. 210 00:11:13.876 --> 00:11:19.422 Es así... las cintas de cassete tenían sólo seis bits... ¡Con suerte! 211 00:11:19.837 --> 00:11:22.345 La mejor cinta profesional de carrete abierto 212 00:11:22.345 --> 00:11:24.553 usada en estudios podía escasamente alcanzar... 213 00:11:24.553 --> 00:11:26.473 ¿Alguna idea...? 214 00:11:26.473 --> 00:11:27.604 13 bits 215 00:11:27.604 --> 00:11:28.980 con reducción de ruido avanzada. 216 00:11:28.980 --> 00:11:32.062 Y es por eso que ver "DDD" en un cassete compacto 217 00:11:32.062 --> 00:11:35.208 se consideraba el sumum. 218 00:11:40.116 --> 00:11:42.825 En todo momento dije que estaba cuantizando con dither, 219 00:11:42.825 --> 00:11:44.734 pero... ¿qué es dither, exactamente? 220 00:11:44.734 --> 00:11:47.284 Más importante: ¿Qué es lo que hace? 221 00:11:47.284 --> 00:11:49.876 La forma simple de cuantizar una señal es elegir 222 00:11:49.876 --> 00:11:52.329 el valor de amplitud digital cercana 223 00:11:52.329 --> 00:11:54.377 a la amplitud análoga original. 224 00:11:54.377 --> 00:11:55.337 Obvio ¿no? 225 00:11:55.337 --> 00:11:57.545 Desgraciadamente, el ruido exacto que se obtiene 226 00:11:57.545 --> 00:11:59.220 a partir de este esquema simple de cuantización 227 00:11:59.220 --> 00:12:02.174 depende en cierta medida de la señal de entrada, 228 00:12:02.174 --> 00:12:04.596 por lo tanto uno puede obtener ruido que no es siempre igual, 229 00:12:04.596 --> 00:12:06.142 o causa distorsión, 230 00:12:06.142 --> 00:12:09.054 o es indeseable de algún otro modo. 231 00:12:09.054 --> 00:12:11.764 Dither es un ruido especialmente generado 232 00:12:11.764 --> 00:12:15.273 que sustituye al ruido producido por simple cuantización. 233 00:12:15.273 --> 00:12:18.025 El dither no desplaza o enmascara al ruido de cuantización, 234 00:12:18.025 --> 00:12:20.190 en realidad lo reemplaza 235 00:12:20.190 --> 00:12:22.612 con un ruido cuyas características podemos elegir 236 00:12:22.612 --> 00:12:24.794 y que no dependen de la entrada. 237 00:12:25.256 --> 00:12:27.081 Veamos qué hace el dither. 238 00:12:27.081 --> 00:12:30.078 El generador de señal tiene demasiado ruido para esta prueba 239 00:12:30.431 --> 00:12:33.161 por lo cual lo generaremos una señal senoidal 240 00:12:33.161 --> 00:12:34.782 matemáticamente perfecta con el ThinkPad 241 00:12:34.782 --> 00:12:38.205 y la cuantizaremos a 8 bit con dither. 242 00:12:39.006 --> 00:12:41.342 Vemos una linda onda senoidal en la pantalla 243 00:12:41.342 --> 00:12:43.452 y en el opsciloscopio 244 00:12:44.222 --> 00:12:44.972 y... 245 00:12:46.588 --> 00:12:49.375 tan pronto como el analizador de espectro responda... 246 00:12:50.713 --> 00:12:53.588 aparece un pico frecuencial limpio con un piso de ruido uniforme 247 00:12:56.864 --> 00:12:58.611 en los dos dispositivos de análisis espectral, 248 00:12:58.611 --> 00:12:59.646 igual que antes. 249 00:12:59.646 --> 00:13:01.549 Nuevamente, esto sucede con dither. 250 00:13:02.196 --> 00:13:04.225 Ahora deshabilito el dither. 251 00:13:05.779 --> 00:13:07.913 El ruido de cuantización que el dither había desparramado 252 00:13:07.913 --> 00:13:09.577 en un piso de ruido plano, 253 00:13:09.577 --> 00:13:12.286 se apila ahora en picos de distorsión armónica. 254 00:13:12.286 --> 00:13:16.030 El piso de ruido es menor pero la distorsion se vuelve no nula, 255 00:13:16.030 --> 00:13:19.668 y los picos de distorsión son más altos que el ruido debido al dither. 256 00:13:19.668 --> 00:13:22.318 Para 8 bits el efecto queda exagerado. 257 00:13:22.488 --> 00:13:24.200 Para 16 bit, 258 00:13:24.692 --> 00:13:25.929 aun sin dither, 259 00:13:25.929 --> 00:13:28.308 la distorsión armónica es tan baja 260 00:13:28.308 --> 00:13:30.708 que se torna completamente inaudible. 261 00:13:30.708 --> 00:13:34.581 Aun así podemos usar dither para eliminarla completamente 262 00:13:34.581 --> 00:13:36.489 si así lo preferimos. 263 00:13:37.642 --> 00:13:39.273 Quitando el dither nuevamente, por un momento, 264 00:13:40.934 --> 00:13:43.444 se notará que el nivel absoluto de distorsión 265 00:13:43.444 --> 00:13:47.070 debido a la cuantización sin dither es aproximadamente constante 266 00:13:47.070 --> 00:13:49.033 independientemente de la amplitud de entrada. 267 00:13:49.033 --> 00:13:51.998 Pero cuando la señal baja por debajo de 1/2 bit, 268 00:13:51.998 --> 00:13:54.036 toda la señal se cuantiza a 0. 269 00:13:54.036 --> 00:13:54.910 En un sentido, 270 00:13:54.910 --> 00:13:58.557 la cuantización de toda la señal a 0... ¡es una distorsión del 100 %! 271 00:13:58.833 --> 00:14:01.588 El dither eslimina esta distorsión también. 272 00:14:01.588 --> 00:14:03.599 Si volvemos a aplicar dither... 273 00:14:03.599 --> 00:14:06.377 tendremos de nuevo nuestra señal de 1/4 bit, 274 00:14:06.377 --> 00:14:09.076 con un bonito piso de ruio. 275 00:14:09.630 --> 00:14:11.220 El piso de ruido no necesita ser plano. 276 00:14:11.220 --> 00:14:12.798 El dither es un ruido que podemos elegir, 277 00:14:12.798 --> 00:14:15.006 así que elijamos un ruido que resulte tan inofensivo 278 00:14:15.006 --> 00:14:17.017 y difícil de percibir como sea posible. 279 00:14:18.142 --> 00:14:22.484 Nuestra audición es más sensible en el rengo medio de 2 kHz a 4 kHz, 280 00:14:22.484 --> 00:14:25.438 por lo que es allí que el ruido de fondo será más obvio. 281 00:14:25.438 --> 00:14:29.406 Podemos conformar el dither de modo de alejarlo de las frecuencias sensibles 282 00:14:29.406 --> 00:14:31.241 hacia donde el oído es menos sensible, 283 00:14:31.241 --> 00:14:33.910 en general, las altas frecuencias. 284 00:14:34.249 --> 00:14:37.460 En 16 bit el ruido de dither es normalmente demasaido débil para ser audible, 285 00:14:37.460 --> 00:14:39.668 pero escuchemos nuestro ejemplo de conformacióin de ruido, 286 00:14:39.668 --> 00:14:42.234 nuevamente subiendo bastante la ganancia... 287 00:14:56.020 --> 00:14:59.977 Por último, el ruido de cuantización con dither tiene mayor potencia total 288 00:14:59.977 --> 00:15:04.276 que sin dither, aun cuando suena múcho más débil. 289 00:15:04.276 --> 00:15:07.902 Eso se puede apreciar en un VUmetro durante pasajes casi en silencio. 290 00:15:07.902 --> 00:15:10.537 Pero el dither no es una elección por sí o no.. 291 00:15:10.537 --> 00:15:14.712 Podemos reducir la potencia del dither para balancear menos ruido 292 00:15:14.712 --> 00:15:18.313 versus algo de distorsión para minimizar el efecto global. 293 00:15:19.605 --> 00:15:22.790 Modulemos la señal de entrada de esta forma: 294 00:15:27.098 --> 00:15:30.206 ... para mostrar cómo una entrada variable afecta el ruido de cuantización. 295 00:15:30.206 --> 00:15:33.289 Usando máximo dither, el ruido es uniforme, constante, 296 00:15:33.289 --> 00:15:35.643 y no tiene aspectos que resaltan, tal como esperamos: 297 00:15:40.937 --> 00:15:42.772 A medida que reducimos la potencia del dither, 298 00:15:42.772 --> 00:15:46.356 la entrada tiene un efecto cada vez mayor sobre la amplitud y el carácter 299 00:15:46.356 --> 00:15:47.977 del ruido de cuantización: 300 00:16:09.883 --> 00:16:13.844 El dither conformado se comporta similarmente, 301 00:16:13.844 --> 00:16:16.553 pero la conformación de ruido presenta otra atractiva ventaja. 302 00:16:16.553 --> 00:16:18.804 Para hacer corta una larga historia, se puede usar 303 00:16:18.804 --> 00:16:20.937 una menor potencia de dither antes de la entrada 304 00:16:20.937 --> 00:16:23.662 para obtener un mayor efecto en la salida. 305 00:16:49.172 --> 00:16:51.508 A pesar de todo el tiempo que le dediqué al dither, 306 00:16:51.508 --> 00:16:53.012 estamos hablando de diferencias 307 00:16:53.012 --> 00:16:56.372 que empiezan 100 decibeles por debajo del fondo de escala. 308 00:16:56.372 --> 00:16:59.806 Es posible que si el CD hubiera tenido 14 bits según el diseño original, 309 00:16:59.806 --> 00:17:01.513 el dither podría ser más importante. 310 00:17:01.989 --> 00:17:02.644 Puede ser. 311 00:17:02.644 --> 00:17:05.438 Para 16 bits, realmente, es un lavado de cara. 312 00:17:05.438 --> 00:17:08.019 Se puede pensar en el dither como una póliza de seguro 313 00:17:08.019 --> 00:17:11.443 que proporciona decibeles extra de rango dinámico... 314 00:17:11.443 --> 00:17:12.804 por si acaso. 315 00:17:12.990 --> 00:17:14.196 El hecho simple es, sin embargo, 316 00:17:14.196 --> 00:17:16.361 que nunca nadie arruinó una gran grabación 317 00:17:16.361 --> 00:17:19.182 por no aplicar dither al master final. 318 00:17:24.414 --> 00:17:25.790 Hemos estado usando ondas senoidales. 319 00:17:25.790 --> 00:17:28.254 Son la elección obvia cuando lo que queremos ver 320 00:17:28.254 --> 00:17:32.212 es el comportamiento de un sistema en una frecuencia aislada. 321 00:17:32.212 --> 00:17:34.217 Ahora echemos una ojeada a algo un poco más complejo. 322 00:17:34.217 --> 00:17:35.923 ¿Qué deberíamos esperar que suceda 323 00:17:35.923 --> 00:17:39.671 al cambiar la entrada por una onda cuadrada? 324 00:17:42.718 --> 00:17:45.921 El osciloscopio muestra nuestra onda cuadrada de 1 kHz a la entrada. 325 00:17:45.921 --> 00:17:47.351 En la salida muestra... 326 00:17:48.614 --> 00:17:51.102 Exactamente lo que debería. 327 00:17:51.102 --> 00:17:53.900 ¿Qué es, realmente, una onda cuadrada? 328 00:17:54.654 --> 00:17:57.982 Bien, podemos decir que es una onda con algún valor positivo 329 00:17:57.982 --> 00:18:00.788 durante medio ciclo que luego transiciona instantáneamente 330 00:18:00.788 --> 00:18:02.910 a un valor negativo durante la otra mitad. 331 00:18:02.910 --> 00:18:05.076 Pero esto no nos dice nada útil 332 00:18:05.076 --> 00:18:07.241 acerca de cómo esta entrada 333 00:18:07.241 --> 00:18:09.378 se transforma en esta salida. 334 00:18:10.132 --> 00:18:12.713 Luego recordamos que cualquier forma de onda 335 00:18:12.713 --> 00:18:15.508 es también la suma de frecuencias discretas 336 00:18:15.508 --> 00:18:18.302 y una onda cuadrada es particularmente una simple suma 337 00:18:18.302 --> 00:18:19.636 de una fundamental 338 00:18:19.636 --> 00:18:22.228 y una serie infinita de armónicos. 339 00:18:22.228 --> 00:18:24.597 Sumándolos a todos, se obtiene la onda cuadrada. 340 00:18:26.398 --> 00:18:27.433 A primera vista, 341 00:18:27.433 --> 00:18:29.225 esto no parece demasiado útil tampoco. 342 00:18:29.225 --> 00:18:31.561 Hay que sumar infinitos armónicos 343 00:18:31.561 --> 00:18:33.108 para obtener el resultado. 344 00:18:33.108 --> 00:18:35.977 Ah, pero no tenemos un número infinito de armónicos. 345 00:18:36.960 --> 00:18:39.902 Estamos utilizando un filtro antialias muy selectivo 346 00:18:39.902 --> 00:18:42.206 que recorta todo lo que está por encima de 20 kHz 347 00:18:42.206 --> 00:18:44.158 por lo que nuestra señal está limitada en banda, 348 00:18:44.158 --> 00:18:46.421 lo cual significa que obtenemos esto: 349 00:18:52.500 --> 00:18:56.468 ... que es exactamente lo que vemos con el oscilosciopio a la salida. 350 00:18:56.468 --> 00:18:59.550 La ondulación que se observa cerca de los bordes empinados en una señal limitada en banda 351 00:18:59.550 --> 00:19:00.926 se llama effecto Gibbs. 352 00:19:00.926 --> 00:19:04.137 Sucede siempre que se elimina una parte del dominio frecuencial 353 00:19:04.137 --> 00:19:07.006 en una zona donde la energía no era 0 354 00:19:07.006 --> 00:19:09.854 Como regla general, cuanto más abrupto es el recorte 355 00:19:09.854 --> 00:19:11.188 más fuerte es la ondulación, 356 00:19:11.188 --> 00:19:12.777 lo cual es aproximadamente cierto, 357 00:19:12.777 --> 00:19:14.900 pero tenemos que ser cautos al pensar en ello. 358 00:19:14.900 --> 00:19:15.774 Por ejemplo... 359 00:19:15.774 --> 00:19:19.529 ¿Qué cabe esperar que hará nuestro abrupto filtro antialias 360 00:19:19.529 --> 00:19:23.181 si hacemos pasar la señal a través de él por segunda vez? 361 00:19:34.136 --> 00:19:37.588 Además de agregar unas pocas fracciones de ciclo de retardo, 362 00:19:37.588 --> 00:19:39.348 la respuesta es... 363 00:19:39.348 --> 00:19:40.857 Nada. 364 00:19:41.257 --> 00:19:43.302 La señal ya está limitada en banda. 365 00:19:43.656 --> 00:19:46.590 La nueva limitación en banda no hace nada. 366 00:19:46.590 --> 00:19:50.686 Una segunda pasada no puede eliminar frecuencias que ya se habían elilminado. 367 00:19:52.070 --> 00:19:53.737 Y eso es importante. 368 00:19:53.737 --> 00:19:56.233 La gente tiende a pensar que las ondulaciones son un efecto colateral 369 00:19:56.233 --> 00:19:59.945 del uso de los filtros antialias y de suavizado, 370 00:19:59.945 --> 00:20:01.737 insinuando que las ondulacioens son cada vez peores 371 00:20:01.737 --> 00:20:03.913 cada vez que la señal atraviesa el filtro. 372 00:20:03.913 --> 00:20:05.950 Vemos que en este caso ello no sucede. 373 00:20:05.950 --> 00:20:09.492 Entonces: ¿fue realmente el filtro que agregó ondulaciones la primera vez? 374 00:20:09.492 --> 00:20:10.537 Realmente no. 375 00:20:10.537 --> 00:20:12.126 Es una distinción sutil, 376 00:20:12.126 --> 00:20:15.252 pero las ondulaciones del efecto Gibbs no son agregadas por el filtro, 377 00:20:15.252 --> 00:20:18.836 son parte de cualquier señal limitada en banda. 378 00:20:18.836 --> 00:20:20.798 Aun si construimos sintéticamente 379 00:20:20.798 --> 00:20:23.508 algo que parece una onda cuadrada digital perfecta, 380 00:20:23.508 --> 00:20:26.206 sigue estando limitada al ancho de banda del canal. 381 00:20:26.206 --> 00:20:29.140 Recordemnos que la representación escalonada es engañosa. 382 00:20:29.140 --> 00:20:32.222 Lo que realmente tenemos aquí son muestras inatantáneas, 383 00:20:32.222 --> 00:20:36.148 y sólo una señal limitada en banda puede pasar por esos puntos. 384 00:20:36.148 --> 00:20:39.614 Lo único que hicimos cuando dibujamos la onda cuadrada aparentemente perfecta 385 00:20:39.614 --> 00:20:43.198 fue alinear los puintos dando la impresión 386 00:20:43.198 --> 00:20:47.785 de que que no había ondulaciones si jugábamos al juego de conectar los puntos. 387 00:20:47.785 --> 00:20:49.449 Pero la señal original limitada en banda, 388 00:20:49.449 --> 00:20:52.742 incluyendo las ondulaciones, seguía estando allí. 389 00:20:54.004 --> 00:20:56.542 Y esto nos lleva a otro punto importante. 390 00:20:56.542 --> 00:20:59.550 Probablemente escucharon que la precisión temporal en una señal digital 391 00:20:59.550 --> 00:21:02.409 se limita a su tasa de muestreo; en otras palabras, 392 00:21:02.409 --> 00:21:05.140 que las señales digitales no pueden representar algo 393 00:21:05.140 --> 00:21:08.041 que cae entre medio de dos muestras... 394 00:21:08.041 --> 00:21:11.422 insinuando que los impulsos o ataques rápidos deben estar alineados 395 00:21:11.422 --> 00:21:14.473 exactamente con una muestra, o la temporización se desarma... 396 00:21:14.473 --> 00:21:16.219 o directamente desaparecen. 397 00:21:16.711 --> 00:21:20.820 A esta altura podemos ver fácilemnte por qué esto es erróneo: 398 00:21:20.820 --> 00:21:23.742 Nuevamente, nuestras señales de entrada están limitadas en banda. 399 00:21:23.742 --> 00:21:26.036 Y las señales digitales son muestras, 400 00:21:26.036 --> 00:21:29.340 no escalones, no puntos conectados. 401 00:21:31.572 --> 00:21:34.592 Podemos ciertamente colocar, por ejemplo, 402 00:21:36.777 --> 00:21:39.337 el flanco ascendente de nuestra onda cuadrada limitada en banda 403 00:21:39.337 --> 00:21:42.004 donde queramos entre muestras. 404 00:21:42.004 --> 00:21:44.354 Quedará representada perfecamente 405 00:21:47.508 --> 00:21:50.218 y se reconstruye perfectamente. 406 00:22:04.620 --> 00:22:06.526 Igual que en el episodio previo, 407 00:22:06.526 --> 00:22:08.393 hemos cubierto un amplio rango de temas, 408 00:22:08.393 --> 00:22:10.868 y sin embargo apenas rascamos la superficie de cada uno. 409 00:22:10.868 --> 00:22:13.620 Como mínimo, mis pecados por omisión son mayores esta vez... 410 00:22:13.620 --> 00:22:16.286 pero este es un buen punto de llegada. 411 00:22:16.286 --> 00:22:17.833 O, tal vez, un buen punto de partida. 412 00:22:17.833 --> 00:22:18.708 Escarben más profundamente. 413 00:22:18.708 --> 00:22:19.710 Experimenten. 414 00:22:19.710 --> 00:22:21.374 Yo elijo mis demostraciones muy cuidadosamente 415 00:22:21.374 --> 00:22:23.668 para ser sencillas y dar resultados claros. 416 00:22:23.668 --> 00:22:26.217 Pueden reproducir cada una de ellas por sus propios medios, si quieren. 417 00:22:26.217 --> 00:22:28.766 Pero, seamos realistas, algunas veces aprendemos más 418 00:22:28.766 --> 00:22:30.516 sobre un lindo juguete despanzurrándolo 419 00:22:30.516 --> 00:22:32.553 y estudiando las piezas que van cayendo. 420 00:22:32.553 --> 00:22:35.230 Y está bien, somos ingenieros. 421 00:22:35.230 --> 00:22:36.350 Jueguen con los parámetros de las demostraciones, 422 00:22:36.350 --> 00:22:37.972 hackeen el código, 423 00:22:37.972 --> 00:22:39.774 planteen experimentos alternativos. 424 00:22:39.774 --> 00:22:40.692 El código fuente para todo, 425 00:22:40.692 --> 00:22:42.398 incluyendo la pequeña aplicación demo, 426 00:22:42.398 --> 00:22:44.361 está en Xiph.Org. 427 00:22:44.361 --> 00:22:45.940 En el curso de la experimentación, 428 00:22:45.940 --> 00:22:47.401 seguramente se encontrarán con algo 429 00:22:47.401 --> 00:22:49.950 que no esperaban ni pueden explicar. 430 00:22:49.950 --> 00:22:51.198 ¡No se preocupen! 431 00:22:51.198 --> 00:22:54.537 Dejando la cháchara anterior a un costado, Wikipedia es fantásticca 432 00:22:54.537 --> 00:22:56.788 precisamente para esta clase de búsqueda casual. 433 00:22:56.788 --> 00:22:59.956 Si ustedes realmente quieren comprender las señales a fondo, 434 00:22:59.956 --> 00:23:03.337 varias universidades tienen material avanzado en línea, 435 00:23:03.337 --> 00:23:07.380 Tales como los módulos 6.003 y 6.007 sobre Señales y Sistemas 436 00:23:07.380 --> 00:23:08.798 del MIT OpenCourseWare. 437 00:23:08.798 --> 00:23:11.593 Y, por supuesto, la comunidad está siempre aquí en Xiph.Org. 438 00:23:12.792 --> 00:23:13.929 Escarbando más o no, 439 00:23:13.929 --> 00:23:14.974 me quedé sin café, 440 00:23:14.974 --> 00:23:16.436 así que hasta la próxima, 441 00:23:16.436 --> 00:23:19.316 ¡Feliz hackeo!