WEBVTT

1
00:00:08.252 --> 00:00:11.550
Olá, eu sou Monty Montgomery da Red Hat e Xiph.Org.

2
00:00:11.550 --> 00:00:18.430
Alguns meses atrás eu escrevi um artigo sobre áudio digital
e por que downloads de música em 24bits/192kHz não fazem sentido.

3
00:00:18.430 --> 00:00:23.433
Neste artigo eu mencionei, quase de passagem,
que uma forma de onda digital não tem forma escalonada,

4
00:00:23.433 --> 00:00:28.680
e você certamente não obtém uma forma escalonada
ao converter da representação digital de volta à analógica.

5
00:00:29.865 --> 00:00:33.865
De todas as coisas naquele artigo inteiro,
*essa* foi a que mais gente comentou a respeito.

6
00:00:33.865 --> 00:00:37.221
De fato, mais da metade dos emails que recebi
eram perguntas e comentários

7
00:00:37.221 --> 00:00:39.663
relativos ao comportamento básico de sinais digitais.

8
00:00:39.894 --> 00:00:45.285
Já que existe o interesse, vamos tomar um tempinho
e brincar com alguns sinais digitais _simples_.

9
00:00:49.747 --> 00:00:51.006
Faça de conta por um momento

10
00:00:51.006 --> 00:00:54.089
que não temos ideia nenhuma de como sinais digitais
realmente se comportam.

11
00:00:54.734 --> 00:00:56.841
Neste caso também não faz sentido para nós

12
00:00:56.841 --> 00:00:59.049
usarmos equipamento digital de teste.

13
00:00:59.049 --> 00:01:00.937
Felizmente para esse exercício, ainda há

14
00:01:00.937 --> 00:01:04.020
bastante equipamento analógico de laboratório funcionando por aí.

15
00:01:04.020 --> 00:01:05.972
Antes de mais nada, precisamos de um gerador de sinais

16
00:01:05.972 --> 00:01:08.190
para nos fornecer sinais de entrada analógicos--

17
00:01:08.190 --> 00:01:12.692
nesse caso, um HP3325 de 1978.

18
00:01:12.692 --> 00:01:14.153
Ele ainda é um gerador bastante bom,

19
00:01:14.153 --> 00:01:15.614
então se você não se importar com o tamanho,

20
00:01:15.614 --> 00:01:16.532
o peso,

21
00:01:16.532 --> 00:01:17.577
o consumo de energia,

22
00:01:17.577 --> 00:01:18.910
e a ventoinha barulhenta,

23
00:01:18.910 --> 00:01:20.329
você irá encontrá-lo no eBay.

24
00:01:20.329 --> 00:01:23.863
Às vezes por apenas um pouco mais do que você pagará pelo frete.

25
00:01:24.617 --> 00:01:28.500
Depois, vamos observar nossas formas de onda analógicas
em osciloscópios analógicos,

26
00:01:28.500 --> 00:01:31.550
como esse Tektronix 2246 de meados dos anos 1990s,

27
00:01:31.550 --> 00:01:34.761
um dos últimos e melhores osciloscópios analógicos já feitos.

28
00:01:34.761 --> 00:01:36.807
Todo laboratório caseiro deveria ter um destes.

29
00:01:37.716 --> 00:01:40.852
E finalmente inspecionaremos o espectro em frequência de nossos sinais

30
00:01:40.852 --> 00:01:43.177
usando um analisador espectral analógico.

31
00:01:43.177 --> 00:01:47.732
Esse HP3585 da mesma linha de produtos que o gerador de sinais.

32
00:01:47.732 --> 00:01:50.615
Assim como os outros equipamentos aqui ele tem um microcontrolador

33
00:01:50.615 --> 00:01:52.905
rudimentar e ridiculamente grande,

34
00:01:52.905 --> 00:01:56.276
mas o caminho dos sinais da entrada até o que você vê na tela

35
00:01:56.276 --> 00:01:58.537
é completamente analógico.

36
00:01:58.537 --> 00:02:00.329
Todo este equipamento é vintage,

37
00:02:00.329 --> 00:02:01.993
mas apesar de seu tamanho brutal,

38
00:02:01.993 --> 00:02:03.844
as características técnicas são bastante boas.

39
00:02:04.536 --> 00:02:06.868
Neste momento, nós temos nosso gerador de sinais

40
00:02:06.868 --> 00:02:12.829
ajustado para produzir uma bela onda senoidal de 1kHz com 1 Volt RMS,

41
00:02:13.414 --> 00:02:15.220
nós vemos a onda senoidal no osciloscópio,

42
00:02:15.220 --> 00:02:21.428
podemos confirmar que ela tem de fato 1kHz e 1 Volt RMS,

43
00:02:21.428 --> 00:02:24.108
que corresponde a 2.8V pico-a-pico,

44
00:02:24.308 --> 00:02:27.561
e que também corresponde à medição no analisador de espectro.

45
00:02:27.561 --> 00:02:30.644
O analisador mostra ainda um pouco de ruído branco de fundo

46
00:02:30.644 --> 00:02:32.190
e um tantinho de distorção harmônica,

47
00:02:32.190 --> 00:02:36.649
com o maior pico cerca de 70dB abaixo do nível da fundamental.

48
00:02:36.649 --> 00:02:38.612
Agora, isso não importa em nada na nossa demonstração,

49
00:02:38.612 --> 00:02:40.574
mas eu gostaria de chamar a atenção para isso agora

50
00:02:40.574 --> 00:02:42.452
para o caso de você só percebê-lo mais tarde.

51
00:02:44.036 --> 00:02:47.142
Agora a gente vai colocar a amostragem digital no meio do processo.

52
00:02:48.557 --> 00:02:51.024
Para a conversão, usaremos um dispositivo de áudio

53
00:02:51.024 --> 00:02:53.374
chato e baratinho, o eMagic USB1.

54
00:02:53.374 --> 00:02:55.337
Ele também tem mais de 10 anos de idade agora,

55
00:02:55.337 --> 00:02:57.257
e está se tornando obsoleto.

56
00:02:57.964 --> 00:03:02.676
Um conversor recente pode facilmente apresentar características
técnicas até uma ordem de magnitude melhores.

57
00:03:03.076 --> 00:03:07.924
Planaridade do espectro, linearidade, jitter, ruído, tudo...

58
00:03:07.924 --> 00:03:09.353
Você pode não ter percebido:

59
00:03:09.353 --> 00:03:11.604
só porque conseguimos medir uma certa melhoria

60
00:03:11.604 --> 00:03:13.609
não significa que possamos ouvi-la,

61
00:03:13.609 --> 00:03:16.404
e mesmo essas caixas velhas e baratas já estavam

62
00:03:16.404 --> 00:03:18.643
na fronteira da transparência ideal.

63
00:03:20.244 --> 00:03:22.825
O eMagic se conecta ao meu ThinkPad,

64
00:03:22.825 --> 00:03:26.121
que mostra a forma de onda e o espectro digitais para compararmos,

65
00:03:26.121 --> 00:03:28.788
e então o ThinkPad manda o sinal digital diretamente de volta

66
00:03:28.788 --> 00:03:30.921
para o eMagic para ser reconvertido em analógico

67
00:03:30.921 --> 00:03:33.332
e observarmos no osciloscópio de saída.

68
00:03:33.332 --> 00:03:35.582
Da entrada para a saída, da esquerda para a direita.

69
00:03:40.211 --> 00:03:41.214
OK, é hora de avançarmos.

70
00:03:41.214 --> 00:03:43.924
Começamos convertendo um sinal analógico para a representação digital

71
00:03:43.924 --> 00:03:47.347
e imediatamente em seguida para analógico de novo,
sem nenhum outro passo.

72
00:03:47.347 --> 00:03:49.268
O gerador de sinais está ajustado para produzir

73
00:03:49.268 --> 00:03:52.649
uma onda senoidal de 1kHz exatamente como antes.

74
00:03:52.649 --> 00:03:57.428
Podemos ver nossa onda senoidal analógica no osciloscópio da entrada.

75
00:03:57.428 --> 00:04:01.694
Digitalizamos nosso sinal usando codificação PCM de 16 bits
com 44.1kHz de taxa de amostragem,

76
00:04:01.694 --> 00:04:03.828
exatamente como em um CD.

77
00:04:03.828 --> 00:04:07.156
O espectro do sinal digitalizado corresponde ao que vimos antes, e...

78
00:04:07.156 --> 00:04:10.836
ao que vemos agora no analisador de espectro analógico,

79
00:04:10.836 --> 00:04:15.154
a menos do fato da entrada de alta-impedância
ser minimamente mais ruidosa.

80
00:04:15.154 --> 00:04:15.956
Por ora

81
00:04:18.248 --> 00:04:20.798
a tela com a forma de onda mostra nossa senoide digitalizada

82
00:04:20.798 --> 00:04:23.966
com um padrão escalonado, um degrau para cada amostra.

83
00:04:23.966 --> 00:04:26.388
E quando olhamos o sinal de saída

84
00:04:26.388 --> 00:04:29.054
que foi reconvertido de volta do digital para o analógico,
nós vemos...

85
00:04:29.054 --> 00:04:32.052
que ele é exatamente como a onda senoidal original.

86
00:04:32.052 --> 00:04:33.483
Sem degraus ou escadas.

87
00:04:33.914 --> 00:04:37.193
OK, 1kHz ainda é uma frequência razoavelmente baixa,

88
00:04:37.193 --> 00:04:40.633
talvez os degraus sejam apenas difíceis de ver
ou estão sendo suavizados por alguma razão.

89
00:04:40.739 --> 00:04:49.492
Tudo bem. Vamos escolher uma frequência
mais alta, algo próximo à frequência de Nyquist, digamos 15kHz.

90
00:04:49.492 --> 00:04:53.545
Agora a onda senoidal é representado por menos
de 3 amostras por ciclo, e...

91
00:04:53.545 --> 00:04:55.838
a forma de onda digital parece bem feia.

92
00:04:55.838 --> 00:04:59.798
Bem, as aparências enganam. A saída analógica...

93
00:05:01.876 --> 00:05:06.033
ainda é uma onda senoidal perfeita, exatamente como a original.

94
00:05:06.633 --> 00:05:09.228
Vamos continuar subindo.

95
00:05:17.353 --> 00:05:20.151
16kHz....

96
00:05:23.198 --> 00:05:25.616
17kHz...

97
00:05:28.201 --> 00:05:29.945
18kHz...

98
00:05:33.822 --> 00:05:35.548
19kHz...

99
00:05:40.457 --> 00:05:42.465
20kHz.

100
00:05:49.097 --> 00:05:52.350
Bem-vindos ao limiar superior da audição humana.

101
00:05:52.350 --> 00:05:54.377
A forma de onda na saída ainda é perfeita.

102
00:05:54.377 --> 00:05:58.025
Sem zigue-zagues, sem variações abruptas, sem degraus.

103
00:05:58.025 --> 00:06:01.342
Então pra onde foram os degraus?

104
00:06:01.342 --> 00:06:03.198
Não responda, é uma pegadinha.

105
00:06:03.198 --> 00:06:04.318
Eles nunca estiveram lá.

106
00:06:04.318 --> 00:06:06.652
Desenhar um sinal digital como uma escada

107
00:06:08.712 --> 00:06:10.772
era errado pra começo de conversa.

108
00:06:10.942 --> 00:06:11.998
Por que?

109
00:06:11.998 --> 00:06:14.366
Uma forma escalonada é uma função de tempo contínuo.

110
00:06:14.366 --> 00:06:16.201
Ela tem descontinuidades, é definida por trechos,

111
00:06:16.201 --> 00:06:19.700
mas possui um valor definido para cada instante de tempo.

112
00:06:19.700 --> 00:06:22.004
Um sinal amostrado é completamente diferente.

113
00:06:22.004 --> 00:06:23.337
Ele é de tempo discreto;

114
00:06:23.337 --> 00:06:27.337
ele só possui valor exatamente em cada instante de tempo amostrado

115
00:06:27.337 --> 00:06:32.596
e não está definido, simplesmente não possui valor,
em qualquer outro ponto.

116
00:06:32.596 --> 00:06:36.666
Um sinal de tempo discreto é desenhado corretamente como
um gráfico de traços verticais.

117
00:06:40.020 --> 00:06:42.974
O correspondente contínuo/analógico de um sinal digital

118
00:06:42.974 --> 00:06:45.364
passa suavemente através de cada amostra,

119
00:06:45.364 --> 00:06:50.153
e isso é tanto verdade para frequências altas quanto
para as baixas.

120
00:06:50.153 --> 00:06:53.033
Agora, o ponto interessante e nem um pouco óbvio é esse:

121
00:06:53.033 --> 00:06:55.454
há apenas um sinal de banda limitada que passa

122
00:06:55.454 --> 00:06:57.417
exatamente através de cada amostra.

123
00:06:57.417 --> 00:06:58.708
A solução é única.

124
00:06:58.708 --> 00:07:01.246
Assim se você amostra um sinal de banda limitada

125
00:07:01.246 --> 00:07:02.612
e depois o converte de volta,

126
00:07:02.612 --> 00:07:06.462
a entrada original é também a única saída possível.

127
00:07:06.462 --> 00:07:07.838
E antes que você diga

128
00:07:07.838 --> 00:07:11.721
"Ah, mas eu consigo desenhar um sinal diferente que passa
através desses pontos."

129
00:07:11.721 --> 00:07:14.283
Bem, sim é verdade, mas...

130
00:07:17.268 --> 00:07:20.521
se ele diferir ainda que minimamente do original,

131
00:07:20.521 --> 00:07:24.905
ele contém componentes de frequência maiores ou iguais
à frequência de Nyquist,

132
00:07:24.905 --> 00:07:26.185
viola o pré-requisito de limitação de banda

133
00:07:26.185 --> 00:07:28.358
e não é uma solução válida.

134
00:07:28.574 --> 00:07:30.036
Então como todo mundo se confundiu

135
00:07:30.036 --> 00:07:32.702
e começou a pensar em sinais digitais como formas escalonadas?

136
00:07:32.702 --> 00:07:34.900
Eu posso imaginar duas boas razões.

137
00:07:34.900 --> 00:07:37.956
Primeiro: é bastante fácil converter um sinal amostrado

138
00:07:37.972 --> 00:07:39.294
em uma forma escalonada verdadeira.

139
00:07:39.294 --> 00:07:42.409
Basta estender cada valor de amostra para a frente
até a próxima amostra.

140
00:07:42.409 --> 00:07:44.414
Esse é conhecido como um amostrador de ordem zero,

141
00:07:44.414 --> 00:07:47.913
e é uma parte importante de como alguns conversores
analógico-para-digital funcionam,

142
00:07:47.913 --> 00:07:50.089
especialmente aqueles mais simples.

143
00:07:50.089 --> 00:07:55.591
Então, qualquer um que busque informações sobre conversão
analógico-para-digital

144
00:07:55.592 --> 00:07:59.550
provavelmente encontrará em algum lugar um diagrama
de uma forma de onda escalonada,

145
00:07:59.550 --> 00:08:01.982
mas aquilo não é uma conversão completa,

146
00:08:01.982 --> 00:08:04.250
e não é o sinal que sai do conversor.

147
00:08:04.944 --> 00:08:05.684
Segundo,

148
00:08:05.684 --> 00:08:07.529
e essa é possivelmente a razão mais provável,

149
00:08:07.529 --> 00:08:09.449
engenheiros que supostamente sabem o que estão fazendo,

150
00:08:09.449 --> 00:08:10.441
como eu,

151
00:08:10.441 --> 00:08:13.193
desenham escadinhas mesmo sabendo que isso é tecnicamente errado.

152
00:08:13.193 --> 00:08:15.571
É meio como uma versão unidimensional dos

153
00:08:15.571 --> 00:08:17.395
quadradinhos em um editor de imagens.

154
00:08:17.395 --> 00:08:19.241
Pixels também não são quadrados,

155
00:08:19.241 --> 00:08:23.081
eles são amostras de uma função do espaço bidimensional e portanto

156
00:08:23.081 --> 00:08:26.366
eles também são, conceitualmente, pontos infinitesimalmente pequenos.

157
00:08:26.366 --> 00:08:28.500
Na prática, é um pé no saco ver

158
00:08:28.500 --> 00:08:30.804
ou manipular qualquer coisa infinitesimalmente pequena.

159
00:08:30.804 --> 00:08:32.212
Então ficam os quadradinhos.

160
00:08:32.212 --> 00:08:35.966
Desenhos de escadinhas digitais são exatamente a mesma coisa.

161
00:08:35.966 --> 00:08:37.684
É só um desenho conveniente.

162
00:08:37.684 --> 00:08:40.404
Os degraus não estão realmente ali.

163
00:08:45.652 --> 00:08:48.233
Quando convertemos um sinal digital de volta ao analógico,

164
00:08:48.233 --> 00:08:50.900
o resultado _também_ é suave, independentemente
do número de bits por amostra.

165
00:08:50.900 --> 00:08:53.193
24 bits ou 16 bits...

166
00:08:53.193 --> 00:08:54.196
ou 8 bits...

167
00:08:54.196 --> 00:08:55.486
não importa.

168
00:08:55.486 --> 00:08:57.534
Então isso quer dizer que o número de bits por amostra em uma

169
00:08:57.534 --> 00:08:58.953
codificação digital não faz diferença alguma?

170
00:08:59.245 --> 00:09:00.521
É claro que não.

171
00:09:02.121 --> 00:09:06.046
O canal 2 aqui é a mesma entrada de onda senoidal,

172
00:09:06.046 --> 00:09:09.086
mas nós quantizamos com dither usando apenas 8 bits.

173
00:09:09.086 --> 00:09:14.174
No osciloscópio, ainda vemos uma onda senoidal
suave e bela no canal 2.

174
00:09:14.174 --> 00:09:18.014
Olhando bem de perto, você verá também
um pouco mais de ruído.

175
00:09:18.014 --> 00:09:19.305
Essa é uma pista.

176
00:09:19.305 --> 00:09:21.273
Se olharmos para o espectro do sinal...

177
00:09:22.889 --> 00:09:23.732
ahá!

178
00:09:23.732 --> 00:09:26.398
Nossa onda senoidal ainda está lá sem ser perturbada,

179
00:09:26.398 --> 00:09:28.490
mas o nível de ruído do sinal de oito bits

180
00:09:28.490 --> 00:09:32.470
no segundo canal é muito maior!

181
00:09:32.948 --> 00:09:36.148
E essa é a diferença que o número de bits faz.

182
00:09:36.148 --> 00:09:37.434
É isso!

183
00:09:37.822 --> 00:09:39.956
Quando digitalizamos um sinal, primeiro nós o amostramos.

184
00:09:39.956 --> 00:09:42.366
O passo da amostragem é perfeito; ele não perde nada.

185
00:09:42.366 --> 00:09:45.626
Mas depois nós quantizamos o sinal,
e a quantização adiciona ruído.

186
00:09:47.827 --> 00:09:50.793
O número de bits determina o quanto de ruído

187
00:09:50.793 --> 00:09:52.569
e assim o nível do patamar de ruído.

188
00:10:00.170 --> 00:10:03.646
Como soa esse ruído de quantização com dither?

189
00:10:03.646 --> 00:10:06.012
Vamos ouvir nossa onda senoidal com oito bits.

190
00:10:12.521 --> 00:10:15.273
Pode ter sido difícil de escutar qualquer coisa fora o tom.

191
00:10:15.273 --> 00:10:18.740
Vamos ouvir apenas o ruído depois de filtrarmos apenas
a frequência da onda senoidal

192
00:10:18.740 --> 00:10:21.683
e elevarmos o volume um pouco porque este ruído é muito sutil.

193
00:10:32.009 --> 00:10:35.049
Aqueles entre vocês que já usaram equipamento de gravação analógica

194
00:10:35.049 --> 00:10:36.670
devem ter pensado agora

195
00:10:36.670 --> 00:10:40.382
"Caramba! Isso soa como chiado de fita!"

196
00:10:40.382 --> 00:10:41.929
Bem, ele não apenas soa como chiado de fita,

197
00:10:41.929 --> 00:10:43.433
mas se comporta como ele também,

198
00:10:43.433 --> 00:10:45.225
e se usarmos um dither Gaussiano

199
00:10:45.225 --> 00:10:47.646
então eles são matematicamente equivalente em todos os sentidos.

200
00:10:47.646 --> 00:10:49.225
Isso _é_ chiado de fita.

201
00:10:49.225 --> 00:10:51.774
Intuitivamente, isso significa que podemos medir o chiado de fita

202
00:10:51.774 --> 00:10:54.196
e portanto o patamar de ruído de fitas magnéticas de áudio

203
00:10:54.196 --> 00:10:56.233
em bits ao invés de decibéis,

204
00:10:56.233 --> 00:10:59.902
a fim de colocar as coisas em uma perspectiva digital.

205
00:10:59.902 --> 00:11:03.028
Fitas cassete...

206
00:11:03.028 --> 00:11:05.449
para aqueles de vocês que são velhos o bastante para se lembrar delas,

207
00:11:05.449 --> 00:11:09.161
poderiam alcançar um patamar de ruído
de até nove bits em condições perfeitas,

208
00:11:09.161 --> 00:11:11.209
apesar de cinco ou seis bits ser mais típico,

209
00:11:11.209 --> 00:11:13.876
especialmente se for uma gravação realizada em um gravador comum.

210
00:11:13.876 --> 00:11:19.422
É isso aí... suas coletâneas em fita tinham apenas seis bits
de precisão... se você teve sorte!

211
00:11:19.837 --> 00:11:22.345
Os gravadores de rolo mais profissionais

212
00:11:22.345 --> 00:11:24.553
usados em estúdios mal podiam chegar a...

213
00:11:24.553 --> 00:11:26.473
algum chute?...

214
00:11:26.473 --> 00:11:27.604
13 bits

215
00:11:27.604 --> 00:11:28.980
_com_ sistemas avançados de redução de ruído.

216
00:11:28.980 --> 00:11:32.062
E é por isso que ver 'DDD' escrito em um CD

217
00:11:32.062 --> 00:11:35.208
costumava ser um grande diferencial, alta qualidade.

218
00:11:40.116 --> 00:11:42.825
Eu estou sempre dizendo que estou quantizando com dither,

219
00:11:42.825 --> 00:11:44.734
mas o que é dither exatamente?

220
00:11:44.734 --> 00:11:47.284
Mais importante ainda, o que é que ele faz?

221
00:11:47.284 --> 00:11:49.876
O jeito simples de quantizar um sinal é escolher

222
00:11:49.876 --> 00:11:52.329
o valor de amplitude digital mais próximo

223
00:11:52.329 --> 00:11:54.377
da amplitude analógica original.

224
00:11:54.377 --> 00:11:55.337
Óbvio, né?

225
00:11:55.337 --> 00:11:57.545
Infelizmente, o ruído exato que você obtém

226
00:11:57.545 --> 00:11:59.220
usando este esquema de quantização simples

227
00:11:59.220 --> 00:12:02.174
depende um tanto do sinal da entrada,

228
00:12:02.174 --> 00:12:04.596
e por isso podemos obter ruído inconsistente,

229
00:12:04.596 --> 00:12:06.142
ou que causa distorção,

230
00:12:06.142 --> 00:12:09.054
ou que é indesejável em algum outro sentido.

231
00:12:09.054 --> 00:12:11.764
Dither é um ruído fabricado especialmente para

232
00:12:11.764 --> 00:12:15.273
substituir o ruído produzido pela quantização simples.

233
00:12:15.273 --> 00:12:18.025
Dither não elimina ou mascara o ruído de quantização,

234
00:12:18.025 --> 00:12:20.190
ele na realidade o substitui

235
00:12:20.190 --> 00:12:22.612
com características espectrais de nossa escolha

236
00:12:22.612 --> 00:12:24.794
que não são influenciadas pela entrada.

237
00:12:25.256 --> 00:12:27.081
Vamos _assistir_ ao que o dither faz.

238
00:12:27.081 --> 00:12:30.078
O gerador de sinais tem muito ruído para esse teste

239
00:12:30.431 --> 00:12:33.161
então nós produziremos uma onda senoidal

240
00:12:33.161 --> 00:12:34.782
matematicamente perfeita com o ThinkPad

241
00:12:34.782 --> 00:12:38.205
e a quantizaremos em oito bits com dither.

242
00:12:39.006 --> 00:12:41.342
Vemos uma bela onda senoidal na tela

243
00:12:41.342 --> 00:12:43.452
e no osciloscópio

244
00:12:44.222 --> 00:12:44.972
e...

245
00:12:46.588 --> 00:12:49.375
assim que o analisador de espectros analógico conseguir...

246
00:12:50.713 --> 00:12:53.588
um pico de frequência limpo com um patamar de ruído uniforme

247
00:12:56.864 --> 00:12:58.611
em ambas as telas de espectro

248
00:12:58.611 --> 00:12:59.646
exatamente como antes

249
00:12:59.646 --> 00:13:01.549
Repito, isso é com dither.

250
00:13:02.196 --> 00:13:04.225
Agora vou desligar o dither.

251
00:13:05.779 --> 00:13:07.913
O ruído de quantização, que o dither havia espalhado

252
00:13:07.913 --> 00:13:09.577
em um ruído de fundo plano e bonito,

253
00:13:09.577 --> 00:13:12.286
se amontoa em picos de distorção harmônica.

254
00:13:12.286 --> 00:13:16.030
O patamar de ruído é mais baixo, mas o nível de distorção é positivo,

255
00:13:16.030 --> 00:13:19.668
e os picos distorcidos estão mais altos do que o ruído de dithering.

256
00:13:19.668 --> 00:13:22.318
Com oito bits este efeito fica exagerado.

257
00:13:22.488 --> 00:13:24.200
Com dezesseis bits,

258
00:13:24.692 --> 00:13:25.929
mesmo sem dither,

259
00:13:25.929 --> 00:13:28.308
a distorção harmônica será tão baixa

260
00:13:28.308 --> 00:13:30.708
a ponto de ser completamente inaudível.

261
00:13:30.708 --> 00:13:34.581
Ainda assim, podemos usar dither para eliminá-la completamente

262
00:13:34.581 --> 00:13:36.489
se quisermos.

263
00:13:37.642 --> 00:13:39.273
Desligando o dither outra vez por um momento,

264
00:13:40.934 --> 00:13:43.444
você perceberá que o nível absoluto de distorção

265
00:13:43.444 --> 00:13:47.070
da quantização sem dither permanece aproximadamente constante

266
00:13:47.070 --> 00:13:49.033
independentemente da amplitude de entrada.

267
00:13:49.033 --> 00:13:51.998
Mas quando o nível do sinal cai abaixo de meio bit,

268
00:13:51.998 --> 00:13:54.036
tudo é quantizado para zero.

269
00:13:54.036 --> 00:13:54.910
Num certo sentido,

270
00:13:54.910 --> 00:13:58.557
se tudo é quantizado em zero, então temos uma distorção de 100%!

271
00:13:58.833 --> 00:14:01.588
O dither elimina essa distorção também.

272
00:14:01.588 --> 00:14:03.599
Nós reativamos o dither e...

273
00:14:03.599 --> 00:14:06.377
lá está nosso sinal de volta com 1/4 de bit,

274
00:14:06.377 --> 00:14:09.076
com nosso belo e plano patamar de ruído.

275
00:14:09.630 --> 00:14:11.220
O patamar de ruído não precisa ser plano.

276
00:14:11.220 --> 00:14:12.798
Dither é um ruído da nossa escolha,

277
00:14:12.798 --> 00:14:15.006
então vamos escolher um ruído o mais inofensível

278
00:14:15.006 --> 00:14:17.017
e difícil de perceber quanto possível.

279
00:14:18.142 --> 00:14:22.484
Nossa audição é mais sensível na faixa de frequências médias entre 2kHz e 4kHz,

280
00:14:22.484 --> 00:14:25.438
então é aí que o ruído de fundo será mais óbvio.

281
00:14:25.438 --> 00:14:29.406
Podemos moldar o ruído de dither de modo a afastá-lo de
frequências sensíveis

282
00:14:29.406 --> 00:14:31.241
para onde a audição é menos sensível,

283
00:14:31.241 --> 00:14:33.910
em geral as frequências mais altas.

284
00:14:34.249 --> 00:14:37.460
Ruído de dither de 16-bit é normalmente sutil demais para sequer ser escutado,

285
00:14:37.460 --> 00:14:39.668
mas vamos ouvir o nosso exemplo de moldagem de ruído,

286
00:14:39.668 --> 00:14:42.234
outra vez com o volume aumentado bastante...

287
00:14:56.020 --> 00:14:59.977
Finalmente, ruído de quantização com dither
_tem_ mais alta potência em todo o espectro

288
00:14:59.977 --> 00:15:04.276
em relação ao ruído de quantização sem dither,
mesmo quando ele soa mais baixo.

289
00:15:04.276 --> 00:15:07.902
Você pode ver isso em um indicador VU durante passagens de quase silêncio.

290
00:15:07.902 --> 00:15:10.537
Mas usar dither não é apenas uma escolha entre ligá-lo ou desligá-lo.

291
00:15:10.537 --> 00:15:14.712
Podemos reduzir a potência do dither para equilibrar menos ruído com

292
00:15:14.712 --> 00:15:18.313
um pouco de distorção a fim de minimizar o efeito global.

293
00:15:19.605 --> 00:15:22.790
Vamos também modular o sinal de entrada assim:

294
00:15:27.098 --> 00:15:30.206
...para mostrar como uma entrada variável afeta o ruído de quantização.

295
00:15:30.206 --> 00:15:33.289
Com dither em potência máxima, o ruído é uniforme, constante,

296
00:15:33.289 --> 00:15:35.643
e sem características discrepantes, exatamente como gostaríamos:

297
00:15:40.937 --> 00:15:42.772
À medida que reduzimos a potência do dither,

298
00:15:42.772 --> 00:15:46.356
a entrada progressivamente afeta a amplitude e o caráter

299
00:15:46.356 --> 00:15:47.977
do ruído de quantização:

300
00:16:09.883 --> 00:16:13.844
Dither com ruído moldado se comporta de forma similar,

301
00:16:13.844 --> 00:16:16.553
mas a moldagem do ruído traz mais uma vantagem legal.

302
00:16:16.553 --> 00:16:18.804
Pra encurtar a história, podemos usar

303
00:16:18.804 --> 00:16:20.937
uma potência de dither um pouco mais baixa antes que a entrada

304
00:16:20.937 --> 00:16:23.662
tenha o mesmo efeito sobre a saída.

305
00:16:49.172 --> 00:16:51.508
Apesar de todo o tempo que acabei de gastar falando de dither,

306
00:16:51.508 --> 00:16:53.012
estamos falando de diferenças

307
00:16:53.012 --> 00:16:56.372
que começam 100 decibéis abaixo do nível máximo representável.

308
00:16:56.372 --> 00:16:59.806
Talvez se o CD tivesse usado 14 bits como originalmente planejado,

309
00:16:59.806 --> 00:17:01.513
o dither _poderia_ ser mais importante.

310
00:17:01.989 --> 00:17:02.644
Talvez.

311
00:17:02.644 --> 00:17:05.438
Com 16 bits, na realidade, isso tudo é basicamente desnecessário.

312
00:17:05.438 --> 00:17:08.019
Você pode imaginar o dither como uma apólice de seguro

313
00:17:08.019 --> 00:17:11.443
que fornece vários decibéis a mais de faixa dinâmica

314
00:17:11.443 --> 00:17:12.804
só de precaução.

315
00:17:12.990 --> 00:17:14.196
Resumindo a história,

316
00:17:14.196 --> 00:17:16.361
ninguém jamais arruinou uma gravação excelente

317
00:17:16.361 --> 00:17:19.182
por não aplicar dither na masterização final.

318
00:17:24.414 --> 00:17:25.790
Estivemos usando ondas senoidais.

319
00:17:25.790 --> 00:17:28.254
Elas são a escolha mais óbvia quando queremos observar

320
00:17:28.254 --> 00:17:32.212
o comportamento de um sistema em uma dada frequência isolada.

321
00:17:32.212 --> 00:17:34.217
Agora vamos olhar pra algo um pouco mais complicado.

322
00:17:34.217 --> 00:17:35.923
O que deveríamos esperar que acontecesse

323
00:17:35.923 --> 00:17:39.671
se eu trocasse a entrada por uma onda quadrada...

324
00:17:42.718 --> 00:17:45.921
O osciloscópio da entrada confirma nossa onda quadrada de 1kHz.

325
00:17:45.921 --> 00:17:47.351
O osciloscópio da saída mostra...

326
00:17:48.614 --> 00:17:51.102
Exatamente o que ele deveria mostrar.

327
00:17:51.102 --> 00:17:53.900
O que é uma onda quadrada na realidade?

328
00:17:54.654 --> 00:17:57.982
Bem, podemos dizer que é uma forma de onda que tem um valor positivo

329
00:17:57.982 --> 00:18:00.788
durante meio ciclo e depois muda instantaneamente

330
00:18:00.788 --> 00:18:02.910
para um valor negativo durante a outra metade.

331
00:18:02.910 --> 00:18:05.076
Mas isso não nos diz nada de realmente útil

332
00:18:05.076 --> 00:18:07.241
sobre como essa entrada

333
00:18:07.241 --> 00:18:09.378
se torna essa saída.

334
00:18:10.132 --> 00:18:12.713
Então nós lembramos que toda forma de onda periódica

335
00:18:12.713 --> 00:18:15.508
é também a soma de frequências discretas,

336
00:18:15.508 --> 00:18:18.302
e uma onda quadrada é uma soma particularmente simples

337
00:18:18.302 --> 00:18:19.636
uma fundamental e

338
00:18:19.636 --> 00:18:22.228
uma série infinita de harmônicos ímpares.

339
00:18:22.228 --> 00:18:24.597
Some todos eles, e você obtém uma onda quadrada.

340
00:18:26.398 --> 00:18:27.433
À primeira vista,

341
00:18:27.433 --> 00:18:29.225
isso também não parece muito útil.

342
00:18:29.225 --> 00:18:31.561
Você tem que somar um número infinito de harmônicos

343
00:18:31.561 --> 00:18:33.108
para obter a resposta.

344
00:18:33.108 --> 00:18:35.977
Ah, mas nós não temos um número infinito de harmônicos.

345
00:18:36.960 --> 00:18:39.902
Estamos usando um filtro anti-aliasing bem abrupto

346
00:18:39.902 --> 00:18:42.206
que corta todas as frequências acima de 20kHz,

347
00:18:42.206 --> 00:18:44.158
e por isso nosso sinal tem banda limitada,

348
00:18:44.158 --> 00:18:46.421
o que significa que nós obtemos isso:

349
00:18:52.500 --> 00:18:56.468
... e isso é exatamente o que nós vemos no osciloscópio de saída.

350
00:18:56.468 --> 00:18:59.550
As ondulações que você vê ao redor das transições abruptas
em um sinal de banda limitada

351
00:18:59.550 --> 00:19:00.926
correspondem ao que chamamos de efeito de Gibbs.

352
00:19:00.926 --> 00:19:04.137
Isso acontece sempre que você corta fora parte do

353
00:19:04.137 --> 00:19:07.006
espectro de frequência onde a energia dele era não-nula.

354
00:19:07.006 --> 00:19:09.854
A regra geral que você vai escutar por aí é que
quanto mais abrupto o corte do filtro,

355
00:19:09.854 --> 00:19:11.188
mais fortes são as ondulações,

356
00:19:11.188 --> 00:19:12.777
o que é mais ou menos verdade,

357
00:19:12.777 --> 00:19:14.900
mas temos que ser cuidadosos ao pensarmos nisso.

358
00:19:14.900 --> 00:19:15.774
Por exemplo...

359
00:19:15.774 --> 00:19:19.529
o que você esperaria que nosso filtro anti-aliasing bastante abrupto

360
00:19:19.529 --> 00:19:23.181
faria com o sinal se aplicássemos o filtro uma segunda vez?

361
00:19:34.136 --> 00:19:37.588
Aparte o fato de adicionar algumas frações de ciclo como atraso,

362
00:19:37.588 --> 00:19:39.348
a resposta é...

363
00:19:39.348 --> 00:19:40.857
absolutamente nada.

364
00:19:41.257 --> 00:19:43.302
O sinal já possui banda limitada.

365
00:19:43.656 --> 00:19:46.590
Limitar a banda dele de novo não altera nada.

366
00:19:46.590 --> 00:19:50.686
Uma segunda filtragem não pode remover frequências
que já havíamos removido.

367
00:19:52.070 --> 00:19:53.737
E isso é importante.

368
00:19:53.737 --> 00:19:56.233
As pessoas tendem a pensar nas ondulações como uma espécie de artefato

369
00:19:56.233 --> 00:19:59.945
que é introduzido pelos filtros anti-aliasing e anti-imaging,

370
00:19:59.945 --> 00:20:01.737
o que daria a entender que as ondulações pioram

371
00:20:01.737 --> 00:20:03.913
a cada vez que o sinal passa por eles.

372
00:20:03.913 --> 00:20:05.950
Podemos ver que nesse caso não foi isso o que aconteceu.

373
00:20:05.950 --> 00:20:09.492
Então foi realmente o filtro que introduziu as ondulações da primeira vez?

374
00:20:09.492 --> 00:20:10.537
Não, na realidade não.

375
00:20:10.537 --> 00:20:12.126
Trata-se de uma distinção sutil,

376
00:20:12.126 --> 00:20:15.252
mas as ondulações do efeito de Gibbs não são introduzidas pelos filtros,

377
00:20:15.252 --> 00:20:18.836
elas simplesmente são parte do que um sinal
de banda limitada _é_ essencialmente.

378
00:20:18.836 --> 00:20:20.798
Mesmo se construirmos sinteticamente

379
00:20:20.798 --> 00:20:23.508
o que parece ser uma onda quadrada digital perfeita,

380
00:20:23.508 --> 00:20:26.206
ela ainda é limitada pela largura de banda do canal de representação.

381
00:20:26.206 --> 00:20:29.140
Lembre-se que a representação escalonada é enganosa.

382
00:20:29.140 --> 00:20:32.222
O que nós temos realmente são amostras instantâneas,

383
00:20:32.222 --> 00:20:36.148
e apenas um sinal de banda limitada corresponde a esses pontos.

384
00:20:36.148 --> 00:20:39.614
Tudo o que fizemos ao desenhar nossa onda quadrada aparentemente perfeita

385
00:20:39.614 --> 00:20:43.198
foi alinhar as amostras de tal forma que parecesse

386
00:20:43.198 --> 00:20:47.785
que não haviam ondulações se nós brincássemos de conectar-os-pontos.

387
00:20:47.785 --> 00:20:49.449
Mas o sinal de banda limitada original,

388
00:20:49.449 --> 00:20:52.742
completo com ondulações, ainda estava lá.

389
00:20:54.004 --> 00:20:56.542
E isso nos leva a mais um ponto importante.

390
00:20:56.542 --> 00:20:59.550
Você provavelmente já ouviu falar que a precisão temporal
de um sinal digital

391
00:20:59.550 --> 00:21:02.409
é limitada por sua taxa de amostragem; dizendo de outra forma,

392
00:21:02.409 --> 00:21:05.140
que sinais digitais não podem representar nada

393
00:21:05.140 --> 00:21:08.041
do que acontece entre as amostras...

394
00:21:08.041 --> 00:21:11.422
dando a entender que impulsos ou ataques rápidos teriam
que estar alinhados

395
00:21:11.422 --> 00:21:14.473
exatamente com uma amostra, do contrário eles seriam estraçalhados...

396
00:21:14.473 --> 00:21:16.219
ou simplesmente desapareceriam.

397
00:21:16.711 --> 00:21:20.820
Nessa altura podemos ver facilmente porque isso está errado.

398
00:21:20.820 --> 00:21:23.742
Mais uma vez, nossos sinais de entrada têm banda limitada.

399
00:21:23.742 --> 00:21:26.036
E sinais digitais são coleções de amostras,

400
00:21:26.036 --> 00:21:29.340
não são escadas, não são 'conecte-os-pontos'.

401
00:21:31.572 --> 00:21:34.592
Nos certamente podemos, por exemplo,

402
00:21:36.777 --> 00:21:39.337
colocar a borda de subida da nossa onda quadrada com banda limitada

403
00:21:39.337 --> 00:21:42.004
onde quisermos entre as amostras.

404
00:21:42.004 --> 00:21:44.354
Ela é representada perfeitamente

405
00:21:47.508 --> 00:21:50.218
e é reconstruída perfeitamente.

406
00:22:04.620 --> 00:22:06.526
Assim como no episódio anterior,

407
00:22:06.526 --> 00:22:08.393
nós cobrimos uma grande quantidade de tópicos,

408
00:22:08.393 --> 00:22:10.868
e no entanto mal arranhamos a superfície de cada um deles.

409
00:22:10.868 --> 00:22:13.620
Num certo sentido, meus pecados por omissão são maiores desta vez...

410
00:22:13.620 --> 00:22:16.286
mas este é um bom ponto para parar.

411
00:22:16.286 --> 00:22:17.833
Ou talvez, um bom ponto para começar.

412
00:22:17.833 --> 00:22:18.708
Cave mais fundo.

413
00:22:18.708 --> 00:22:19.710
Experimente.

414
00:22:19.710 --> 00:22:21.374
Eu escolho minhas demonstrações com muito cuidado

415
00:22:21.374 --> 00:22:23.668
para que sejam simples e deem resultados claros.

416
00:22:23.668 --> 00:22:26.217
Você pode reproduzir cada uma delas por conta própria se desejar.

417
00:22:26.217 --> 00:22:28.766
Mas falando sério, às vezes nós aprendemos mais

418
00:22:28.766 --> 00:22:30.516
sobre um brinquedo bacana ao quebrá-lo

419
00:22:30.516 --> 00:22:32.553
e estudarmos todas as peças que caíram dele.

420
00:22:32.553 --> 00:22:35.230
Tudo bem, nós somos engenheiros.

421
00:22:35.230 --> 00:22:36.350
Brinque com os parâmetros das demonstrações,

422
00:22:36.350 --> 00:22:37.972
hack-eie o código,

423
00:22:37.972 --> 00:22:39.774
monte experimentos alternativos.

424
00:22:39.774 --> 00:22:40.692
O código fonte para tudo,

425
00:22:40.692 --> 00:22:42.398
incluindo a demonstração com o botãozinho,

426
00:22:42.398 --> 00:22:44.361
está no site Xiph.Org.

427
00:22:44.361 --> 00:22:45.940
Durante sua experimentação,

428
00:22:45.940 --> 00:22:47.401
é provável que você esbarre em algo

429
00:22:47.401 --> 00:22:49.950
que você não esperava e não sabe explicar.

430
00:22:49.950 --> 00:22:51.198
Não se preocupe!

431
00:22:51.198 --> 00:22:54.537
Colocando de lado minhas brincadeiras anteriores,
a Wikipedia é fantástica

432
00:22:54.537 --> 00:22:56.788
exatamente para este tipo de pesquisa informal.

433
00:22:56.788 --> 00:22:59.956
Se você quiser seriamente entender sinais,

434
00:22:59.956 --> 00:23:03.337
várias universidades têm material avançado online,

435
00:23:03.337 --> 00:23:07.380
como os módulos 6.003 e 6.007 de Sinais e Sistemas

436
00:23:07.380 --> 00:23:08.798
no MIT OpenCourseWare.

437
00:23:08.798 --> 00:23:11.593
E é claro, há sempre a comunidade aqui do Xiph.Org.

438
00:23:12.792 --> 00:23:13.929
Cavando mais fundo ou não,

439
00:23:13.929 --> 00:23:14.974
meu café acabou,

440
00:23:14.974 --> 00:23:16.436
então, até a próxima vez,

441
00:23:16.436 --> 00:23:19.316
boa hack-eação!