7aitsev · April 3, 2019 18:14
diff --git a/02-Digital_Show_and_Tell.ru.en.vtt b/02-Digital_Show_and_Tell.ru.en.vtt
 WEBVTT

 1
 00:00:08.252 --> 00:00:11.550
 Привет! Я Монти Монтгомери из Red Hat и Xiph.Org.
 Hi, I'm Monty Montgomery from Red Hat and Xiph.Org.

 2
 00:00:11.550 --> 00:00:18.430
 Несколько месяцев назад я написал статью о цифровом аудио и почему нет смысла в загрузке музыки 24 бит / 192 кГц.
 A few months ago, I wrote an article on digital audio and why 24bit/192kHz music downloads don't make sense.

 3
 00:00:18.430 --> 00:00:23.433
 В той статье я почти вскользь отметил, что форма цифровой волны не ступенчатая,
 In the article, I mentioned--almost in passing--that a digital waveform is not a stairstep,

 4
 00:00:23.433 --> 00:00:28.680
 и что вы точно не получите ровные ступеньки, когда преобразуете из цифры обратно в аналог.
 and you certainly don't get a stairstep when you convert from digital back to analog.

 5
 00:00:29.865 --> 00:00:33.865
 Из всего, что было в статье, <b>это</b> было темой номер один, о чем люди писали.
 Of everything in the entire article, <b>that</b> was the number one thing people wrote about.

 6
 00:00:33.865 --> 00:00:37.221
 На самом деле, более половины всех полученных писем составили вопросы и комментарии
 In fact, more than half the mail I got was questions and comments

 7
 00:00:37.221 --> 00:00:39.663
 об основах поведения цифрового сигнала.
 about basic digital signal behavior.

 8
 00:00:39.894 --> 00:00:45.285
 Поскольку многим интересно, давайте уделим некоторое время, чтобы поиграться с <u>простым</u> цифровым сигналом.
 Since there's interest, let's take a little time to play with some <u>simple</u> digital signals.

 9
 00:00:49.747 --> 00:00:51.006
 Вспомним на секунду,
 Pretend for a moment

 10
 00:00:51.006 --> 00:00:54.089
 что мы без понятия, как на самом деле цифровой сигнал ведет себя.
 that we have no idea how digital signals really behave.

 11
 00:00:54.734 --> 00:00:56.841
 В этом случае нам также нет никакого смысла
 In that case it doesn't make sense for us

 12
 00:00:56.841 --> 00:00:59.049
 использовать цифровое испытательное оборудование.
 to use digital test equipment either.

 13
 00:00:59.049 --> 00:01:00.937
 К счастью, для данной работы где-то здесь
 Fortunately for this exercise, there's still

 14
 00:01:00.937 --> 00:01:04.020
 все еще имеется куча аналогового лабораторного оборудования.
 plenty of working analog lab equipment out there.

 15
 00:01:04.020 --> 00:01:05.972
 Во-первых, нам нужен генератор сигналов,
 First up, we need a signal generator

 16
 00:01:05.972 --> 00:01:08.190
 чтобы обеспечить нас аналоговыми входными сигналами.
 to provide us with analog input signals--

 17
 00:01:08.190 --> 00:01:12.692
 В данном случае это HP3325 1978 года.
 in this case, an HP3325 from 1978.

 18
 00:01:12.692 --> 00:01:14.153
 Это по-прежнему довольно хороший генератор,
 It's still a pretty good generator,

 19
 00:01:14.153 --> 00:01:15.614
 так что если вас не заботят габариты,
 so if you don't mind the size,

 20
 00:01:15.614 --> 00:01:16.532
 вес,
 the weight,

 21
 00:01:16.532 --> 00:01:17.577
 потребление электроэнергии
 the power consumption,

 22
 00:01:17.577 --> 00:01:18.910
 и шумный вентилятор,
 and the noisy fan,

 23
 00:01:18.910 --> 00:01:20.329
 то можете найти их на eBay.
 you can find them on eBay.

 24
 00:01:20.329 --> 00:01:23.863
 Иногда они чуть дороже, чем вы заплатите за доставку.
 Occasionally for only slightly more than you'll pay for shipping.

 25
 00:01:24.617 --> 00:01:28.500
 Затем, мы будем наблюдать за диаграммами аналоговых сигналов на аналоговых осциллографах,
 Next, we'll observe our analog waveforms on analog oscilloscopes,

 26
 00:01:28.500 --> 00:01:31.550
 таких как этот Tektronix 2246 из середины 90х –
 like this Tektronix 2246 from the mid-90s,

 27
 00:01:31.550 --> 00:01:34.761
 один из последних и самых лучших аналоговых осциллографов.
 one of the last and very best analog scopes ever made.

 28
 00:01:34.761 --> 00:01:36.807
 В каждой домашней лаборатории по-хорошему должен быть такой.
 Every home lab should have one.

 29
 00:01:37.716 --> 00:01:40.852
 Наконец, изучим спектр частот наших сигналов,
 And finally inspect the frequency spectrum of our signals

 30
 00:01:40.852 --> 00:01:43.177
 используя аналоговый анализатор спектра.
 using an analog spectrum analyzer.

 31
 00:01:43.177 --> 00:01:47.732
 Это HP3585 из той же линейки, что и генератор сигналов.
 This HP3585 from the same product line as the signal generator.

 32
 00:01:47.732 --> 00:01:50.615
 Как и другое имеющееся оборудование, он оснащен
 Like the other equipment here it has a rudimentary

 33
 00:01:50.615 --> 00:01:52.905
 элементарным и нереально большим микроконтроллером,
 and hilariously large microcontroller,

 34
 00:01:52.905 --> 00:01:56.276
 но сигнал на всем пути от входа до того, что вы видите на экране,
 but the signal path from input to what you see on the scree

 35
 00:01:56.276 --> 00:01:58.537
 полностью аналоговый.
 is completely analog.

 36
 00:01:58.537 --> 00:02:00.329
 Все это оборудование старинное,
 All of this equipment is vintage,

 37
 00:02:00.329 --> 00:02:01.993
 но, кроме внушительного веса,
 but aside from its raw tonnage,

 38
 00:02:01.993 --> 00:02:03.844
 характеристики все еще достаточно хорошие.
 the specs are still quite good.

 39
 00:02:04.536 --> 00:02:06.868
 В данный момент наш генератор сигналов вырабатывает
 At the moment, we have our signal generator

 40
 00:02:06.868 --> 00:02:12.829
 хорошую 1 кГц синусоиду со среднеквадратичным значением (СКЗ) напряжения 1 В.
 set to output a nice 1kHz sine wave at one volt RMS,

 41
 00:02:13.414 --> 00:02:15.220
 Мы видим синусоидальную волну на осциллографе,
 we see the sine wave on the oscilloscope,

 42
 00:02:15.220 --> 00:02:21.428
 можем убедиться, что действительно 1 кГц и имеет СКЗ напряжения 1 В,
 can verify that it is indeed 1kHz at one volt RMS,

 43
 00:02:21.428 --> 00:02:24.108
 то есть волна с размахом 2,8 В,
 which is 2.8V peak-to-peak,

 44
 00:02:24.308 --> 00:02:27.561
 и что она также соответствует измерениям спектрального анализатора.
 and that matches the measurement on the spectrum analyzer as well.

 45
 00:02:27.561 --> 00:02:30.644
 Анализатор еще показывает белый шум низкой амплитуды
 The analyzer also shows some low-level white noise

 46
 00:02:30.644 --> 00:02:32.190
 и небольшое гармоническое искажение
 and just a bit of harmonic distortion

 47
 00:02:32.190 --> 00:02:36.649
 с наибольшим пиком около 70 дБ ниже несущей частоты.
 with the highest peak about 70dB or so below the fundamental.

 48
 00:02:36.649 --> 00:02:38.612
 Хоть это и совсем не важно в наших опытах,
 Now, this doesn't matter at all in our demos,

 49
 00:02:38.612 --> 00:02:40.574
 но я хотел отметить это сейчас
 but I wanted to point it out now

 50
 00:02:40.574 --> 00:02:42.452
 на случай, если вы не замечали это ранее.
 just in case you didn't notice it until later.

 51
 00:02:44.036 --> 00:02:47.142
 Сейчас мы понизим частоту дискретизации до средних значений.
 Now, we drop digital sampling in the middle.

 52
 00:02:48.557 --> 00:02:51.024
 Для преобразования мы будем использовать непримечательное
 For the conversion, we'll use a boring,

 53
 00:02:51.024 --> 00:02:53.374
 потребительское аудиоустройство eMagic USB1.
 consumer-grade, eMagic USB1 audio device.

 54
 00:02:53.374 --> 00:02:55.337
 Оно уже тоже старше десяти лет
 It's also more than ten years old at this point,

 55
 00:02:55.337 --> 00:02:57.257
 и продолжает устаревать.
 and it's getting obsolete.

 56
 00:02:57.964 --> 00:03:02.676
 Современный конвертер без труда может иметь характеристики на порядок выше.
 A recent converter can easily have an order of magnitude better specs.

 57
 00:03:03.076 --> 00:03:07.924
 Неравномерность АЧХ, нелинейность, джиттер, шумовые характеристики и прочее…
 Flatness, linearity, jitter, noise behavior, everything...

 58
 00:03:07.924 --> 00:03:09.353
 что вы могли и не заметить.
 you may not have noticed.

 59
 00:03:09.353 --> 00:03:11.604
 То, что мы можем измерить улучшение,
 Just because we can measure an improvement

 60
 00:03:11.604 --> 00:03:13.609
 не значит, что мы можем это услышать,
 doesn't mean we can hear it,

 61
 00:03:13.609 --> 00:03:16.404
 и даже эти старые коробочки потребительского уровня
 and even these old consumer boxes were already

 62
 00:03:16.404 --> 00:03:18.643
 уже тогда были на грани прозрачности [Transparency (data compression)]
 at the edge of ideal transparency.

 63
 00:03:20.244 --> 00:03:22.825
 eMagic подключен к моему ThinkPad,
 The eMagic connects to my ThinkPad,

 64
 00:03:22.825 --> 00:03:26.121
 который отображает диаграмму цифрового сигнала и спектр для сравнения, 
 which displays a digital waveform and spectrum for comparison,

 65
 00:03:26.121 --> 00:03:28.788
 затем ThinkPad отправляет цифровой сигнал обратно в
 then the ThinkPad sends the digital signal right back out

 66
 00:03:28.788 --> 00:03:30.921
 eMagic для преобразования обратно в аналоговый сигнал
 to the eMagic for re-conversion to analog

 67
 00:03:30.921 --> 00:03:33.332
 и наблюдения на экране осциллографа.
 and observation on the output scopes.

 68
 00:03:33.332 --> 00:03:35.582
 Со входа на выход. Слева направо.
 Input to output, left to right.

 69
 00:03:40.211 --> 00:03:41.214
 Все, пора начинать.
 OK, it's go time.

 70
 00:03:41.214 --> 00:03:43.924
 Начнем с преобразования аналогового сигнала в цифровой,
 We begin by converting an analog signal to digital

 71
 00:03:43.924 --> 00:03:47.347
 a потом – снова обратно в аналоговый, и больше ничего.
 and then right back to analog again with no other steps.

 72
 00:03:47.347 --> 00:03:49.268
 Генератор сигналов настроен на создание
 The signal generator is set to produce

 73
 00:03:49.268 --> 00:03:52.649
 синусоиды с частотой 1 кГц, как и прежде.
 a 1kHz sine wave just like before.

 74
 00:03:52.649 --> 00:03:57.428
 Со входа мы можем видеть нашу аналоговую синусоиду на осциллографе.
 We can see our analog sine wave on our input-side oscilloscope.

 75
 00:03:57.428 --> 00:04:01.694
 Мы оцифровываем сигнал с помощью ИКМ (16 бит, 44,1 кГц) –
 We digitize our signal to 16 bit PCM at 44.1kHz,

 76
 00:04:01.694 --> 00:04:03.828
 так же, как звук на CD.
 same as on a CD.

 77
 00:04:03.828 --> 00:04:07.156
 Спектр оцифрованного сигнала соответствует тому, что мы видели ранее. И-и…
 The spectrum of the digitized signal matches what we saw earlier. And...

 78
 00:04:07.156 --> 00:04:10.836
 вот что мы видим на аналоговом анализаторе спектра,
 what we see now on the analog spectrum analyzer,

 79
 00:04:10.836 --> 00:04:15.154
 не считая чуть прибавившихся шумов из-за входа с высоким сопротивлением.
 aside from its high-impedance input being just a smidge noisier.

 80
 00:04:15.154 --> 00:04:15.956
 В то же время
 For now

 81
 00:04:18.248 --> 00:04:20.798
 окно вывода диаграмм показывает нашу оцифрованную синусоиду
 the waveform display shows our digitized sine wave

 82
 00:04:20.798 --> 00:04:23.966
 в ступенчатом виде – по ступеньке на отсчет.
 as a stairstep pattern, one step for each sample.

 83
 00:04:23.966 --> 00:04:26.388
 И, когда мы смотрим на выходной сигнал,
 And when we look at the output signal

 84
 00:04:26.388 --> 00:04:29.054
 т.е. сконвертированный в аналоговый из цифрового, мы видим…
 that's been converted from digital back to analog, we see...

 85
 00:04:29.054 --> 00:04:32.052
 Он в точности такой же, как первоначальная синусоида.
 It's exactly like the original sine wave.

 86
 00:04:32.052 --> 00:04:33.483
 Никаких ступенек.
 No stairsteps.

 87
 00:04:33.914 --> 00:04:37.193
 Ладно, все же 1 кГц и правда низкая частота.
 OK, 1kHz is still a fairly low frequency,

 88
 00:04:37.193 --> 00:04:40.633
 Может ступеньки просто сложно разглядеть или они были сглажены?
 maybe the stairsteps are just hard to see or they're being smoothed away.

 89
 00:04:40.739 --> 00:04:49.492
 Логично. Давайте поднимем частоту примерно до частоты Найквиста. Скажем, до 15 кГц.
 Fair enough. Let's choose a higher frequency, something close to Nyquist, say 15kHz.

 90
 00:04:49.492 --> 00:04:53.545
 Теперь синусоида описывается менее чем тремя отсчетами за период, и…
 Now the sine wave is represented by less than three samples per cycle, and...

 91
 00:04:53.545 --> 00:04:55.838
 цифровая диаграмма выглядит довольно ужасно.
 the digital waveform looks pretty awful.

 92
 00:04:55.838 --> 00:04:59.798
 Что ж, внешность обманчива. Аналоговый выход…
 Well, looks can be deceiving. The analog output...

 93
 00:05:01.876 --> 00:05:06.033
 по-прежнему идеальная синусоида, точь-в-точь как исходная.
 is still a perfect sine wave, exactly like the original.

 94
 00:05:06.633 --> 00:05:09.228
 Продолжим поднимать частоту.
 Let's keep going up.

 95
 00:05:17.353 --> 00:05:20.151
 16 кГц
 16kHz....

 96
 00:05:23.198 --> 00:05:25.616
 17 кГц
 17kHz...

 97
 00:05:28.201 --> 00:05:29.945
 18 кГц
 18kHz...

 98
 00:05:33.822 --> 00:05:35.548
 19 кГц
 19kHz...

 99
 00:05:40.457 --> 00:05:42.465
 20 кГц
 20kHz.

 100
 00:05:49.097 --> 00:05:52.350
 Добро пожаловать в верхние пределы слышимости человеком.
 Welcome to the upper limits of human hearing.

 101
 00:05:52.350 --> 00:05:54.377
 Выходная диаграмма сигнала по-прежнему отличная.
 The output waveform is still perfect.

 102
 00:05:54.377 --> 00:05:58.025
 Ни рванных краев, ни завалов, ни ступенек.
 No jagged edges, no dropoff, no stairsteps.

 103
 00:05:58.025 --> 00:06:01.342
 Так куда пропали ступеньки?
 So where'd the stairsteps go?

 104
 00:06:01.342 --> 00:06:03.198
 Не отвечайте, это каверзный вопрос.
 Don't answer, it's a trick question.

 105
 00:06:03.198 --> 00:06:04.318
 Ступенек там никогда не было.
 They were never there.

 106
 00:06:04.318 --> 00:06:06.652
 Изображение цифровой диаграммы сигнала ступеньками
 Drawing a digital waveform as a stairstep

 107
 00:06:08.712 --> 00:06:10.772
 было изначально неправильным.
 was wrong to begin with.

 108
 00:06:10.942 --> 00:06:11.998
 Почему?
 Why?

 109
 00:06:11.998 --> 00:06:14.366
 Ступенчатая кривая – это график непрерывной функции.
 A stairstep is a continuous-time function.

 110
 00:06:14.366 --> 00:06:16.201
 Она угловатая и кусочно-постоянная,
 It's jagged, and it's piecewise,

 111
 00:06:16.201 --> 00:06:19.700
 но имеет определенное значение в каждый момент времени. 
 but it has a defined value at every point in time.

 112
 00:06:19.700 --> 00:06:22.004
 Дискретизированный сигнал совершенно другой.
 A sampled signal is entirely different.

 113
 00:06:22.004 --> 00:06:23.337
 Он дискретен по времени
 It's discrete-time;

 114
 00:06:23.337 --> 00:06:27.337
 и определен только в каждой точке отсчета,
 it's only got a value right at each instantaneous sample point

 115
 00:06:27.337 --> 00:06:32.596
 и не определен, т.е. вообще нет значений, всюду между отсчетами.
 and it's undefined, there is no value at all, everywhere between.

 116
 00:06:32.596 --> 00:06:36.666
 Дискретный сигнал следует изображать как "чупа-чупсовый" график [lollipop graph].
 A discrete-time signal is properly drawn as a lollipop graph.

 117
 00:06:40.020 --> 00:06:42.974
 Непрерывный аналоговый коллега цифрового сигнала
 The continuous, analog counterpart of a digital signal

 118
 00:06:42.974 --> 00:06:45.364
 плавно проходит каждую точку отсчета,
 passes smoothly through each sample point,

 119
 00:06:45.364 --> 00:06:50.153
 и это также справедливо как для высоких частот, так и для низких.
 and that's just as true for high frequencies as it is for low.

 120
 00:06:50.153 --> 00:06:53.033
 Далее, интересная и совсем не очевидная часть:
 Now, the interesting and not at all obvious bit is:

 121
 00:06:53.033 --> 00:06:55.454
 существует только один сигнал с ограниченной полосой частот, проходящий
 there's only one bandlimited signal that passes

 122
 00:06:55.454 --> 00:06:57.417
 строго через каждую точку отсчета.
 exactly through each sample point.

 123
 00:06:57.417 --> 00:06:58.708
 Это единственное решение.
 It's a unique solution.

 124
 00:06:58.708 --> 00:07:01.246
 Так что если вы дискретизируете сигнал с ограниченной полосой частот
 So if you sample a bandlimited signal

 125
 00:07:01.246 --> 00:07:02.612
 и потом конвертируете обратно,
 and then convert it back,

 126
 00:07:02.612 --> 00:07:06.462
 то исходный входной сигнал – единственный возможный сигнал на выходе.
 the original input is also the only possible output.

 127
 00:07:06.462 --> 00:07:07.838
 И прежде, чем вы скажете:
 And before you say,

 128
 00:07:07.838 --> 00:07:11.721
 "Ну, я могу нарисовать другой сигнал, проходящий через эти точки".
 "Oh, I can draw a different signal that passes through those points."

 129
 00:07:11.721 --> 00:07:14.283
 Хорошо, да, вы можете, но…
 Well, yes you can, but...

 130
 00:07:17.268 --> 00:07:20.521
 Даже если сигнал отличается едва заметно от исходного,
 if it differs even minutely from the original,

 131
 00:07:20.521 --> 00:07:24.905
 то он содержит частотную составляющую на частоте Найквиста или за ее пределом,
 it contains frequency content at or beyond Nyquist,

 132
 00:07:24.905 --> 00:07:26.185
 нарушая требование ограниченности полосы частот,
 breaks the bandlimiting requirement

 133
 00:07:26.185 --> 00:07:28.358
 что делает такой сигнал неподходящим решением. 
 and isn't a valid solution.

 134
 00:07:28.574 --> 00:07:30.036
 Как же так все сбились с толку
 So how did everyone get confused

 135
 00:07:30.036 --> 00:07:32.702
 и начали думать о цифровом сигнале как о ступенчатой кривой?
 and start thinking of digital signals as stairsteps?

 136
 00:07:32.702 --> 00:07:34.900
 Я могу придумать две хорошие причины.
 I can think of two good reasons.

 137
 00:07:34.900 --> 00:07:37.956
 Первая – довольно просто представить дискретизированный сигнал
 First: It's easy enough to convert a sampled signal

 138
 00:07:37.972 --> 00:07:39.294
 в виде ступенчатой кривой.
 to a true stairstep.

 139
 00:07:39.294 --> 00:07:42.409
 Просто расширьте значение каждой точки отсчета вперед до следующего отсчета.
 Just extend each sample value forward until the next sample period.

 140
 00:07:42.409 --> 00:07:44.414
 Это называется экстраполяцией нулевого порядка
 This is called a zero-order hold,

 141
 00:07:44.414 --> 00:07:47.913
 и является важной частью в работе некоторых цифро-аналоговых преобразователей,
 and it's an important part of how some digital-to-analog converters work,

 142
 00:07:47.913 --> 00:07:50.089
 особенно самых простых из них.
 especially the simplest ones.

 143
 00:07:50.089 --> 00:07:55.591
 Так что любой кто ищет о цифро-аналоговом преобразовании,
 So, anyone who looks up digital-to-analog conversion

 144
 00:07:55.592 --> 00:07:59.550
 вероятно, увидит где-нибудь диаграмму со ступенчатой кривой,
 is probably going to see a diagram of a stairstep waveform somewhere,

 145
 00:07:59.550 --> 00:08:01.982
 но это не законченное преобразование,
 but that's not a finished conversion,

 146
 00:08:01.982 --> 00:08:04.250
 и это не сигнал, получаемый на выходе.
 and it's not the signal that comes out.

 147
 00:08:04.944 --> 00:08:05.684
 Вторая причина –
 Second,

 148
 00:08:05.684 --> 00:08:07.529
 и это, видимо, более вероятная причина –
 and this is probably the more likely reason,

 149
 00:08:07.529 --> 00:08:09.449
 инженеры, которые вроде как знают лучше,
 engineers who supposedly know better,

 150
 00:08:09.449 --> 00:08:10.441
 прям как я,
 like me,

 151
 00:08:10.441 --> 00:08:13.193
 рисуют ступенчатые кривые, пусть даже эти графики технически неправильны.
 draw stairsteps even though they're technically wrong.

 152
 00:08:13.193 --> 00:08:15.571
 Это что-то типа одномерной версии 
 It's a sort of like a one-dimensional version of

 153
 00:08:15.571 --> 00:08:17.395
 растолстевших бит в цифровых редакторах.
 fat bits in an image editor.

 154
 00:08:17.395 --> 00:08:19.241
 Пиксели тоже не квадратные, они –
 Pixels aren't squares either,

 155
 00:08:19.241 --> 00:08:23.081
 отсчеты функции, заданной на двумерном пространстве, так что они тоже,
 they're samples of a 2-dimensional function space and so they're also,

 156
 00:08:23.081 --> 00:08:26.366
 концептуально, – бесконечно маленькие точки.
 conceptually, infinitely small points.

 157
 00:08:26.366 --> 00:08:28.500
 На практике, это тот еще геморрой – смотреть
 Practically, it's a real pain in the ass to see

 158
 00:08:28.500 --> 00:08:30.804
 или обрабатывать что-либо бесконечно маленькое.
 or manipulate infinitely small anything.

 159
 00:08:30.804 --> 00:08:32.212
 Поэтому и большие квадраты.
 So big squares it is.

 160
 00:08:32.212 --> 00:08:35.966
 Тоже самое и с изображением цифровых сигналов ступеньками.
 Digital stairstep drawings are exactly the same thing.

 161
 00:08:35.966 --> 00:08:37.684
 Так просто удобнее рисовать.
 It's just a convenient drawing.

 162
 00:08:37.684 --> 00:08:40.404
 Никаких ступенек на самом деле нет.
 The stairsteps aren't really there.

 163
 00:08:45.652 --> 00:08:48.233
 Когда мы преобразовываем цифру обратно в аналог,
 When we convert a digital signal back to analog,

 164
 00:08:48.233 --> 00:08:50.900
 результат <u>такой же</u> плавный независимо от глубины дискретизации:
 the result is <u>also</u> smooth regardless of the bit depth.

 165
 00:08:50.900 --> 00:08:53.193
 24 бит или 16 бит…
 24 bits or 16 bits...

 166
 00:08:53.193 --> 00:08:54.196
 или 8 бит…
 or 8 bits...

 167
 00:08:54.196 --> 00:08:55.486
 – без разницы.
 it doesn't matter.

 168
 00:08:55.486 --> 00:08:57.534
 Значит ли это, что глубина дискретизации
 So does that mean that the digital bit depth

 169
 00:08:57.534 --> 00:08:58.953
 совсем ни на что не влияет?
 makes no difference at all?

 170
 00:08:59.245 --> 00:09:00.521
 Конечно нет.
 Of course not.

 171
 00:09:02.121 --> 00:09:06.046
 Второй канал здесь – это та же входная синусоида,
 Channel 2 here is the same sine wave input,

 172
 00:09:06.046 --> 00:09:09.086
 но мы квантуем с дизерингом, используя глубину 8 бит.
 but we quantize with dither down to eight bits.

 173
 00:09:09.086 --> 00:09:14.174
 На осциллографе мы все еще видим плавную синусоиду на 2-м канале.
 On the scope, we still see a nice smooth sine wave on channel 2.

 174
 00:09:14.174 --> 00:09:18.014
 Присмотритесь внимательнее, и вы также увидите немного больше шума.
 Look very close, and you'll also see a bit more noise.

 175
 00:09:18.014 --> 00:09:19.305
 Вот, в чем загвоздка.
 That's a clue.

 176
 00:09:19.305 --> 00:09:21.273
 Если мы посмотрим на спектр сигнала…
 If we look at the spectrum of the signal...

 177
 00:09:22.889 --> 00:09:23.732
 Ага!
 aha!

 178
 00:09:23.732 --> 00:09:26.398
 Наша синусоида все еще там нетронутая,
 Our sine wave is still there unaffected,

 179
 00:09:26.398 --> 00:09:28.490
 но уровень шума восьмибитного сигнала
 but the noise level of the eight-bit signal

 180
 00:09:28.490 --> 00:09:32.470
 на 2-м канале намного выше!
 on the second channel is much higher!

 181
 00:09:32.948 --> 00:09:36.148
 В этом и заключается отличие между разным числом бит.
 And that's the difference the number of bits makes.

 182
 00:09:36.148 --> 00:09:37.434
 Вот и все!
 That's it!

 183
 00:09:37.822 --> 00:09:39.956
 Когда мы оцифровываем сигнал, сперва мы дискретизируем его.
 When we digitize a signal, first we sample it.

 184
 00:09:39.956 --> 00:09:42.366
 Этап дискретизирования идеален: потерь не происходит.
 The sampling step is perfect; it loses nothing.

 185
 00:09:42.366 --> 00:09:45.626
 Но потом мы квантуем его, и квантование добавляет шум.
 But then we quantize it, and quantization adds noise.

 186
 00:09:47.827 --> 00:09:50.793
 Число бит определяет то, как много шума добавится,
 The number of bits determines how much noise

 187
 00:09:50.793 --> 00:09:52.569
 и потому – степень уровня шума.
 and so the level of the noise floor.

 188
 00:10:00.170 --> 00:10:03.646
 Как звучит этот шум квантования после дизеринга?
 What does this dithered quantization noise sound like?

 189
 00:10:03.646 --> 00:10:06.012
 Давайте послушаем нашу восьмибитную синусоиду.
 Let's listen to our eight-bit sine wave.

 190
 00:10:12.521 --> 00:10:15.273
 Наверно, было сложно что-либо услышать, кроме тона.
 That may have been hard to hear anything but the tone.

 191
 00:10:15.273 --> 00:10:18.740
 Давайте послушаем только шум, подавив сперва синусоиду,
 Let's listen to just the noise after we notch out the sine wave

 192
 00:10:18.740 --> 00:10:21.683
 а потом сделав все чуть громче, потому что шум тихий.
 and then bring the gain up a bit because the noise is quiet.

 193
 00:10:32.009 --> 00:10:35.049
 Те из вас, кто пользовался аналоговыми записывающими устройствами,
 Those of you who have used analog recording equipment

 194
 00:10:35.049 --> 00:10:36.670
 могли подумать про себя:
 may have just thought to yourselves,

 195
 00:10:36.670 --> 00:10:40.382
 "Боже мой! Это звучит как шипение ленты!"
 "My goodness! That sounds like tape hiss!"

 196
 00:10:40.382 --> 00:10:41.929
 Что ж, это не просто звучит как шипение магнитной ленты –
 Well, it doesn't just sound like tape hiss,

 197
 00:10:41.929 --> 00:10:43.433
 оно ведет себя также,
 it acts like it too,

 198
 00:10:43.433 --> 00:10:45.225
 и если мы применим дизеринг с гауссовой функцией плотности распределения вероятности,
 and if we use a gaussian dither

 199
 00:10:45.225 --> 00:10:47.646
 то этот шум будет математически эквивалентным во всех отношениях.
 then it's mathematically equivalent in every way.

 200
 00:10:47.646 --> 00:10:49.225
 Это и <u>есть</u> шипение ленты.
 It <u>is</u> tape hiss.

 201
 00:10:49.225 --> 00:10:51.774
 Легко догадаться, что мы можем измерить шипение ленты
 Intuitively, that means that we can measure tape hiss

 202
 00:10:51.774 --> 00:10:54.196
 и, следовательно, уровень шума магнитной аудиокассеты
 and thus the noise floor of magnetic audio tape

 203
 00:10:54.196 --> 00:10:56.233
 в битах, а не в децибелах,
 in bits instead of decibels,

 204
 00:10:56.233 --> 00:10:59.902
 чтобы рассмотреть все сквозь цифровую призму.
 in order to put things in a digital perspective.

 205
 00:10:59.902 --> 00:11:03.028
 Компакт-кассеты…
 Compact cassettes...

 206
 00:11:03.028 --> 00:11:05.449
 для тех из вас, кто достаточно взрослый, чтобы помнить их, – 
 for those of you who are old enough to remember them,

 207
 00:11:05.449 --> 00:11:09.161
 они могли достигать глубины в 9 бит в идеальных условиях,
 could reach as deep as nine bits in perfect conditions,

 208
 00:11:09.161 --> 00:11:11.209
 хотя как правило – от 5 до 6 бит,
 though five to six bits was more typical,

 209
 00:11:11.209 --> 00:11:13.876
 особенно, если это была запись, сделанная на магнитофон.
 especially if it was a recording made on a tape deck.

 210
 00:11:13.876 --> 00:11:19.422
 Так и есть… ваши кассеты с миксами были лишь около 6 бит глубины дискретизации… если вам повезет!
 That's right... your mix tapes were only about six bits deep... if you were lucky!

 211
 00:11:19.837 --> 00:11:22.345
 Лучшие профессиональные ленты для катушечного магнитофона,
 The very best professional open reel tape

 212
 00:11:22.345 --> 00:11:24.553
 используемые в студиях, едва могли достигнуть…
 used in studios could barely hit...

 213
 00:11:24.553 --> 00:11:26.473
 как думаете, сколько?
 any guesses?...

 214
 00:11:26.473 --> 00:11:27.604
 13 бит
 13 bits

 215
 00:11:27.604 --> 00:11:28.980
 <u>с применением</u> улучшенного шумоподавления.
 <u>with</u> advanced noise reduction.

 216
 00:11:28.980 --> 00:11:32.062
 И вот почему видеть "DDD" на компакт-диске
 And that's why seeing 'DDD' on a Compact Disc

 217
 00:11:32.062 --> 00:11:35.208
 было таким важным, крутым делом.
 used to be such a big, high-end deal.

 218
 00:11:40.116 --> 00:11:42.825
 Я постоянно говорю, что при квантовании применяю дизеринг,
 I keep saying that I'm quantizing with dither,

 219
 00:11:42.825 --> 00:11:44.734
 что это вообще такое?
 so what is dither exactly?

 220
 00:11:44.734 --> 00:11:47.284
 А главное, что делает дизеринг?
 More importantly, what does it do?

 221
 00:11:47.284 --> 00:11:49.876
 Простым способом при квантовании сигнала является выбор
 The simple way to quantize a signal is to choose

 222
 00:11:49.876 --> 00:11:52.329
 ближайшего цифрового значения амплитуды 
 the digital amplitude value closest

 223
 00:11:52.329 --> 00:11:54.377
 к исходной аналоговой амплитуде.
 to the original analog amplitude.

 224
 00:11:54.377 --> 00:11:55.337
 Очевидно, правда?
 Obvious, right?

 225
 00:11:55.337 --> 00:11:57.545
 К несчастью, точный уровень шума, получаемый,
 Unfortunately, the exact noise you get

 226
 00:11:57.545 --> 00:11:59.220
 используя такой простой подход при квантовании,
 from this simple quantization scheme

 227
 00:11:59.220 --> 00:12:02.174
 отчасти зависит от входного сигнала,
 depends somewhat on the input signal,

 228
 00:12:02.174 --> 00:12:04.596
 поэтому мы можем получить или нестабильный,
 so we may get noise that's inconsistent,

 229
 00:12:04.596 --> 00:12:06.142
 или вызывающий искажения,
 or causes distortion,

 230
 00:12:06.142 --> 00:12:09.054
 или нежелательный в каком-то другом смысле шум.
 or is undesirable in some other way.

 231
 00:12:09.054 --> 00:12:11.764
 Дизеринг – это специально созданный шум, которым
 Dither is specially-constructed noise that

 232
 00:12:11.764 --> 00:12:15.273
 подменяют производимый при квантовании шум.
 substitutes for the noise produced by simple quantization.

 233
 00:12:15.273 --> 00:12:18.025
 Дизеринг не заглушает или маскирует шум квантования,
 Dither doesn't drown out or mask quantization noise,

 234
 00:12:18.025 --> 00:12:20.190
 он фактически заменяет его
 it actually replaces it

 235
 00:12:20.190 --> 00:12:22.612
 желаемыми шумовыми характеристиками,
 with noise characteristics of our choosing

 236
 00:12:22.612 --> 00:12:24.794
 не попадающими под влияние входного сигнала.
 that aren't influenced by the input.

 237
 00:12:25.256 --> 00:12:27.081
 Давайте <u>посмотрим</u>, что делает дизеринг.
 Let's <u>watch</u> what dither does.

 238
 00:12:27.081 --> 00:12:30.078
 У генератора сигналов слишком много шумов для данного опыта,
 The signal generator has too much noise for this test

 239
 00:12:30.431 --> 00:12:33.161
 поэтому будем создавать математически
 so we'll produce a mathematically

 240
 00:12:33.161 --> 00:12:34.782
 идеальную синусоиду с помощью ThinkPad
 perfect sine wave with the ThinkPad

 241
 00:12:34.782 --> 00:12:38.205
 и квантовать с глубиной дискретизации 8 бит и дизерингом.
 and quantize it to eight bits with dithering.

 242
 00:12:39.006 --> 00:12:41.342
 Мы видим хорошую синусоиду на экране временных диаграмм
 We see a nice sine wave on the waveform display

 243
 00:12:41.342 --> 00:12:43.452
 и на выходе осциллографа
 and output scope

 244
 00:12:44.222 --> 00:12:44.972
 и…
 and...

 245
 00:12:46.588 --> 00:12:49.375
 как только аналоговый анализатор спектра оживится…
 once the analog spectrum analyzer catches up...

 246
 00:12:50.713 --> 00:12:53.588
 отчетливый частотный пик с равномерным уровнем шума
 a clean frequency peak with a uniform noise floor

 247
 00:12:56.864 --> 00:12:58.611
 на обоих экранах со спектром,
 on both spectral displays

 248
 00:12:58.61 1 --> 00:12:59.646
 как и ранее.
 just like before

 249
 00:12:59.646 --> 00:13:01.549
 Повторюсь, это с дизерингом.
 Again, this is with dither.

 250
 00:13:02.196 --> 00:13:04.225
 Теперь я выключаю дизеринг.
 Now I turn dithering off.

 251
 00:13:05.779 --> 00:13:07.913
 Шум квантования, который был распределен дизерингом
 The quantization noise, that dither had spread out

 252
 00:13:07.913 --> 00:13:09.577
 в хороший плоский уровень шума,
 into a nice, flat noise floor,

 253
 00:13:09.577 --> 00:13:12.286
 сплющился в пики гармонического искажения.
 piles up into harmonic distortion peaks.

 254
 00:13:12.286 --> 00:13:16.030
 Уровень шума ниже, но уровень искажений уже ненулевой,
 The noise floor is lower, but the level of distortion becomes nonzero,

 255
 00:13:16.030 --> 00:13:19.668
 и пики искажений установились выше, чем шум шум дизеринга.
 and the distortion peaks sit higher than the dithering noise did.

 256
 00:13:19.668 --> 00:13:22.318
 На восьми битах этот эффект утрирован.
 At eight bits this effect is exaggerated.

 257
 00:13:22.488 --> 00:13:24.200
 На шестнадцати битах,
 At sixteen bits,

 258
 00:13:24.692 --> 00:13:25.929
 даже без дизеринга,
 even without dither,

 259
 00:13:25.929 --> 00:13:28.308
 гармонические искажения будут такими низкими,
 harmonic distortion is going to be so low

 260
 00:13:28.308 --> 00:13:30.708
 что их практически не услышать.
 as to be completely inaudible.

 261
 00:13:30.708 --> 00:13:34.581
 Все равно, мы можем использовать дизеринг, чтобы полностью устранить искажения,
 Still, we can use dither to eliminate it completely

 262
 00:13:34.581 --> 00:13:36.489
 если мы так выберем.
 if we so choose.

 263
 00:13:37.642 --> 00:13:39.273
 Снова выключим дизеринг ненадолго,
 Turning the dither off again for a moment,

 264
 00:13:40.934 --> 00:13:43.444
 и вы заметите, что абсолютный уровень искажений
 you'll notice that the absolute level of distortion

 265
 00:13:43.444 --> 00:13:47.070
 при квантовании без дизеринга остается примерно постоянным
 from undithered quantization stays approximately constant

 266
 00:13:47.070 --> 00:13:49.033
 независимо от амплитуды входного сигнала.
 regardless of the input amplitude.

 267
 00:13:49.033 --> 00:13:51.998
 Но когда уровень сигнала опускается немного ниже половины,
 But when the signal level drops below a half a bit,

 268
 00:13:51.998 --> 00:13:54.036
 все квантуется в ноль.
 everything quantizes to zero.

 269
 00:13:54.036 --> 00:13:54.910
 По сути,
 In a sense,

 270
 00:13:54.910 --> 00:13:58.557
 "все квантуется в ноль" просто означает 100% искажение!
 everything quantizing to zero is just 100% distortion!

 271
 00:13:58.833 --> 00:14:01.588
 Дизеринг тоже устраняет эти искажения.
 Dither eliminates this distortion too.

 272
 00:14:01.588 --> 00:14:03.599
 Мы снова включаем дизеринг и…
 We reenable dither and...

 273
 00:14:03.599 --> 00:14:06.377
 наш сигнал появляется на 1/4 бит,
 there's our signal back at 1/4 bit,

 274
 00:14:06.377 --> 00:14:09.076
 вместе с хорошим плоским уровнем шума.
 with our nice flat noise floor.

 275
 00:14:09.630 --> 00:14:11.220
 Уровень шума не обязан быть плоским.
 The noise floor doesn't have to be flat.

 276
 00:14:11.220 --> 00:14:12.798
 Дизеринг – это шум, выбираемый нами,
 Dither is noise of our choosing,

 277
 00:14:12.798 --> 00:14:15.006
 так давайте выберем шум настолько безобидный
 so let's choose a noise as inoffensive

 278
 00:14:15.006 --> 00:14:17.017
 и труднозаметный, насколько возможно.
 and difficult to notice as possible.

 279
 00:14:18.142 --> 00:14:22.484
 Наш слух наиболее чувствителен в промежутке от 2 до 4 кГц,
 Our hearing is most sensitive in the midrange from 2kHz to 4kHz,

 280
 00:14:22.484 --> 00:14:25.438
 поэтому здесь фоновый шум будет наиболее заметным.
 so that's where background noise is going to be the most obvious.

 281
 00:14:25.438 --> 00:14:29.406
 Мы можем сформировать шум дизеринга подальше от чувствительных частот
 We can shape dithering noise away from sensitive frequencies

 282
 00:14:29.406 --> 00:14:31.241
 туда, где слух менее восприимчив – 
 to where hearing is less sensitive,

 283
 00:14:31.241 --> 00:14:33.910
 обычно это область высоких частот.
 usually the highest frequencies.

 284
 00:14:34.249 --> 00:14:37.460
 16 бит шум дизеринга, как правило, слишком тихий, чтобы услышать,
 16-bit dithering noise is normally much too quiet to hear at all,

 285
 00:14:37.460 --> 00:14:39.668
 но давайте послушаем пример работы нойз-шейпинга,
 but let's listen to our noise shaping example,

 286
 00:14:39.668 --> 00:14:42.234
 опять же, с усилением сигнала…
 again with the gain brought way up...

 287
 00:14:56.020 --> 00:14:59.977
 И наконец, общая мощность шума квантования после дизеринга <u>выше</u>,
 Lastly, dithered quantization noise <u>is</u> higher power overall

 288
 00:14:59.977 --> 00:15:04.276
 чем шум квантования без дизеринга, даже если первый звучит тише.
 than undithered quantization noise even when it sounds quieter.

 289
 00:15:04.276 --> 00:15:07.902
 Можете увидеть это на измерителе уровня звука во время тишины.
 You can see that on a VU meter during passages of near-silence.

 290
 00:15:07.902 --> 00:15:10.537
 Но дизеринг не только можно включить или выключить.
 But dither isn't only an on or off choice.

 291
 00:15:10.537 --> 00:15:14.712
 Мы можем ослабить мощность дизеринга, балансируя между тишиной шума  
 We can reduce the dither's power to balance less noise against

 292
 00:15:14.712 --> 00:15:18.313
 и незначительными искажениями, минимизируя общий эффект.
 a bit of distortion to minimize the overall effect.

 293
 00:15:19.605 --> 00:15:22.790
 Также мы будем модулировать входной сигнал вот так:
 We'll also modulate the input signal like this:

 294
 00:15:27.098 --> 00:15:30.206
 …чтобы показать, как изменение входного сигнала влияет на шум квантования.
 ...to show how a varying input affects the quantization noise.

 295
 00:15:30.206 --> 00:15:33.289
 На полной мощности дизеринга, шум единообразен, постоянен
 At full dithering power, the noise is uniform, constant,

 296
 00:15:33.289 --> 00:15:35.643
 и невыразителен, как мы и ожидали:
 and featureless just like we expect:

 297
 00:15:40.937 --> 00:15:42.772
 При уменьшении мощности дизеринга,
 As we reduce the dither's power,

 298
 00:15:42.772 --> 00:15:46.356
 входной сигнал все больше и больше влияет на амплитуду и свойства
 the input increasingly affects the amplitude and the character

 299
 00:15:46.356 --> 00:15:47.977
 шума квантования:
 of the quantization noise:

 300
 00:16:09.883 --> 00:16:13.844
 Поведение дизеринга после ноиз-шейпинга схоже,
 Shaped dither behaves similarly,

 301
 00:16:13.844 --> 00:16:16.553
 но ноиз-шейпинг дает еще одно хорошее преимущество.
 but noise shaping lends one more nice advantage.

 302
 00:16:16.553 --> 00:16:18.804
 Короче говоря, он может использовать
 To make a long story short, it can use

 303
 00:16:18.804 --> 00:16:20.937
 слегка меньшую мощность дизеринга прежде, чем входной сигнал
 a somewhat lower dither power before the input

 304
 00:16:20.937 --> 00:16:23.662
 окажет соответствующее влияние на выходной.
 has as much effect on the output.

 305
 00:16:49.172 --> 00:16:51.508
 Несмотря на все это время, что я потратил на дизеринг,
 Despite all the time I just spent on dither,

 306
 00:16:51.508 --> 00:16:53.012
 мы говорим о различиях,
 we're talking about differences

 307
 00:16:53.012 --> 00:16:56.372
 начинающихся на 100 дБ ниже измеряемого диапазона.
 that start 100 decibels below full scale.

 308
 00:16:56.372 --> 00:16:59.806
 Возможно, если бы CD имели 14 бит, как изначально задумывалось,
 Maybe if the CD had been 14 bits as originally designed,

 309
 00:16:59.806 --> 00:17:01.513
 дизеринг <u>мог бы</u> быть важнее.
 dither <u>might</u> be more important.

 310
 00:17:01.989 --> 00:17:02.644
 Возможно.
 Maybe.

 311
 00:17:02.644 --> 00:17:05.438
 С 16 бит, на самом деле, почти без разницы.
 At 16 bits, really, it's mostly a wash.

 312
 00:17:05.438 --> 00:17:08.019
 Вы можете думать о дизеринге как о страховке,
 You can think of dither as an insurance policy

 313
 00:17:08.019 --> 00:17:11.443
 дающей несколько дополнительных дБ к динамическому диапазону
 that gives several extra decibels of dynamic range

 314
 00:17:11.443 --> 00:17:12.804
 на всякий случай.
 just in case.

 315
 00:17:12.990 --> 00:17:14.196
 Тем не менее, факт в том, что,
 The simple fact is, though,

 316
 00:17:14.196 --> 00:17:16.361
 никто не уничтожил великолепную запись,
 no one ever ruined a great recording

 317
 00:17:16.361 --> 00:17:19.182
 не воспользовавшись дизерингом при мастеринге звукозаписи.
 by not dithering the final master.

 318
 00:17:24.414 --> 00:17:25.790
 Мы использовали синусоиды.
 We've been using sine waves.

 319
 00:17:25.790 --> 00:17:28.254
 Они являются очевидным выбором когда то, что хотим увидеть –
 They're the obvious choice when what we want to see

 320
 00:17:28.254 --> 00:17:32.212
 это поведение системы на данной отдельной частоте.
 is a system's behavior at a given isolated frequency.

 321
 00:17:32.212 --> 00:17:34.217
 Теперь давайте рассмотрим кое-что посложнее.
 Now let's look at something a bit more complex.

 322
 00:17:34.217 --> 00:17:35.923
 Что нам следует ожидать,
 What should we expect to happen

 323
 00:17:35.923 --> 00:17:39.671
 когда я изменю входной сигнал на меандр?
 when I change the input to a square wave...

 324
 00:17:42.718 --> 00:17:45.921
 Осциллограф на входе выводит наш 1 кГц меандр.
 The input scope confirms our 1kHz square wave.

 325
 00:17:45.921 --> 00:17:47.351
 А осциллограф на выходе показывает…
 The output scope shows..

 326
 00:17:48.614 --> 00:17:51.102
 В точности, что и следует.
 Exactly what it should.

 327
 00:17:51.102 --> 00:17:53.900
 Что такое меандр на самом деле?
 What is a square wave really?

 328
 00:17:54.654 --> 00:17:57.982
 Скажем, это диаграмма сигнала, где есть положительное значение
 Well, we can say it's a waveform that's some positive value

 329
 00:17:57.982 --> 00:18:00.788
 во время одного полупериода, мгновенно меняющееся
 for half a cycle and then transitions instantaneously

 330
 00:18:00.788 --> 00:18:02.910
 на отрицательное в другом полупериоде.
 to a negative value for the other half.

 331
 00:18:02.910 --> 00:18:05.076
 Но это как-то не сообщает нам ничего полезного о том,
 But that doesn't really tell us anything useful

 332
 00:18:05.076 --> 00:18:07.241
 как этот входной сигнал
 about how this input

 333
 00:18:07.241 --> 00:18:09.378
 становится таким на выходе.
 becomes this output.

 334
 00:18:10.132 --> 00:18:12.713
 Далее, мы помним, что любая волна
 Then we remember that any waveform

 335
 00:18:12.713 --> 00:18:15.508
 также является суммой дискретных частот,
 is also the sum of discrete frequencies,

 336
 00:18:15.508 --> 00:18:18.302
 и меандр, в частности, – просто сумма
 and a square wave is a particularly simple sum

 337
 00:18:18.302 --> 00:18:19.636
 несущей частоты и
 a fundamental and

 338
 00:18:19.636 --> 00:18:22.228
 бесконечного числа нечетных гармоник.
 an infinite series of odd harmonics.

 339
 00:18:22.228 --> 00:18:24.597
 Сложите их все, и вы получите меандр.
 Sum them all up, you get a square wave.

 340
 00:18:26.398 --> 00:18:27.433
 На первый взгляд,
 At first glance,

 341
 00:18:27.433 --> 00:18:29.225
 это тоже не похоже на полезную информацию.
 that doesn't seem very useful either.

 342
 00:18:29.225 --> 00:18:31.561
 Необходимо сложить бесконечное число гармоник,
 You have to sum up an infinite number of harmonics

 343
 00:18:31.561 --> 00:18:33.108
 чтобы получить ответ.
 to get the answer.

 344
 00:18:33.108 --> 00:18:35.977
 А, но у нас нет бесконечного числа гармоник.
 Ah, but we don't have an infinite number of harmonics.

 345
 00:18:36.960 --> 00:18:39.902
 У нас антиалайзинговый фильтр с крутым спадом переходной полосы,
 We're using a quite sharp anti-aliasing filter

 346
 00:18:39.902 --> 00:18:42.206
 частота среза которого 20 кГц,
 that cuts off right above 20kHz,

 347
 00:18:42.206 --> 00:18:44.158
 поэтому наш сигнал ограничен по полосе частот,
 so our signal is band-limited,

 348
 00:18:44.158 --> 00:18:46.421
 что означает следующее:
 which means we get this:

 349
 00:18:52.500 --> 00:18:56.468
 …и это в точности, что мы видим на осциллографе с выхода.
 ..and that's exactly what we see on the output scope.

 350
 00:18:56.468 --> 00:18:59.550
 Пульсация, которую вы видите по краям сигнала с ограниченной полосой частот,
 The rippling you see around sharp edges in a bandlimited signal

 351
 00:18:59.550 --> 00:19:00.926
 называется "явлением Гиббса".
 is called the Gibbs effect.

 352
 00:19:00.926 --> 00:19:04.137
 Оно происходит всякий раз, когда вы срезаете часть области частот
 It happens whenever you slice off part of the frequency domain

 353
 00:19:04.137 --> 00:19:07.006
 в пределах которой сосредоточена энергия сигнала.
 in the middle of nonzero energy.

 354
 00:19:07.006 --> 00:19:09.854
 Обычно вы услышите эмпирическое правило: чем круче спад переходной полосы,
 The usual rule of thumb you'll hear is the sharper the cutoff,

 355
 00:19:09.854 --> 00:19:11.188
 тем сильнее пульсация.
 the stronger the rippling,

 356
 00:19:11.188 --> 00:19:12.777
 Что в общем-то правда,
 which is approximately true,

 357
 00:19:12.777 --> 00:19:14.900
 но нужно быть осторожнее в наших представлениях.
 but we have to be careful how we think about it.

 358
 00:19:14.900 --> 00:19:15.774
 Например…
 For example...

 359
 00:19:15.774 --> 00:19:19.529
 Что по-вашему будет делать наш "крутой" антиалайзинговый
 what would you expect our quite sharp anti-aliasing filter

 360
 00:19:19.529 --> 00:19:23.181
 фильтр, если я пропущу через него сигнал дважды?
 to do if I run our signal through it a second time?

 361
 00:19:34.136 --> 00:19:37.588
 Помимо добавления нескольких незначительных циклов задержек,
 Aside from adding a few fractional cycles of delay,

 362
 00:19:37.588 --> 00:19:39.348
 ответ будет…
 the answer is...

 363
 00:19:39.348 --> 00:19:40.857
 вообще ничего.
 nothing at all.

 364
 00:19:41.257 --> 00:19:43.302
 Сигнал уже ограничен по полосе частот.
 The signal is already bandlimited.

 365
 00:19:43.656 --> 00:19:46.590
 Повторное ограничение полосы частот ни на что не влияет.
 Bandlimiting it again doesn't do anything.

 366
 00:19:46.590 --> 00:19:50.686
 Второй проход не может убрать частоты, которые уже были удалены.
 A second pass can't remove frequencies that we already removed.

 367
 00:19:52.070 --> 00:19:53.737
 И это важно.
 And that's important.

 368
 00:19:53.737 --> 00:19:56.233
 Люди склонны думать о пульсации как о своего рода артефакте,
 People tend to think of the ripples as a kind of artifact

 369
 00:19:56.233 --> 00:19:59.945
 добавляемом антиалайзинговым и реконструкционным фильтрами,
 that's added by anti-aliasing and anti-imaging filters,

 370
 00:19:59.945 --> 00:20:01.737
 считая, что пульсация становится хуже
 implying that the ripples get worse

 371
 00:20:01.737 --> 00:20:03.913
 с каждым проходом сигнала через них.
 each time the signal passes through.

 372
 00:20:03.913 --> 00:20:05.950
 Мы видим, что в данном случае этого не случилось.
 We can see that in this case that didn't happen.

 373
 00:20:05.950 --> 00:20:09.492
 Так был ли это на самом деле фильтр, добавивший пульсацию при 1-м проходе?
 So was it really the filter that added the ripples the first time through?

 374
 00:20:09.492 --> 00:20:10.537
 Нет, не совсем.
 No, not really.

 375
 00:20:10.537 --> 00:20:12.126
 Это деликатный момент,
 It's a subtle distinction,

 376
 00:20:12.126 --> 00:20:15.252
 т.к. пульсация при эффекте Гиббса добавляется не фильтрами –
 but Gibbs effect ripples aren't added by filters,

 377
 00:20:15.252 --> 00:20:18.836
 она просто часть того, чем является сигнал с ограниченной полосой частот.
 they're just part of what a bandlimited signal <u>is</u>.

 378
 00:20:18.836 --> 00:20:20.798
 Даже если мы искусственно сгенерируем сигнал,
 Even if we synthetically construct

 379
 00:20:20.798 --> 00:20:23.508
 который выглядит как идеальный цифровой меандр,
 what looks like a perfect digital square wave,

 380
 00:20:23.508 --> 00:20:26.206
 его полоса частот все равно ограничена полосой пропускания передающего канала.
 it's still limited to the channel bandwidth.

 381
 00:20:26.206 --> 00:20:29.140
 Вспомните, что ступенчатое представление кривой неточно.
 Remember the stairstep representation is misleading.

 382
 00:20:29.140 --> 00:20:32.222
 Что на самом деле есть у нас – это точки отсчета,
 What we really have here are instantaneous sample points,

 383
 00:20:32.222 --> 00:20:36.148
 и только 1 сигнал с ограниченной полосой частот подходит к этим точкам.
 and only one bandlimited signal fits those points.

 384
 00:20:36.148 --> 00:20:39.614
 Все что мы сделали, когда рисовали наш идеальный меандр,
 All we did when we drew our apparently perfect square wave

 385
 00:20:39.614 --> 00:20:43.198
 это расставили точки отсчета как раз, чтобы сложилось впечатление,
 was line up the sample points just right so it appeared

 386
 00:20:43.198 --> 00:20:47.785
 что здесь нет пульсаций, если мы сыграем в "Соедини точки".
 that there were no ripples if we played connect-the-dots.

 387
 00:20:47.785 --> 00:20:49.449
 Но исходный сигнал с ограниченной полосой частот
 But the original bandlimited signal,

 388
 00:20:49.449 --> 00:20:52.742
 вместе с пульсациями все еще там.
 complete with ripples, was still there.

 389
 00:20:54.004 --> 00:20:56.542
 И это ведет нас к еще одному важному моменту.
 And that leads us to one more important point.

 390
 00:20:56.542 --> 00:20:59.550
 Вы наверняка уже слышали, что точность синхронизации цифрового сигнала
 You've probably heard that the timing precision of a digital signal

 391
 00:20:59.550 --> 00:21:02.409
 ограничена его частотой дискретизации; другими словами,
 is limited by its sample rate; put another way,

 392
 00:21:02.409 --> 00:21:05.140
 якобы цифровые сигналы не могут представлять ничего,
 that digital signals can't represent anything

 393
 00:21:05.140 --> 00:21:08.041
 что попадает между точками отсчетов…
 that falls between the samples...

 394
 00:21:08.041 --> 00:21:11.422
 имеется в виду, что импульсы или резкие скачки должны быть четко
 implying that impulses or fast attacks have to align

 395
 00:21:11.422 --> 00:21:14.473
 выравнены с отсчетами, или синхронизация будет утрачена…
 exactly with a sample, or the timing gets mangled...

 396
 00:21:14.473 --> 00:21:16.219
 и они просто исчезнут.
 or they just disappear.

 397
 00:21:16.711 --> 00:21:20.820
 Теперь мы легко можем увидеть, почему это не так.
 At this point, we can easily see why that's wrong.

 398
 00:21:20.820 --> 00:21:23.742
 Еще раз, наш входной сигнал ограничен по полосе частот.
 Again, our input signals are bandlimited.

 399
 00:21:23.742 --> 00:21:26.036
 И цифровой сигнал – это точки отсчета,
 And digital signals are samples,

 400
 00:21:26.036 --> 00:21:29.340
 не ступеньки, не "Соедини точки".
 not stairsteps, not 'connect-the-dots'.

 401
 00:21:31.572 --> 00:21:34.592
 Мы определенно можем, например,
 We most certainly can, for example,

 402
 00:21:36.777 --> 00:21:39.337
 разместить фронт нашего меандра с ограниченной полосой частот
 put the rising edge of our bandlimited square wave

 403
 00:21:39.337 --> 00:21:42.004
 в любом месте между отсчетами.
 anywhere we want between samples.

 404
 00:21:42.004 --> 00:21:44.354
 Меандр отлично изображается
 It's represented perfectly

 405
 00:21:47.508 --> 00:21:50.218
 и отлично восстанавливается.
 and it's reconstructed perfectly.

 406
 00:22:04.620 --> 00:22:06.526
 Как и в предыдущей части,
 Just like in the previous episode,

 407
 00:22:06.526 --> 00:22:08.393
 мы охватили широкий круг тем,
 we've covered a broad range of topics,

 408
 00:22:08.393 --> 00:22:10.868
 и при этом лишь едва коснулись каждой из них.
 and yet barely scratched the surface of each one.

 409
 00:22:10.868 --> 00:22:13.620
 Если уж на то пошло, то в этот раз у меня больше грехов упущения…
 If anything, my sins of omission are greater this time around...

 410
 00:22:13.620 --> 00:22:16.286
 но это хороший момент все завершить.
 but this is a good stopping point.

 411
 00:22:16.286 --> 00:22:17.833
 Или, может, хорошая отправная точка.
 Or maybe, a good starting point.

 412
 00:22:17.833 --> 00:22:18.708
 Пробуйте копнуть глубже.
 Dig deeper.

 413
 00:22:18.708 --> 00:22:19.710
 Экспериментируйте.
 Experiment.

 414
 00:22:19.710 --> 00:22:21.374
 Я со всей тщательностью подбирал опыты,
 I chose my demos very carefully

 415
 00:22:21.374 --> 00:22:23.668
 чтобы они были простыми и красноречивыми.
 to be simple and give clear results.

 416
 00:22:23.668 --> 00:22:26.217
 Вы можете воспроизвести каждый из них самостоятельно, если хотите.
 You can reproduce every one of them on your own if you like.

 417
 00:22:26.217 --> 00:22:28.766
 Только давайте признаемся, что иногда мы узнаем больше
 But let's face it, sometimes we learn the most

 418
 00:22:28.766 --> 00:22:30.516
 о модной игрушке, разобрав ее до основания
 about a spiffy toy by breaking it open

 419
 00:22:30.516 --> 00:22:32.553
 и изучая все выпавшие кусочки.
 and studying all the pieces that fall out.

 420
 00:22:32.553 --> 00:22:35.230
 И это нормально – мы инженеры.
 That's OK, we're engineers.

 421
 00:22:35.230 --> 00:22:36.350
 Поиграйтесь с демо-параметрами,
 Play with the demo parameters,

 422
 00:22:36.350 --> 00:22:37.972
 хакерните код,
 hack up the code,

 423
 00:22:37.972 --> 00:22:39.774
 проведите другие опыты.
 set up alternate experiments.

 424
 00:22:39.774 --> 00:22:40.692
 Исходный код для всего,
 The source code for everything,

 425
 00:22:40.692 --> 00:22:42.398
 включая небольшое кнопочное демо-приложение,
 including the little pushbutton demo application,

 426
 00:22:42.398 --> 00:22:44.361
 выложен на Xiph.Org.
 is up at Xiph.Org.

 427
 00:22:44.361 --> 00:22:45.940
 В ходе экспериментов,
 In the course of experimentation,

 428
 00:22:45.940 --> 00:22:47.401
 вы, скорее всего, столкнетесь с чем-то,
 you're likely to run into something

 429
 00:22:47.401 --> 00:22:49.950
 чего не ожидали и не можете объяснить.
 that you didn't expect and can't explain.

 430
 00:22:49.950 --> 00:22:51.198
 Не переживайте!
 Don't worry!

 431
 00:22:51.198 --> 00:22:54.537
 Без шуток, Википедия потрясающе подходит
 My earlier snark aside, Wikipedia is fantastic for

 432
 00:22:54.537 --> 00:22:56.788
 как раз для подобных неформальных исследований.
 exactly this kind of casual research.

 433
 00:22:56.788 --> 00:22:59.956
 Если вы действительно серьезно намерены разобраться в сигналах,
 If you're really serious about understanding signals,

 434
 00:22:59.956 --> 00:23:03.337
 у некоторых университетов есть онлайн материалы продвинутого уровня,
 several universities have advanced materials online,

 435
 00:23:03.337 --> 00:23:07.380
 например курсы 6.003 и 6.007 "Signals and Systems"
 such as the 6.003 and 6.007 Signals and Systems modules

 436
 00:23:07.380 --> 00:23:08.798
 на MIT OpenCourseWare.
 at MIT OpenCourseWare.

 437
 00:23:08.798 --> 00:23:11.593
 И, конечно же, сообщество Xiph.Org всегда доступно вам.
 And of course, there's always the community here at Xiph.Org.

 438
 00:23:12.792 --> 00:23:13.929
 Копать глубже или нет,
 Digging deeper or not,

 439
 00:23:13.929 --> 00:23:14.974
 у меня кончился кофе,
 I am out of coffee,

 440
 00:23:14.974 --> 00:23:16.436
 так что до следующих встреч,
 so, until next time,

 441
 00:23:16.436 --> 00:23:19.316
 веселого хакинга!
 happy hacking!
diff --git a/02-Digital_Show_and_Tell.ru.titles.vtt b/02-Digital_Show_and_Tell.ru.titles.vtt
 WEBVTT

 1
 00:00:05.700 --> 00:00:07.500
 ["Покажи и расскажи": цифровая версия]

 2
 00:00:08.252 --> 00:00:11.550
 Привет! Я Монти Монтгомери из Red Hat и Xiph.Org.

 3
 00:00:11.550 --> 00:00:18.430
 Несколько месяцев назад я написал статью о цифровом аудио и почему нет смысла в загрузке музыки 24 бит / 192 кГц.

 4
 00:00:18.430 --> 00:00:23.433
 В той статье я почти вскользь отметил, что форма цифровой волны не ступенчатая,

 5
 00:00:23.433 --> 00:00:28.680
 и что вы точно не получите ровные ступеньки, когда преобразуете из цифры обратно в аналог.

 6
 00:00:29.865 --> 00:00:33.865
 Из всего, что было в статье, <b>это</b> было темой номер один, о чем люди писали.

 7
 00:00:33.865 --> 00:00:37.221
 На самом деле, более половины всех полученных писем составили вопросы и комментарии

 8
 00:00:37.221 --> 00:00:39.663
 об основах поведения цифрового сигнала.

 9
 00:00:39.894 --> 00:00:45.285
 Поскольку многим интересно, давайте уделим некоторое время, чтобы поиграться с <u>простым</u> цифровым сигналом.

 10
 00:00:45.000 --> 00:00:49.000
 ["Истина из машины"]

 11
 00:00:49.747 --> 00:00:51.006
 Вспомним на секунду,

 12
 00:00:51.006 --> 00:00:54.089
 что мы без понятия, как на самом деле цифровой сигнал ведет себя.

 13
 00:00:54.734 --> 00:00:56.841
 В этом случае нам также нет никакого смысла

 14
 00:00:56.841 --> 00:00:59.049
 использовать цифровое испытательное оборудование.

 15
 00:00:59.049 --> 00:01:00.937
 К счастью, для данной работы где-то здесь

 16
 00:01:00.937 --> 00:01:04.020
 все еще имеется куча аналогового лабораторного оборудования.

 17
 00:01:04.020 --> 00:01:05.972
 Во-первых, нам нужен генератор сигналов,

 18
 00:01:05.972 --> 00:01:08.190
 чтобы обеспечить нас аналоговыми входными сигналами.

 19
 00:01:08.190 --> 00:01:12.692
 В данном случае это HP3325 1978 года.

 20
 00:01:12.692 --> 00:01:14.153
 Это по-прежнему довольно хороший генератор,

 21
 00:01:14.153 --> 00:01:15.614
 так что если вас не заботят габариты,

 22
 00:01:15.614 --> 00:01:16.532
 вес,

 23
 00:01:16.532 --> 00:01:17.577
 потребление электроэнергии

 24
 00:01:17.577 --> 00:01:18.910
 и шумный вентилятор,

 25
 00:01:18.910 --> 00:01:20.329
 то можете найти их на eBay.

 26
 00:01:20.329 --> 00:01:23.863
 Иногда они чуть дороже, чем вы заплатите за доставку.

 27
 00:01:24.617 --> 00:01:28.500
 Затем, мы будем наблюдать за диаграммами аналоговых сигналов на аналоговых осциллографах,

 28
 00:01:28.500 --> 00:01:31.550
 таких как этот Tektronix 2246 из середины 90х –

 29
 00:01:31.550 --> 00:01:34.761
 один из последних и самых лучших аналоговых осциллографов.

 30
 00:01:34.761 --> 00:01:36.807
 В каждой домашней лаборатории по-хорошему должен быть такой.

 31
 00:01:37.716 --> 00:01:40.852
 Наконец, изучим спектр частот наших сигналов,

 32
 00:01:40.852 --> 00:01:43.177
 используя аналоговый анализатор спектра.

 33
 00:01:43.177 --> 00:01:47.732
 Это HP3585 из той же линейки, что и генератор сигналов.

 34
 00:01:47.732 --> 00:01:50.615
 Как и другое имеющееся оборудование, он оснащен

 35
 00:01:50.615 --> 00:01:52.905
 элементарным и нереально большим микроконтроллером,

 36
 00:01:52.905 --> 00:01:56.276
 но сигнал на всем пути от входа до того, что вы видите на экране,

 37
 00:01:56.276 --> 00:01:58.537
 полностью аналоговый.

 38
 00:01:58.537 --> 00:02:00.329
 Все это оборудование старинное,

 39
 00:02:00.329 --> 00:02:01.993
 но, кроме внушительного веса,

 40
 00:02:01.993 --> 00:02:03.844
 характеристики все еще достаточно хорошие.

 41
 00:02:04.536 --> 00:02:06.868
 В данный момент наш генератор сигналов вырабатывает

 42
 00:02:06.868 --> 00:02:12.829
 хорошую 1 кГц синусоиду со среднеквадратичным значением (СКЗ) напряжения 1 В.

 43
 00:02:13.414 --> 00:02:15.220
 Мы видим синусоидальную волну на осциллографе,

 44
 00:02:15.220 --> 00:02:21.428
 можем убедиться, что действительно 1 кГц и имеет СКЗ напряжения 1 В,

 45
 00:02:21.428 --> 00:02:24.108
 то есть волна с размахом 2,8 В,

 46
 00:02:24.308 --> 00:02:27.561
 и что она также соответствует измерениям спектрального анализатора.

 47
 00:02:27.561 --> 00:02:30.644
 Анализатор еще показывает белый шум низкой амплитуды

 48
 00:02:30.644 --> 00:02:32.190
 и небольшое гармоническое искажение

 49
 00:02:32.190 --> 00:02:36.649
 с наибольшим пиком около 70 дБ ниже несущей частоты.

 50
 00:02:36.649 --> 00:02:38.612
 Хоть это и совсем не важно в наших опытах,

 51
 00:02:38.612 --> 00:02:40.574
 но я хотел отметить это сейчас

 52
 00:02:40.574 --> 00:02:42.452
 на случай, если вы не замечали это ранее.

 53
 00:02:44.036 --> 00:02:47.142
 Сейчас мы понизим частоту дискретизации до средних значений.

 54
 00:02:48.557 --> 00:02:51.024
 Для преобразования мы будем использовать непримечательное

 55
 00:02:51.024 --> 00:02:53.374
 потребительское аудиоустройство eMagic USB1.

 56
 00:02:53.374 --> 00:02:55.337
 Оно уже тоже старше десяти лет

 57
 00:02:55.337 --> 00:02:57.257
 и продолжает устаревать.

 58
 00:02:57.964 --> 00:03:02.676
 Современный конвертер без труда может иметь характеристики на порядок выше.

 59
 00:03:03.076 --> 00:03:07.924
 Неравномерность АЧХ, нелинейность, джиттер, шумовые характеристики и прочее…

 60
 00:03:07.924 --> 00:03:09.353
 что вы могли и не заметить.

 61
 00:03:09.353 --> 00:03:11.604
 То, что мы можем измерить улучшение,

 62
 00:03:11.604 --> 00:03:13.609
 не значит, что мы можем это услышать,

 63
 00:03:13.609 --> 00:03:16.404
 и даже эти старые коробочки потребительского уровня

 64
 00:03:16.404 --> 00:03:18.643
 уже тогда были на грани прозрачности [Transparency (data compression)]

 65
 00:03:20.244 --> 00:03:22.825
 eMagic подключен к моему ThinkPad,

 66
 00:03:22.825 --> 00:03:26.121
 который отображает диаграмму цифрового сигнала и спектр для сравнения, 

 67
 00:03:26.121 --> 00:03:28.788
 затем ThinkPad отправляет цифровой сигнал обратно в

 68
 00:03:28.788 --> 00:03:30.921
 eMagic для преобразования обратно в аналоговый сигнал

 69
 00:03:30.921 --> 00:03:33.332
 и наблюдения на экране осциллографа.

 70
 00:03:33.332 --> 00:03:35.582
 Со входа на выход. Слева направо.

 71
 00:03:36.00 --> 00:03:39.000
 ["Ступеньки"]

 72
 00:03:40.211 --> 00:03:41.214
 Все, пора начинать.

 73
 00:03:41.214 --> 00:03:43.924
 Начнем с преобразования аналогового сигнала в цифровой,

 74
 00:03:43.924 --> 00:03:47.347
 a потом – снова обратно в аналоговый, и больше ничего.

 75
 00:03:47.347 --> 00:03:49.268
 Генератор сигналов настроен на создание

 76
 00:03:49.268 --> 00:03:52.649
 синусоиды с частотой 1 кГц, как и прежде.

 77
 00:03:52.649 --> 00:03:57.428
 Со входа мы можем видеть нашу аналоговую синусоиду на осциллографе.

 78
 00:03:57.428 --> 00:04:01.694
 Мы оцифровываем сигнал с помощью ИКМ (16 бит, 44,1 кГц) –

 79
 00:04:01.694 --> 00:04:03.828
 так же, как звук на CD.

 80
 00:04:03.828 --> 00:04:07.156
 Спектр оцифрованного сигнала соответствует тому, что мы видели ранее. И-и…

 81
 00:04:07.156 --> 00:04:10.836
 вот что мы видим на аналоговом анализаторе спектра,

 82
 00:04:10.836 --> 00:04:15.154
 не считая чуть прибавившихся шумов из-за входа с высоким сопротивлением.

 83
 00:04:15.154 --> 00:04:15.956
 В то же время

 84
 00:04:18.248 --> 00:04:20.798
 окно вывода диаграмм показывает нашу оцифрованную синусоиду

 85
 00:04:20.798 --> 00:04:23.966
 в ступенчатом виде – по ступеньке на отсчет.

 86
 00:04:23.966 --> 00:04:26.388
 И, когда мы смотрим на выходной сигнал,

 87
 00:04:26.388 --> 00:04:29.054
 т.е. сконвертированный в аналоговый из цифрового, мы видим…

 88
 00:04:29.054 --> 00:04:32.052
 Он в точности такой же, как первоначальная синусоида.

 89
 00:04:32.052 --> 00:04:33.483
 Никаких ступенек.

 90
 00:04:33.914 --> 00:04:37.193
 Ладно, все же 1 кГц и правда низкая частота.

 91
 00:04:37.193 --> 00:04:40.633
 Может ступеньки просто сложно разглядеть или они были сглажены?

 92
 00:04:40.739 --> 00:04:49.492
 Логично. Давайте поднимем частоту примерно до частоты Найквиста. Скажем, до 15 кГц.

 93
 00:04:49.492 --> 00:04:53.545
 Теперь синусоида описывается менее чем тремя отсчетами за период, и…

 94
 00:04:53.545 --> 00:04:55.838
 цифровая диаграмма выглядит довольно ужасно.

 95
 00:04:55.838 --> 00:04:59.798
 Что ж, внешность обманчива. Аналоговый выход…

 96
 00:05:01.876 --> 00:05:06.033
 по-прежнему идеальная синусоида, точь-в-точь как исходная.

 97
 00:05:06.633 --> 00:05:09.228
 Продолжим поднимать частоту.

 98
 00:05:17.353 --> 00:05:20.151
 16 кГц

 99
 00:05:23.198 --> 00:05:25.616
 17 кГц

 100
 00:05:28.201 --> 00:05:29.945
 18 кГц

 101
 00:05:33.822 --> 00:05:35.548
 19 кГц

 102
 00:05:40.457 --> 00:05:42.465
 20 кГц

 103
 00:05:49.097 --> 00:05:52.350
 Добро пожаловать в верхние пределы слышимости человеком.

 104
 00:05:52.350 --> 00:05:54.377
 Выходная диаграмма сигнала по-прежнему отличная.

 105
 00:05:54.377 --> 00:05:58.025
 Ни рванных краев, ни завалов, ни ступенек.

 106
 00:05:58.025 --> 00:06:01.342
 Так куда пропали ступеньки?

 107
 00:06:01.342 --> 00:06:03.198
 Не отвечайте, это каверзный вопрос.

 108
 00:06:03.198 --> 00:06:04.318
 Ступенек там никогда не было.

 109
 00:06:04.318 --> 00:06:06.652
 Изображение цифровой диаграммы сигнала ступеньками

 110
 00:06:08.712 --> 00:06:10.772
 было изначально неправильным.

 111
 00:06:10.942 --> 00:06:11.998
 Почему?

 112
 00:06:11.998 --> 00:06:14.366
 Ступенчатая кривая – это график непрерывной функции.

 113
 00:06:14.366 --> 00:06:16.201
 Она угловатая и кусочно-постоянная,

 114
 00:06:16.201 --> 00:06:19.700
 но имеет определенное значение в каждый момент времени. 

 115
 00:06:19.700 --> 00:06:22.004
 Дискретизированный сигнал совершенно другой.

 116
 00:06:22.004 --> 00:06:23.337
 Он дискретен по времени

 117
 00:06:23.337 --> 00:06:27.337
 и определен только в каждой точке отсчета,

 118
 00:06:27.337 --> 00:06:32.596
 и не определен, т.е. вообще нет значений, всюду между отсчетами.

 119
 00:06:32.596 --> 00:06:36.666
 Дискретный сигнал следует изображать дискретными отсчетами.

 120
 00:06:40.020 --> 00:06:42.974
 Непрерывный аналоговый коллега цифрового сигнала

 121
 00:06:42.974 --> 00:06:45.364
 плавно проходит каждую точку отсчета,

 122
 00:06:45.364 --> 00:06:50.153
 и это также справедливо как для высоких частот, так и для низких.

 123
 00:06:50.153 --> 00:06:53.033
 Далее, интересная и совсем не очевидная часть:

 124
 00:06:53.033 --> 00:06:55.454
 существует только один сигнал с ограниченной полосой частот, проходящий

 125
 00:06:55.454 --> 00:06:57.417
 строго через каждую точку отсчета.

 126
 00:06:57.417 --> 00:06:58.708
 Это единственное решение.

 127
 00:06:58.708 --> 00:07:01.246
 Так что если вы дискретизируете сигнал с ограниченной полосой частот

 128
 00:07:01.246 --> 00:07:02.612
 и потом конвертируете обратно,

 129
 00:07:02.612 --> 00:07:06.462
 то исходный входной сигнал – единственный возможный сигнал на выходе.

 130
 00:07:06.462 --> 00:07:07.838
 И прежде, чем вы скажете:

 131
 00:07:07.838 --> 00:07:11.721
 "Ну, я могу нарисовать другой сигнал, проходящий через эти точки".

 132
 00:07:11.721 --> 00:07:14.283
 Хорошо, да, вы можете, но…

 133
 00:07:17.268 --> 00:07:20.521
 Даже если сигнал отличается едва заметно от исходного,

 134
 00:07:20.521 --> 00:07:24.905
 то он содержит частотную составляющую на частоте Найквиста или за ее пределом,

 135
 00:07:24.905 --> 00:07:26.185
 нарушая требование ограниченности полосы частот,

 136
 00:07:26.185 --> 00:07:28.358
 что делает такой сигнал неподходящим решением. 

 137
 00:07:28.574 --> 00:07:30.036
 Как же так все сбились с толку

 138
 00:07:30.036 --> 00:07:32.702
 и начали думать о цифровом сигнале как о ступенчатой кривой?

 139
 00:07:32.702 --> 00:07:34.900
 Я могу придумать две хорошие причины.

 140
 00:07:34.900 --> 00:07:37.956
 Первая – довольно просто представить дискретизированный сигнал

 141
 00:07:37.972 --> 00:07:39.294
 в виде ступенчатой кривой.

 142
 00:07:39.294 --> 00:07:42.409
 Просто расширьте значение каждой точки отсчета вперед до следующего отсчета.

 143
 00:07:42.409 --> 00:07:44.414
 Это называется экстраполяцией нулевого порядка

 144
 00:07:44.414 --> 00:07:47.913
 и является важной частью в работе некоторых цифро-аналоговых преобразователей,

 145
 00:07:47.913 --> 00:07:50.089
 особенно самых простых из них.

 146
 00:07:50.089 --> 00:07:55.591
 Так что любой кто ищет о цифро-аналоговом преобразовании,

 147
 00:07:55.592 --> 00:07:59.550
 вероятно, увидит где-нибудь диаграмму со ступенчатой кривой,

 148
 00:07:59.550 --> 00:08:01.982
 но это не законченное преобразование,

 149
 00:08:01.982 --> 00:08:04.250
 и это не сигнал, получаемый на выходе.

 150
 00:08:04.944 --> 00:08:05.684
 Вторая причина –

 151
 00:08:05.684 --> 00:08:07.529
 и это, видимо, более вероятная причина –

 152
 00:08:07.529 --> 00:08:09.449
 инженеры, которые вроде как знают лучше,

 153
 00:08:09.449 --> 00:08:10.441
 типа меня,

 154
 00:08:10.441 --> 00:08:13.193
 рисуют ступенчатые кривые, пусть даже эти графики технически неправильны.

 155
 00:08:13.193 --> 00:08:15.571
 Это что-то типа одномерной версии 

 156
 00:08:15.571 --> 00:08:17.395
 растолстевших бит в цифровых редакторах.

 157
 00:08:17.395 --> 00:08:19.241
 Пиксели тоже не квадратные, они –

 158
 00:08:19.241 --> 00:08:23.081
 отсчеты функции, заданной на двумерном пространстве, так что они тоже,

 159
 00:08:23.081 --> 00:08:26.366
 концептуально, – бесконечно маленькие точки.

 160
 00:08:26.366 --> 00:08:28.500
 На практике, это тот еще геморрой – смотреть

 161
 00:08:28.500 --> 00:08:30.804
 или обрабатывать что-либо бесконечно маленькое.

 162
 00:08:30.804 --> 00:08:32.212
 Поэтому и большие квадраты.

 163
 00:08:32.212 --> 00:08:35.966
 Тоже самое и с изображением цифровых сигналов ступеньками.

 164
 00:08:35.966 --> 00:08:37.684
 Так просто удобнее рисовать.

 165
 00:08:37.684 --> 00:08:40.404
 Никаких ступенек на самом деле нет.

 166
 00:08:41.000 --> 00:08:45.000
 ["Глубина дискретизации"]

 167
 00:08:45.652 --> 00:08:48.233
 Когда мы преобразовываем цифру обратно в аналог,

 168
 00:08:48.233 --> 00:08:50.900
 результат <u>такой же</u> плавный независимо от глубины дискретизации:

 169
 00:08:50.900 --> 00:08:53.193
 24 бит или 16 бит…

 170
 00:08:53.193 --> 00:08:54.196
 или 8 бит…

 171
 00:08:54.196 --> 00:08:55.486
 – без разницы.

 172
 00:08:55.486 --> 00:08:57.534
 Значит ли это, что глубина дискретизации

 173
 00:08:57.534 --> 00:08:58.953
 совсем ни на что не влияет?

 174
 00:08:59.245 --> 00:09:00.521
 Конечно нет.

 175
 00:09:02.121 --> 00:09:06.046
 Второй канал здесь – это та же входная синусоида,

 176
 00:09:06.046 --> 00:09:09.086
 но мы квантуем с дизерингом, используя глубину 8 бит.

 177
 00:09:09.086 --> 00:09:14.174
 На осциллографе мы все еще видим плавную синусоиду на 2-м канале.

 178
 00:09:14.174 --> 00:09:18.014
 Присмотритесь внимательнее, и вы также увидите немного больше шума.

 179
 00:09:18.014 --> 00:09:19.305
 Вот, в чем загвоздка.

 180
 00:09:19.305 --> 00:09:21.273
 Если мы посмотрим на спектр сигнала…

 181
 00:09:22.889 --> 00:09:23.732
 Ага!

 182
 00:09:23.732 --> 00:09:26.398
 Наша синусоида все еще там нетронутая,

 183
 00:09:26.398 --> 00:09:28.490
 но уровень шума восьмибитного сигнала

 184
 00:09:28.490 --> 00:09:32.470
 на 2-м канале намного выше!

 185
 00:09:32.948 --> 00:09:36.148
 В этом и заключается отличие между разным числом бит.

 186
 00:09:36.148 --> 00:09:37.434
 Вот и все!

 187
 00:09:37.822 --> 00:09:39.956
 Когда мы оцифровываем сигнал, сперва мы дискретизируем его.

 188
 00:09:39.956 --> 00:09:42.366
 Этап дискретизирования идеален: потерь не происходит.

 189
 00:09:42.366 --> 00:09:45.626
 Но потом мы квантуем его, и квантование добавляет шум.

 190
 00:09:47.827 --> 00:09:50.793
 Число бит определяет то, как много шума добавится,

 191
 00:09:50.793 --> 00:09:52.569
 и потому – степень уровня шума.

 192
 00:10:00.170 --> 00:10:03.646
 Как звучит этот шум квантования после дизеринга?

 193
 00:10:03.646 --> 00:10:06.012
 Давайте послушаем нашу восьмибитную синусоиду.

 194
 00:10:12.521 --> 00:10:15.273
 Наверно, было сложно что-либо услышать, кроме тона.

 195
 00:10:15.273 --> 00:10:18.740
 Давайте послушаем только шум, подавив сперва синусоиду,

 196
 00:10:18.740 --> 00:10:21.683
 а потом сделав все чуть громче, потому что шум тихий.

 197
 00:10:32.009 --> 00:10:35.049
 Те из вас, кто пользовался аналоговыми записывающими устройствами,

 198
 00:10:35.049 --> 00:10:36.670
 могли подумать про себя:

 199
 00:10:36.670 --> 00:10:40.382
 "Боже мой! Это звучит как шипение ленты!"

 200
 00:10:40.382 --> 00:10:41.929
 Что ж, это не просто звучит как шипение магнитной ленты –

 201
 00:10:41.929 --> 00:10:43.433
 оно ведет себя также,

 202
 00:10:43.433 --> 00:10:45.225
 и если мы применим дизеринг с гауссовой функцией плотности распределения вероятности,

 203
 00:10:45.225 --> 00:10:47.646
 то этот шум будет математически эквивалентным во всех отношениях.

 204
 00:10:47.646 --> 00:10:49.225
 Это и <u>есть</u> шипение ленты.

 205
 00:10:49.225 --> 00:10:51.774
 Легко догадаться, что мы можем измерить шипение ленты

 206
 00:10:51.774 --> 00:10:54.196
 и, следовательно, уровень шума магнитной аудиокассеты

 207
 00:10:54.196 --> 00:10:56.233
 в битах, а не в децибелах,

 208
 00:10:56.233 --> 00:10:59.902
 чтобы рассмотреть все сквозь цифровую призму.

 209
 00:10:59.902 --> 00:11:03.028
 Компакт-кассеты…

 210
 00:11:03.028 --> 00:11:05.449
 для тех из вас, кто достаточно взрослый, чтобы помнить их, – 

 211
 00:11:05.449 --> 00:11:09.161
 они могли достигать глубины в 9 бит в идеальных условиях,

 212
 00:11:09.161 --> 00:11:11.209
 хотя как правило – от 5 до 6 бит,

 213
 00:11:11.209 --> 00:11:13.876
 особенно, если это была запись, сделанная на магнитофон.

 214
 00:11:13.876 --> 00:11:19.422
 Так и есть… ваши кассеты с миксами были лишь около 6 бит глубины дискретизации… если вам повезет!

 215
 00:11:19.837 --> 00:11:22.345
 Лучшие профессиональные ленты для катушечного магнитофона,

 216
 00:11:22.345 --> 00:11:24.553
 используемые в студиях, едва могли достигнуть…

 217
 00:11:24.553 --> 00:11:26.473
 как думаете, сколько?

 218
 00:11:26.473 --> 00:11:27.604
 13 бит

 219
 00:11:27.604 --> 00:11:28.980
 <u>с применением</u> улучшенного шумоподавления.

 220
 00:11:28.980 --> 00:11:32.062
 И вот почему видеть "DDD" на компакт-диске

 221
 00:11:32.062 --> 00:11:35.208
 было таким важным, крутым делом.

 222
 00:11:35.800 --> 00:11:39.800
 ["Дизеринг"]

 223
 00:11:40.116 --> 00:11:42.825
 Я постоянно говорю, что при квантовании применяю дизеринг,

 224
 00:11:42.825 --> 00:11:44.734
 что это вообще такое?

 225
 00:11:44.734 --> 00:11:47.284
 А главное, что делает дизеринг?

 226
 00:11:47.284 --> 00:11:49.876
 Простым способом при квантовании сигнала является выбор

 227
 00:11:49.876 --> 00:11:52.329
 ближайшего цифрового значения амплитуды 

 228
 00:11:52.329 --> 00:11:54.377
 к исходной аналоговой амплитуде.

 229
 00:11:54.377 --> 00:11:55.337
 Очевидно, правда?

 230
 00:11:55.337 --> 00:11:57.545
 К несчастью, точный уровень шума, получаемый,

 231
 00:11:57.545 --> 00:11:59.220
 используя такой простой подход при квантовании,

 232
 00:11:59.220 --> 00:12:02.174
 отчасти зависит от входного сигнала,

 233
 00:12:02.174 --> 00:12:04.596
 поэтому мы можем получить или нестабильный,

 234
 00:12:04.596 --> 00:12:06.142
 или вызывающий искажения,

 235
 00:12:06.142 --> 00:12:09.054
 или нежелательный в каком-то другом смысле шум.

 236
 00:12:09.054 --> 00:12:11.764
 Дизеринг – это специально созданный шум, которым

 237
 00:12:11.764 --> 00:12:15.273
 подменяют производимый при квантовании шум.

 238
 00:12:15.273 --> 00:12:18.025
 Дизеринг не заглушает или маскирует шум квантования,

 239
 00:12:18.025 --> 00:12:20.190
 он фактически заменяет его

 240
 00:12:20.190 --> 00:12:22.612
 желаемыми шумовыми характеристиками,

 241
 00:12:22.612 --> 00:12:24.794
 не попадающими под влияние входного сигнала.

 242
 00:12:25.256 --> 00:12:27.081
 Давайте <u>посмотрим</u>, что делает дизеринг.

 243
 00:12:27.081 --> 00:12:30.078
 У генератора сигналов слишком много шумов для данного опыта,

 244
 00:12:30.431 --> 00:12:33.161
 поэтому будем создавать математически

 245
 00:12:33.161 --> 00:12:34.782
 идеальную синусоиду с помощью ThinkPad

 246
 00:12:34.782 --> 00:12:38.205
 и квантовать с глубиной дискретизации 8 бит и дизерингом.

 247
 00:12:39.006 --> 00:12:41.342
 Мы видим хорошую синусоиду на экране временных диаграмм

 248
 00:12:41.342 --> 00:12:43.452
 и на выходе осциллографа

 249
 00:12:44.222 --> 00:12:44.972
 и…

 250
 00:12:46.588 --> 00:12:49.375
 как только аналоговый анализатор спектра оживится…

 251
 00:12:50.713 --> 00:12:53.588
 отчетливый частотный пик с равномерным уровнем шума

 252
 00:12:56.864 --> 00:12:58.611
 на обоих экранах со спектром,

 253
 00:12:58.61 1 --> 00:12:59.646
 как и ранее.

 254
 00:12:59.646 --> 00:13:01.549
 Повторюсь, это с дизерингом.

 255
 00:13:02.196 --> 00:13:04.225
 Теперь я выключаю дизеринг.

 256
 00:13:05.779 --> 00:13:07.913
 Шум квантования, который был распределен дизерингом

 257
 00:13:07.913 --> 00:13:09.577
 в хороший плоский уровень шума,

 258
 00:13:09.577 --> 00:13:12.286
 сплющился в пики гармонического искажения.

 259
 00:13:12.286 --> 00:13:16.030
 Уровень шума ниже, но уровень искажений уже ненулевой,

 260
 00:13:16.030 --> 00:13:19.668
 и пики искажений установились выше, чем шум шум дизеринга.

 261
 00:13:19.668 --> 00:13:22.318
 На восьми битах этот эффект утрирован.

 262
 00:13:22.488 --> 00:13:24.200
 На шестнадцати битах,

 263
 00:13:24.692 --> 00:13:25.929
 даже без дизеринга,

 264
 00:13:25.929 --> 00:13:28.308
 гармонические искажения будут такими низкими,

 265
 00:13:28.308 --> 00:13:30.708
 что их практически не услышать.

 266
 00:13:30.708 --> 00:13:34.581
 Все равно, мы можем использовать дизеринг, чтобы полностью устранить искажения,

 267
 00:13:34.581 --> 00:13:36.489
 если мы так выберем.

 268
 00:13:37.642 --> 00:13:39.273
 Снова выключим дизеринг ненадолго,

 269
 00:13:40.934 --> 00:13:43.444
 и вы заметите, что абсолютный уровень искажений

 270
 00:13:43.444 --> 00:13:47.070
 при квантовании без дизеринга остается примерно постоянным

 271
 00:13:47.070 --> 00:13:49.033
 независимо от амплитуды входного сигнала.

 272
 00:13:49.033 --> 00:13:51.998
 Но когда уровень сигнала опускается немного ниже половины,

 273
 00:13:51.998 --> 00:13:54.036
 все квантуется в ноль.

 274
 00:13:54.036 --> 00:13:54.910
 По сути,

 275
 00:13:54.910 --> 00:13:58.557
 "все квантуется в ноль" просто означает 100% искажение!

 276
 00:13:58.833 --> 00:14:01.588
 Дизеринг тоже устраняет эти искажения.

 277
 00:14:01.588 --> 00:14:03.599
 Мы снова включаем дизеринг и…

 278
 00:14:03.599 --> 00:14:06.377
 наш сигнал появляется на 1/4 бит,

 279
 00:14:06.377 --> 00:14:09.076
 вместе с хорошим плоским уровнем шума.

 280
 00:14:09.630 --> 00:14:11.220
 Уровень шума не обязан быть плоским.

 281
 00:14:11.220 --> 00:14:12.798
 Дизеринг – это шум, выбираемый нами,

 282
 00:14:12.798 --> 00:14:15.006
 так давайте выберем шум настолько безобидный

 283
 00:14:15.006 --> 00:14:17.017
 и труднозаметный, насколько возможно.

 284
 00:14:18.142 --> 00:14:22.484
 Наш слух наиболее чувствителен в промежутке от 2 до 4 кГц,

 285
 00:14:22.484 --> 00:14:25.438
 поэтому здесь фоновый шум будет наиболее заметным.

 286
 00:14:25.438 --> 00:14:29.406
 Мы можем сформировать шум дизеринга подальше от чувствительных частот

 287
 00:14:29.406 --> 00:14:31.241
 туда, где слух менее восприимчив – 

 288
 00:14:31.241 --> 00:14:33.910
 обычно это область высоких частот.

 289
 00:14:34.249 --> 00:14:37.460
 16 бит шум дизеринга, как правило, слишком тихий, чтобы услышать,

 290
 00:14:37.460 --> 00:14:39.668
 но давайте послушаем пример работы нойз-шейпинга,

 291
 00:14:39.668 --> 00:14:42.234
 опять же, с усилением сигнала…

 292
 00:14:56.020 --> 00:14:59.977
 И наконец, общая мощность шума квантования после дизеринга <u>выше</u>,

 293
 00:14:59.977 --> 00:15:04.276
 чем шум квантования без дизеринга, даже если первый звучит тише.

 294
 00:15:04.276 --> 00:15:07.902
 Можете увидеть это на измерителе уровня звука во время тишины.

 295
 00:15:07.902 --> 00:15:10.537
 Но дизеринг не только можно включить или выключить.

 296
 00:15:10.537 --> 00:15:14.712
 Мы можем ослабить мощность дизеринга, балансируя между тишиной шума  

 297
 00:15:14.712 --> 00:15:18.313
 и незначительными искажениями, минимизируя общий эффект.

 298
 00:15:19.605 --> 00:15:22.790
 Также мы будем модулировать входной сигнал вот так:

 299
 00:15:27.098 --> 00:15:30.206
 …чтобы показать, как изменение входного сигнала влияет на шум квантования.

 300
 00:15:30.206 --> 00:15:33.289
 На полной мощности дизеринга, шум единообразен, постоянен

 301
 00:15:33.289 --> 00:15:35.643
 и невыразителен, как мы и ожидали:

 302
 00:15:40.937 --> 00:15:42.772
 При уменьшении мощности дизеринга,

 303
 00:15:42.772 --> 00:15:46.356
 входной сигнал все больше и больше влияет на амплитуду и свойства

 304
 00:15:46.356 --> 00:15:47.977
 шума квантования:

 305
 00:16:09.883 --> 00:16:13.844
 Поведение дизеринга после ноиз-шейпинга схоже,

 306
 00:16:13.844 --> 00:16:16.553
 но ноиз-шейпинг дает еще одно хорошее преимущество.

 307
 00:16:16.553 --> 00:16:18.804
 Короче говоря, он может использовать

 308
 00:16:18.804 --> 00:16:20.937
 слегка меньшую мощность дизеринга прежде, чем входной сигнал

 309
 00:16:20.937 --> 00:16:23.662
 окажет соответствующее влияние на выходной.

 310
 00:16:49.172 --> 00:16:51.508
 Несмотря на все это время, что я потратил на дизеринг,

 311
 00:16:51.508 --> 00:16:53.012
 мы говорим о различиях,

 312
 00:16:53.012 --> 00:16:56.372
 начинающихся на 100 дБ ниже измеряемого диапазона.

 313
 00:16:56.372 --> 00:16:59.806
 Возможно, если бы CD имели 14 бит, как изначально задумывалось,

 314
 00:16:59.806 --> 00:17:01.513
 дизеринг <u>мог бы</u> быть важнее.

 315
 00:17:01.989 --> 00:17:02.644
 Возможно.

 316
 00:17:02.644 --> 00:17:05.438
 С 16 бит, на самом деле, почти без разницы.

 317
 00:17:05.438 --> 00:17:08.019
 Вы можете думать о дизеринге как о страховке,

 318
 00:17:08.019 --> 00:17:11.443
 дающей несколько дополнительных дБ к динамическому диапазону

 319
 00:17:11.443 --> 00:17:12.804
 на всякий случай.

 320
 00:17:12.990 --> 00:17:14.196
 Тем не менее, факт в том, что,

 321
 00:17:14.196 --> 00:17:16.361
 никто не уничтожил великолепную запись,

 322
 00:17:16.361 --> 00:17:19.182
 не воспользовавшись дизерингом при мастеринге звукозаписи.

 323
 00:17:19.600 --> 00:17:23.600
 ["Ограничение полосы частот и синхронизация"]

 324
 00:17:24.414 --> 00:17:25.790
 Мы использовали синусоиды.

 325
 00:17:25.790 --> 00:17:28.254
 Они являются очевидным выбором когда то, что хотим увидеть –

 326
 00:17:28.254 --> 00:17:32.212
 это поведение системы на данной отдельной частоте.

 327
 00:17:32.212 --> 00:17:34.217
 Теперь давайте рассмотрим кое-что посложнее.

 328
 00:17:34.217 --> 00:17:35.923
 Что нам следует ожидать,

 329
 00:17:35.923 --> 00:17:39.671
 когда я изменю входной сигнал на меандр?

 330
 00:17:42.718 --> 00:17:45.921
 Осциллограф на входе выводит наш 1 кГц меандр.

 331
 00:17:45.921 --> 00:17:47.351
 А осциллограф на выходе показывает…

 332
 00:17:48.614 --> 00:17:51.102
 В точности, что и следует.

 333
 00:17:51.102 --> 00:17:53.900
 Что такое меандр на самом деле?

 334
 00:17:54.654 --> 00:17:57.982
 Скажем, это диаграмма сигнала, где есть положительное значение

 335
 00:17:57.982 --> 00:18:00.788
 во время одного полупериода, мгновенно меняющееся

 336
 00:18:00.788 --> 00:18:02.910
 на отрицательное в другом полупериоде.

 337
 00:18:02.910 --> 00:18:05.076
 Но это на самом деле не сообщает ничего полезного о том,

 338
 00:18:05.076 --> 00:18:07.241
 как этот входной сигнал

 339
 00:18:07.241 --> 00:18:09.378
 становится таким на выходе.

 340
 00:18:10.132 --> 00:18:12.713
 Далее, мы помним, что любая волна

 341
 00:18:12.713 --> 00:18:15.508
 также является суммой дискретных частот,

 342
 00:18:15.508 --> 00:18:18.302
 и меандр, в частности, – просто сумма

 343
 00:18:18.302 --> 00:18:19.636
 несущей частоты и

 344
 00:18:19.636 --> 00:18:22.228
 бесконечного числа нечетных гармоник.

 345
 00:18:22.228 --> 00:18:24.597
 Сложите их все, и вы получите меандр.

 346
 00:18:26.398 --> 00:18:27.433
 На первый взгляд,

 347
 00:18:27.433 --> 00:18:29.225
 это тоже не похоже на полезную информацию.

 348
 00:18:29.225 --> 00:18:31.561
 Необходимо сложить бесконечное число гармоник,

 349
 00:18:31.561 --> 00:18:33.108
 чтобы получить ответ.

 350
 00:18:33.108 --> 00:18:35.977
 А, но у нас нет бесконечного числа гармоник.

 351
 00:18:36.960 --> 00:18:39.902
 У нас антиалиасинговый фильтр с крутым спадом переходной полосы,

 352
 00:18:39.902 --> 00:18:42.206
 частота среза которого 20 кГц,

 353
 00:18:42.206 --> 00:18:44.158
 поэтому наш сигнал ограничен по полосе частот,

 354
 00:18:44.158 --> 00:18:46.421
 что означает следующее:

 355
 00:18:52.500 --> 00:18:56.468
 …и это в точности, что мы видим на осциллографе с выхода.

 356
 00:18:56.468 --> 00:18:59.550
 Пульсация, которую вы видите по краям сигнала с ограниченной полосой частот,

 357
 00:18:59.550 --> 00:19:00.926
 называется "явлением Гиббса".

 358
 00:19:00.926 --> 00:19:04.137
 Оно происходит всякий раз, когда вы срезаете часть области частот

 359
 00:19:04.137 --> 00:19:07.006
 в пределах которой сосредоточена энергия сигнала.

 360
 00:19:07.006 --> 00:19:09.854
 Обычно вы услышите эмпирическое правило: чем круче спад переходной полосы,

 361
 00:19:09.854 --> 00:19:11.188
 тем сильнее пульсация.

 362
 00:19:11.188 --> 00:19:12.777
 Что в общем-то правда,

 363
 00:19:12.777 --> 00:19:14.900
 но нужно быть осторожнее в наших представлениях.

 364
 00:19:14.900 --> 00:19:15.774
 Например…

 365
 00:19:15.774 --> 00:19:19.529
 Что по-вашему будет делать наш "крутой" антиалиасинговый

 366
 00:19:19.529 --> 00:19:23.181
 фильтр, если я пропущу через него сигнал дважды?

 367
 00:19:34.136 --> 00:19:37.588
 Помимо добавления нескольких незначительных циклов задержек,

 368
 00:19:37.588 --> 00:19:39.348
 ответ будет…

 369
 00:19:39.348 --> 00:19:40.857
 вообще ничего.

 370
 00:19:41.257 --> 00:19:43.302
 Сигнал уже ограничен по полосе частот.

 371
 00:19:43.656 --> 00:19:46.590
 Повторное ограничение полосы частот ни на что не влияет.

 372
 00:19:46.590 --> 00:19:50.686
 Второй проход не может убрать частоты, которые уже были удалены.

 373
 00:19:52.070 --> 00:19:53.737
 И это важно.

 374
 00:19:53.737 --> 00:19:56.233
 Люди склонны думать о пульсации как о своего рода артефакте,

 375
 00:19:56.233 --> 00:19:59.945
 добавляемом антиалиасинговым и реконструкционным фильтрами,

 376
 00:19:59.945 --> 00:20:01.737
 считая, что пульсация становится хуже

 377
 00:20:01.737 --> 00:20:03.913
 с каждым проходом сигнала через них.

 378
 00:20:03.913 --> 00:20:05.950
 Мы видим, что в данном случае этого не случилось.

 379
 00:20:05.950 --> 00:20:09.492
 Так был ли это на самом деле фильтр, добавивший пульсацию при 1-м проходе?

 380
 00:20:09.492 --> 00:20:10.537
 Нет, не совсем.

 381
 00:20:10.537 --> 00:20:12.126
 Это деликатный момент,

 382
 00:20:12.126 --> 00:20:15.252
 т.к. пульсация при эффекте Гиббса добавляется не фильтрами –

 383
 00:20:15.252 --> 00:20:18.836
 она просто часть того, <u>чем является</u> сигнал с ограниченной полосой частот.

 384
 00:20:18.836 --> 00:20:20.798
 Даже если мы искусственно сгенерируем сигнал,

 385
 00:20:20.798 --> 00:20:23.508
 который выглядит как идеальный цифровой меандр,

 386
 00:20:23.508 --> 00:20:26.206
 его полоса частот все равно ограничена полосой пропускания передающего канала.

 387
 00:20:26.206 --> 00:20:29.140
 Вспомните, что ступенчатое представление кривой неточно.

 388
 00:20:29.140 --> 00:20:32.222
 Что на самом деле есть у нас – это точки отсчета,

 389
 00:20:32.222 --> 00:20:36.148
 и только 1 сигнал с ограниченной полосой частот подходит к этим точкам.

 390
 00:20:36.148 --> 00:20:39.614
 Все что мы сделали, когда рисовали наш идеальный меандр,

 391
 00:20:39.614 --> 00:20:43.198
 это расставили точки отсчета как раз, чтобы сложилось впечатление,

 392
 00:20:43.198 --> 00:20:47.785
 что здесь нет пульсаций, если мы сыграем в "Соедини точки".

 393
 00:20:47.785 --> 00:20:49.449
 Но исходный сигнал с ограниченной полосой частот

 394
 00:20:49.449 --> 00:20:52.742
 вместе с пульсациями все еще там.

 395
 00:20:54.004 --> 00:20:56.542
 И это ведет нас к еще одному важному моменту.

 396
 00:20:56.542 --> 00:20:59.550
 Вы наверняка уже слышали, что точность синхронизации цифрового сигнала

 397
 00:20:59.550 --> 00:21:02.409
 ограничена его частотой дискретизации; другими словами,

 398
 00:21:02.409 --> 00:21:05.140
 якобы цифровые сигналы не могут представлять ничего,

 399
 00:21:05.140 --> 00:21:08.041
 что попадает между точками отсчетов…

 400
 00:21:08.041 --> 00:21:11.422
 имеется в виду, что импульсы или резкие скачки должны быть четко

 401
 00:21:11.422 --> 00:21:14.473
 выравнены с отсчетами, или синхронизация будет утрачена…

 402
 00:21:14.473 --> 00:21:16.219
 и они просто исчезнут.

 403
 00:21:16.711 --> 00:21:20.820
 Теперь мы легко можем увидеть, почему это не так.

 404
 00:21:20.820 --> 00:21:23.742
 Еще раз, наш входной сигнал ограничен по полосе частот.

 405
 00:21:23.742 --> 00:21:26.036
 И цифровой сигнал – это точки отсчета,

 406
 00:21:26.036 --> 00:21:29.340
 не ступеньки, не "Соедини точки".

 407
 00:21:31.572 --> 00:21:34.592
 Мы определенно можем, например,

 408
 00:21:36.777 --> 00:21:39.337
 разместить фронт нашего меандра с ограниченной полосой частот

 409
 00:21:39.337 --> 00:21:42.004
 в любом месте между отсчетами.

 410
 00:21:42.004 --> 00:21:44.354
 Меандр отлично изображается

 411
 00:21:47.508 --> 00:21:50.218
 и отлично восстанавливается.

 412
 00:21:56.000 --> 00:22:02.000
 ["Эпилог"]

 413
 00:22:04.620 --> 00:22:06.526
 Как и в предыдущей части,

 414
 00:22:06.526 --> 00:22:08.393
 мы охватили широкий круг тем,

 415
 00:22:08.393 --> 00:22:10.868
 и при этом лишь едва коснулись каждой из них.

 416
 00:22:10.868 --> 00:22:13.620
 Если уж на то пошло, то в этот раз у меня больше грехов упущения…

 417
 00:22:13.620 --> 00:22:16.286
 но это хороший момент все завершить.

 418
 00:22:16.286 --> 00:22:17.833
 Или, может, хорошая отправная точка.

 419
 00:22:17.833 --> 00:22:18.708
 Пробуйте копнуть глубже.

 420
 00:22:18.708 --> 00:22:19.710
 Экспериментируйте.

 421
 00:22:19.710 --> 00:22:21.374
 Я со всей тщательностью подбирал опыты,

 422
 00:22:21.374 --> 00:22:23.668
 чтобы они были простыми и красноречивыми.

 423
 00:22:23.668 --> 00:22:26.217
 Вы можете воспроизвести каждый из них самостоятельно, если хотите.

 424
 00:22:26.217 --> 00:22:28.766
 Только давайте признаемся, что иногда мы узнаем больше

 425
 00:22:28.766 --> 00:22:30.516
 о модной игрушке, разобрав ее до основания

 426
 00:22:30.516 --> 00:22:32.553
 и изучая все выпавшие кусочки.

 427
 00:22:32.553 --> 00:22:35.230
 И это нормально – мы инженеры.

 428
 00:22:35.230 --> 00:22:36.350
 Поиграйтесь с демо-параметрами,

 429
 00:22:36.350 --> 00:22:37.972
 хакните код,

 430
 00:22:37.972 --> 00:22:39.774
 проведите другие опыты.

 431
 00:22:39.774 --> 00:22:40.692
 Исходный код для всего,

 432
 00:22:40.692 --> 00:22:42.398
 включая небольшое кнопочное демо-приложение,

 433
 00:22:42.398 --> 00:22:44.361
 выложен на Xiph.Org.

 434
 00:22:44.361 --> 00:22:45.940
 В ходе экспериментов,

 435
 00:22:45.940 --> 00:22:47.401
 вы, скорее всего, столкнетесь с чем-то,

 436
 00:22:47.401 --> 00:22:49.950
 чего не ожидали и не можете объяснить.

 437
 00:22:49.950 --> 00:22:51.198
 Не переживайте!

 438
 00:22:51.198 --> 00:22:54.537
 Без шуток, Википедия потрясающе подходит

 439
 00:22:54.537 --> 00:22:56.788
 как раз для подобных неформальных исследований.

 440
 00:22:56.788 --> 00:22:59.956
 Если вы действительно серьезно намерены разобраться в сигналах,

 441
 00:22:59.956 --> 00:23:03.337
 у некоторых университетов есть онлайн материалы продвинутого уровня,

 442
 00:23:03.337 --> 00:23:07.380
 например курсы 6.003 и 6.007 "Signals and Systems"

 443
 00:23:07.380 --> 00:23:08.798
 на MIT OpenCourseWare.

 444
 00:23:08.798 --> 00:23:11.593
 И, конечно же, сообщество Xiph.Org всегда доступно вам.

 445
 00:23:12.792 --> 00:23:13.929
 Копать глубже или нет,

 446
 00:23:13.929 --> 00:23:14.974
 у меня кончился кофе,

 447
 00:23:14.974 --> 00:23:16.436
 так что до следующих встреч,

 448
 00:23:16.436 --> 00:23:19.316
 веселого хакинга!

 449
 00:23:20.000 --> 00:23:23.000
 [Титры]
diff --git a/02-Digital_Show_and_Tell.ru.vtt b/02-Digital_Show_and_Tell.ru.vtt
 WEBVTT

 1
 00:00:08.252 --> 00:00:11.550
 Привет! Я Монти Монтгомери из Red Hat и Xiph.Org.

 2
 00:00:11.550 --> 00:00:18.430
 Несколько месяцев назад я написал статью о цифровом аудио и почему нет смысла в загрузке музыки 24 бит / 192 кГц.

 3
 00:00:18.430 --> 00:00:23.433
 В той статье я почти вскользь отметил, что форма цифровой волны не ступенчатая,

 4
 00:00:23.433 --> 00:00:28.680
 и что вы точно не получите ровные ступеньки, когда преобразуете из цифры обратно в аналог.

 5
 00:00:29.865 --> 00:00:33.865
 Из всего, что было в статье, <b>это</b> было темой номер один, о чем люди писали.

 6
 00:00:33.865 --> 00:00:37.221
 На самом деле, более половины всех полученных писем составили вопросы и комментарии

 7
 00:00:37.221 --> 00:00:39.663
 об основах поведения цифрового сигнала.

 8
 00:00:39.894 --> 00:00:45.285
 Поскольку многим интересно, давайте уделим некоторое время, чтобы поиграться с <u>простым</u> цифровым сигналом.

 9
 00:00:49.747 --> 00:00:51.006
 Вспомним на секунду,

 10
 00:00:51.006 --> 00:00:54.089
 что мы без понятия, как на самом деле цифровой сигнал ведет себя.

 11
 00:00:54.734 --> 00:00:56.841
 В этом случае нам также нет никакого смысла

 12
 00:00:56.841 --> 00:00:59.049
 использовать цифровое испытательное оборудование.

 13
 00:00:59.049 --> 00:01:00.937
 К счастью, для данной работы где-то здесь

 14
 00:01:00.937 --> 00:01:04.020
 все еще имеется куча аналогового лабораторного оборудования.

 15
 00:01:04.020 --> 00:01:05.972
 Во-первых, нам нужен генератор сигналов,

 16
 00:01:05.972 --> 00:01:08.190
 чтобы обеспечить нас аналоговыми входными сигналами.

 17
 00:01:08.190 --> 00:01:12.692
 В данном случае это HP3325 1978 года.

 18
 00:01:12.692 --> 00:01:14.153
 Это по-прежнему довольно хороший генератор,

 19
 00:01:14.153 --> 00:01:15.614
 так что если вас не заботят габариты,

 20
 00:01:15.614 --> 00:01:16.532
 вес,

 21
 00:01:16.532 --> 00:01:17.577
 потребление электроэнергии

 22
 00:01:17.577 --> 00:01:18.910
 и шумный вентилятор,

 23
 00:01:18.910 --> 00:01:20.329
 то можете найти их на eBay.

 24
 00:01:20.329 --> 00:01:23.863
 Иногда они чуть дороже, чем вы заплатите за доставку.

 25
 00:01:24.617 --> 00:01:28.500
 Затем, мы будем наблюдать за диаграммами аналоговых сигналов на аналоговых осциллографах,

 26
 00:01:28.500 --> 00:01:31.550
 таких как этот Tektronix 2246 из середины 90х –

 27
 00:01:31.550 --> 00:01:34.761
 один из последних и самых лучших аналоговых осциллографов.

 28
 00:01:34.761 --> 00:01:36.807
 В каждой домашней лаборатории по-хорошему должен быть такой.

 29
 00:01:37.716 --> 00:01:40.852
 Наконец, изучим спектр частот наших сигналов,

 30
 00:01:40.852 --> 00:01:43.177
 используя аналоговый анализатор спектра.

 31
 00:01:43.177 --> 00:01:47.732
 Это HP3585 из той же линейки, что и генератор сигналов.

 32
 00:01:47.732 --> 00:01:50.615
 Как и другое имеющееся оборудование, он оснащен

 33
 00:01:50.615 --> 00:01:52.905
 элементарным и нереально большим микроконтроллером,

 34
 00:01:52.905 --> 00:01:56.276
 но сигнал на всем пути от входа до того, что вы видите на экране,

 35
 00:01:56.276 --> 00:01:58.537
 полностью аналоговый.

 36
 00:01:58.537 --> 00:02:00.329
 Все это оборудование старинное,

 37
 00:02:00.329 --> 00:02:01.993
 но, кроме внушительного веса,

 38
 00:02:01.993 --> 00:02:03.844
 характеристики все еще достаточно хорошие.

 39
 00:02:04.536 --> 00:02:06.868
 В данный момент наш генератор сигналов вырабатывает

 40
 00:02:06.868 --> 00:02:12.829
 хорошую 1 кГц синусоиду со среднеквадратичным значением (СКЗ) напряжения 1 В.

 41
 00:02:13.414 --> 00:02:15.220
 Мы видим синусоидальную волну на осциллографе,

 42
 00:02:15.220 --> 00:02:21.428
 можем убедиться, что действительно 1 кГц и имеет СКЗ напряжения 1 В,

 43
 00:02:21.428 --> 00:02:24.108
 то есть волна с размахом 2,8 В,

 44
 00:02:24.308 --> 00:02:27.561
 и что она также соответствует измерениям спектрального анализатора.

 45
 00:02:27.561 --> 00:02:30.644
 Анализатор еще показывает белый шум низкой амплитуды

 46
 00:02:30.644 --> 00:02:32.190
 и небольшое гармоническое искажение

 47
 00:02:32.190 --> 00:02:36.649
 с наибольшим пиком около 70 дБ ниже несущей частоты.

 48
 00:02:36.649 --> 00:02:38.612
 Хоть это и совсем не важно в наших опытах,

 49
 00:02:38.612 --> 00:02:40.574
 но я хотел отметить это сейчас

 50
 00:02:40.574 --> 00:02:42.452
 на случай, если вы не замечали это ранее.

 51
 00:02:44.036 --> 00:02:47.142
 Сейчас мы понизим частоту дискретизации до средних значений.

 52
 00:02:48.557 --> 00:02:51.024
 Для преобразования мы будем использовать непримечательное

 53
 00:02:51.024 --> 00:02:53.374
 потребительское аудиоустройство eMagic USB1.

 54
 00:02:53.374 --> 00:02:55.337
 Оно уже тоже старше десяти лет

 55
 00:02:55.337 --> 00:02:57.257
 и продолжает устаревать.

 56
 00:02:57.964 --> 00:03:02.676
 Современный конвертер без труда может иметь характеристики на порядок выше.

 57
 00:03:03.076 --> 00:03:07.924
 Неравномерность АЧХ, нелинейность, джиттер, шумовые характеристики и прочее…

 58
 00:03:07.924 --> 00:03:09.353
 что вы могли и не заметить.

 59
 00:03:09.353 --> 00:03:11.604
 То, что мы можем измерить улучшение,

 60
 00:03:11.604 --> 00:03:13.609
 не значит, что мы можем это услышать,

 61
 00:03:13.609 --> 00:03:16.404
 и даже эти старые коробочки потребительского уровня

 62
 00:03:16.404 --> 00:03:18.643
 уже тогда были на грани прозрачности [Transparency (data compression)]

 63
 00:03:20.244 --> 00:03:22.825
 eMagic подключен к моему ThinkPad,

 64
 00:03:22.825 --> 00:03:26.121
 который отображает диаграмму цифрового сигнала и спектр для сравнения, 

 65
 00:03:26.121 --> 00:03:28.788
 затем ThinkPad отправляет цифровой сигнал обратно в

 66
 00:03:28.788 --> 00:03:30.921
 eMagic для преобразования обратно в аналоговый сигнал

 67
 00:03:30.921 --> 00:03:33.332
 и наблюдения на экране осциллографа.

 68
 00:03:33.332 --> 00:03:35.582
 Со входа на выход. Слева направо.

 69
 00:03:40.211 --> 00:03:41.214
 Все, пора начинать.

 70
 00:03:41.214 --> 00:03:43.924
 Начнем с преобразования аналогового сигнала в цифровой,

 71
 00:03:43.924 --> 00:03:47.347
 a потом – снова обратно в аналоговый, и больше ничего.

 72
 00:03:47.347 --> 00:03:49.268
 Генератор сигналов настроен на создание

 73
 00:03:49.268 --> 00:03:52.649
 синусоиды с частотой 1 кГц, как и прежде.

 74
 00:03:52.649 --> 00:03:57.428
 Со входа мы можем видеть нашу аналоговую синусоиду на осциллографе.

 75
 00:03:57.428 --> 00:04:01.694
 Мы оцифровываем сигнал с помощью ИКМ (16 бит, 44,1 кГц) –

 76
 00:04:01.694 --> 00:04:03.828
 так же, как звук на CD.

 77
 00:04:03.828 --> 00:04:07.156
 Спектр оцифрованного сигнала соответствует тому, что мы видели ранее. И-и…

 78
 00:04:07.156 --> 00:04:10.836
 вот что мы видим на аналоговом анализаторе спектра,

 79
 00:04:10.836 --> 00:04:15.154
 не считая чуть прибавившихся шумов из-за входа с высоким сопротивлением.

 80
 00:04:15.154 --> 00:04:15.956
 В то же время

 81
 00:04:18.248 --> 00:04:20.798
 окно вывода диаграмм показывает нашу оцифрованную синусоиду

 82
 00:04:20.798 --> 00:04:23.966
 в ступенчатом виде – по ступеньке на отсчет.

 83
 00:04:23.966 --> 00:04:26.388
 И, когда мы смотрим на выходной сигнал,

 84
 00:04:26.388 --> 00:04:29.054
 т.е. сконвертированный в аналоговый из цифрового, мы видим…

 85
 00:04:29.054 --> 00:04:32.052
 Он в точности такой же, как первоначальная синусоида.

 86
 00:04:32.052 --> 00:04:33.483
 Никаких ступенек.

 87
 00:04:33.914 --> 00:04:37.193
 Ладно, все же 1 кГц и правда низкая частота.

 88
 00:04:37.193 --> 00:04:40.633
 Может ступеньки просто сложно разглядеть или они были сглажены?

 89
 00:04:40.739 --> 00:04:49.492
 Логично. Давайте поднимем частоту примерно до частоты Найквиста. Скажем, до 15 кГц.

 90
 00:04:49.492 --> 00:04:53.545
 Теперь синусоида описывается менее чем тремя отсчетами за период, и…

 91
 00:04:53.545 --> 00:04:55.838
 цифровая диаграмма выглядит довольно ужасно.

 92
 00:04:55.838 --> 00:04:59.798
 Что ж, внешность обманчива. Аналоговый выход…

 93
 00:05:01.876 --> 00:05:06.033
 по-прежнему идеальная синусоида, точь-в-точь как исходная.

 94
 00:05:06.633 --> 00:05:09.228
 Продолжим поднимать частоту.

 95
 00:05:17.353 --> 00:05:20.151
 16 кГц

 96
 00:05:23.198 --> 00:05:25.616
 17 кГц

 97
 00:05:28.201 --> 00:05:29.945
 18 кГц

 98
 00:05:33.822 --> 00:05:35.548
 19 кГц

 99
 00:05:40.457 --> 00:05:42.465
 20 кГц

 100
 00:05:49.097 --> 00:05:52.350
 Добро пожаловать в верхние пределы слышимости человеком.

 101
 00:05:52.350 --> 00:05:54.377
 Выходная диаграмма сигнала по-прежнему отличная.

 102
 00:05:54.377 --> 00:05:58.025
 Ни рванных краев, ни завалов, ни ступенек.

 103
 00:05:58.025 --> 00:06:01.342
 Так куда пропали ступеньки?

 104
 00:06:01.342 --> 00:06:03.198
 Не отвечайте, это каверзный вопрос.

 105
 00:06:03.198 --> 00:06:04.318
 Ступенек там никогда не было.

 106
 00:06:04.318 --> 00:06:06.652
 Изображение цифровой диаграммы сигнала ступеньками

 107
 00:06:08.712 --> 00:06:10.772
 было изначально неправильным.

 108
 00:06:10.942 --> 00:06:11.998
 Почему?

 109
 00:06:11.998 --> 00:06:14.366
 Ступенчатая кривая – это график непрерывной функции.

 110
 00:06:14.366 --> 00:06:16.201
 Она угловатая и кусочно-постоянная,

 111
 00:06:16.201 --> 00:06:19.700
 но имеет определенное значение в каждый момент времени. 

 112
 00:06:19.700 --> 00:06:22.004
 Дискретизированный сигнал совершенно другой.

 113
 00:06:22.004 --> 00:06:23.337
 Он дискретен по времени

 114
 00:06:23.337 --> 00:06:27.337
 и определен только в каждой точке отсчета,

 115
 00:06:27.337 --> 00:06:32.596
 и не определен, т.е. вообще нет значений, всюду между отсчетами.

 116
 00:06:32.596 --> 00:06:36.666
 Дискретный сигнал следует изображать дискретными отсчетами.

 117
 00:06:40.020 --> 00:06:42.974
 Непрерывный аналоговый коллега цифрового сигнала

 118
 00:06:42.974 --> 00:06:45.364
 плавно проходит каждую точку отсчета,

 119
 00:06:45.364 --> 00:06:50.153
 и это также справедливо как для высоких частот, так и для низких.

 120
 00:06:50.153 --> 00:06:53.033
 Далее, интересная и совсем не очевидная часть:

 121
 00:06:53.033 --> 00:06:55.454
 существует только один сигнал с ограниченной полосой частот, проходящий

 122
 00:06:55.454 --> 00:06:57.417
 строго через каждую точку отсчета.

 123
 00:06:57.417 --> 00:06:58.708
 Это единственное решение.

 124
 00:06:58.708 --> 00:07:01.246
 Так что если вы дискретизируете сигнал с ограниченной полосой частот

 125
 00:07:01.246 --> 00:07:02.612
 и потом конвертируете обратно,

 126
 00:07:02.612 --> 00:07:06.462
 то исходный входной сигнал – единственный возможный сигнал на выходе.

 127
 00:07:06.462 --> 00:07:07.838
 И прежде, чем вы скажете:

 128
 00:07:07.838 --> 00:07:11.721
 "Ну, я могу нарисовать другой сигнал, проходящий через эти точки".

 129
 00:07:11.721 --> 00:07:14.283
 Хорошо, да, вы можете, но…

 130
 00:07:17.268 --> 00:07:20.521
 Даже если сигнал отличается едва заметно от исходного,

 131
 00:07:20.521 --> 00:07:24.905
 то он содержит частотную составляющую на частоте Найквиста или за ее пределом,

 132
 00:07:24.905 --> 00:07:26.185
 нарушая требование ограниченности полосы частот,

 133
 00:07:26.185 --> 00:07:28.358
 что делает такой сигнал неподходящим решением. 

 134
 00:07:28.574 --> 00:07:30.036
 Как же так все сбились с толку

 135
 00:07:30.036 --> 00:07:32.702
 и начали думать о цифровом сигнале как о ступенчатой кривой?

 136
 00:07:32.702 --> 00:07:34.900
 Я могу придумать две хорошие причины.

 137
 00:07:34.900 --> 00:07:37.956
 Первая – довольно просто представить дискретизированный сигнал

 138
 00:07:37.972 --> 00:07:39.294
 в виде ступенчатой кривой.

 139
 00:07:39.294 --> 00:07:42.409
 Просто расширьте значение каждой точки отсчета вперед до следующего отсчета.

 140
 00:07:42.409 --> 00:07:44.414
 Это называется экстраполяцией нулевого порядка

 141
 00:07:44.414 --> 00:07:47.913
 и является важной частью в работе некоторых цифро-аналоговых преобразователей,

 142
 00:07:47.913 --> 00:07:50.089
 особенно самых простых из них.

 143
 00:07:50.089 --> 00:07:55.591
 Так что любой кто ищет о цифро-аналоговом преобразовании,

 144
 00:07:55.592 --> 00:07:59.550
 вероятно, увидит где-нибудь диаграмму со ступенчатой кривой,

 145
 00:07:59.550 --> 00:08:01.982
 но это не законченное преобразование,

 146
 00:08:01.982 --> 00:08:04.250
 и это не сигнал, получаемый на выходе.

 147
 00:08:04.944 --> 00:08:05.684
 Вторая причина –

 148
 00:08:05.684 --> 00:08:07.529
 и это, видимо, более вероятная причина –

 149
 00:08:07.529 --> 00:08:09.449
 инженеры, которые вроде как знают лучше,

 150
 00:08:09.449 --> 00:08:10.441
 типа меня,

 151
 00:08:10.441 --> 00:08:13.193
 рисуют ступенчатые кривые, пусть даже эти графики технически неправильны.

 152
 00:08:13.193 --> 00:08:15.571
 Это что-то типа одномерной версии 

 153
 00:08:15.571 --> 00:08:17.395
 растолстевших бит в цифровых редакторах.

 154
 00:08:17.395 --> 00:08:19.241
 Пиксели тоже не квадратные, они –

 155
 00:08:19.241 --> 00:08:23.081
 отсчеты функции, заданной на двумерном пространстве, так что они тоже,

 156
 00:08:23.081 --> 00:08:26.366
 концептуально, – бесконечно маленькие точки.

 157
 00:08:26.366 --> 00:08:28.500
 На практике, это тот еще геморрой – смотреть

 158
 00:08:28.500 --> 00:08:30.804
 или обрабатывать что-либо бесконечно маленькое.

 159
 00:08:30.804 --> 00:08:32.212
 Поэтому и большие квадраты.

 160
 00:08:32.212 --> 00:08:35.966
 Тоже самое и с изображением цифровых сигналов ступеньками.

 161
 00:08:35.966 --> 00:08:37.684
 Так просто удобнее рисовать.

 162
 00:08:37.684 --> 00:08:40.404
 Никаких ступенек на самом деле нет.

 163
 00:08:45.652 --> 00:08:48.233
 Когда мы преобразовываем цифру обратно в аналог,

 164
 00:08:48.233 --> 00:08:50.900
 результат <u>такой же</u> плавный независимо от глубины дискретизации:

 165
 00:08:50.900 --> 00:08:53.193
 24 бит или 16 бит…

 166
 00:08:53.193 --> 00:08:54.196
 или 8 бит…

 167
 00:08:54.196 --> 00:08:55.486
 – без разницы.

 168
 00:08:55.486 --> 00:08:57.534
 Значит ли это, что глубина дискретизации

 169
 00:08:57.534 --> 00:08:58.953
 совсем ни на что не влияет?

 170
 00:08:59.245 --> 00:09:00.521
 Конечно нет.

 171
 00:09:02.121 --> 00:09:06.046
 Второй канал здесь – это та же входная синусоида,

 172
 00:09:06.046 --> 00:09:09.086
 но мы квантуем с дизерингом, используя глубину 8 бит.

 173
 00:09:09.086 --> 00:09:14.174
 На осциллографе мы все еще видим плавную синусоиду на 2-м канале.

 174
 00:09:14.174 --> 00:09:18.014
 Присмотритесь внимательнее, и вы также увидите немного больше шума.

 175
 00:09:18.014 --> 00:09:19.305
 Вот, в чем загвоздка.

 176
 00:09:19.305 --> 00:09:21.273
 Если мы посмотрим на спектр сигнала…

 177
 00:09:22.889 --> 00:09:23.732
 Ага!

 178
 00:09:23.732 --> 00:09:26.398
 Наша синусоида все еще там нетронутая,

 179
 00:09:26.398 --> 00:09:28.490
 но уровень шума восьмибитного сигнала

 180
 00:09:28.490 --> 00:09:32.470
 на 2-м канале намного выше!

 181
 00:09:32.948 --> 00:09:36.148
 В этом и заключается отличие между разным числом бит.

 182
 00:09:36.148 --> 00:09:37.434
 Вот и все!

 183
 00:09:37.822 --> 00:09:39.956
 Когда мы оцифровываем сигнал, сперва мы дискретизируем его.

 184
 00:09:39.956 --> 00:09:42.366
 Этап дискретизирования идеален: потерь не происходит.

 185
 00:09:42.366 --> 00:09:45.626
 Но потом мы квантуем его, и квантование добавляет шум.

 186
 00:09:47.827 --> 00:09:50.793
 Число бит определяет то, как много шума добавится,

 187
 00:09:50.793 --> 00:09:52.569
 и потому – степень уровня шума.

 188
 00:10:00.170 --> 00:10:03.646
 Как звучит этот шум квантования после дизеринга?

 189
 00:10:03.646 --> 00:10:06.012
 Давайте послушаем нашу восьмибитную синусоиду.

 190
 00:10:12.521 --> 00:10:15.273
 Наверно, было сложно что-либо услышать, кроме тона.

 191
 00:10:15.273 --> 00:10:18.740
 Давайте послушаем только шум, подавив сперва синусоиду,

 192
 00:10:18.740 --> 00:10:21.683
 а потом сделав все чуть громче, потому что шум тихий.

 193
 00:10:32.009 --> 00:10:35.049
 Те из вас, кто пользовался аналоговыми записывающими устройствами,

 194
 00:10:35.049 --> 00:10:36.670
 могли подумать про себя:

 195
 00:10:36.670 --> 00:10:40.382
 "Боже мой! Это звучит как шипение ленты!"

 196
 00:10:40.382 --> 00:10:41.929
 Что ж, это не просто звучит как шипение магнитной ленты –

 197
 00:10:41.929 --> 00:10:43.433
 оно ведет себя также,

 198
 00:10:43.433 --> 00:10:45.225
 и если мы применим дизеринг с гауссовой функцией плотности распределения вероятности,

 199
 00:10:45.225 --> 00:10:47.646
 то этот шум будет математически эквивалентным во всех отношениях.

 200
 00:10:47.646 --> 00:10:49.225
 Это и <u>есть</u> шипение ленты.

 201
 00:10:49.225 --> 00:10:51.774
 Легко догадаться, что мы можем измерить шипение ленты

 202
 00:10:51.774 --> 00:10:54.196
 и, следовательно, уровень шума магнитной аудиокассеты

 203
 00:10:54.196 --> 00:10:56.233
 в битах, а не в децибелах,

 204
 00:10:56.233 --> 00:10:59.902
 чтобы рассмотреть все сквозь цифровую призму.

 205
 00:10:59.902 --> 00:11:03.028
 Компакт-кассеты…

 206
 00:11:03.028 --> 00:11:05.449
 для тех из вас, кто достаточно взрослый, чтобы помнить их, – 

 207
 00:11:05.449 --> 00:11:09.161
 они могли достигать глубины в 9 бит в идеальных условиях,

 208
 00:11:09.161 --> 00:11:11.209
 хотя как правило – от 5 до 6 бит,

 209
 00:11:11.209 --> 00:11:13.876
 особенно, если это была запись, сделанная на магнитофон.

 210
 00:11:13.876 --> 00:11:19.422
 Так и есть… ваши кассеты с миксами были лишь около 6 бит глубины дискретизации… если вам повезет!

 211
 00:11:19.837 --> 00:11:22.345
 Лучшие профессиональные ленты для катушечного магнитофона,

 212
 00:11:22.345 --> 00:11:24.553
 используемые в студиях, едва могли достигнуть…

 213
 00:11:24.553 --> 00:11:26.473
 как думаете, сколько?

 214
 00:11:26.473 --> 00:11:27.604
 13 бит

 215
 00:11:27.604 --> 00:11:28.980
 <u>с применением</u> улучшенного шумоподавления.

 216
 00:11:28.980 --> 00:11:32.062
 И вот почему видеть "DDD" на компакт-диске

 217
 00:11:32.062 --> 00:11:35.208
 было таким важным, крутым делом.

 218
 00:11:40.116 --> 00:11:42.825
 Я постоянно говорю, что при квантовании применяю дизеринг,

 219
 00:11:42.825 --> 00:11:44.734
 что это вообще такое?

 220
 00:11:44.734 --> 00:11:47.284
 А главное, что делает дизеринг?

 221
 00:11:47.284 --> 00:11:49.876
 Простым способом при квантовании сигнала является выбор

 222
 00:11:49.876 --> 00:11:52.329
 ближайшего цифрового значения амплитуды 

 223
 00:11:52.329 --> 00:11:54.377
 к исходной аналоговой амплитуде.

 224
 00:11:54.377 --> 00:11:55.337
 Очевидно, правда?

 225
 00:11:55.337 --> 00:11:57.545
 К несчастью, точный уровень шума, получаемый,

 226
 00:11:57.545 --> 00:11:59.220
 используя такой простой подход при квантовании,

 227
 00:11:59.220 --> 00:12:02.174
 отчасти зависит от входного сигнала,

 228
 00:12:02.174 --> 00:12:04.596
 поэтому мы можем получить или нестабильный,

 229
 00:12:04.596 --> 00:12:06.142
 или вызывающий искажения,

 230
 00:12:06.142 --> 00:12:09.054
 или нежелательный в каком-то другом смысле шум.

 231
 00:12:09.054 --> 00:12:11.764
 Дизеринг – это специально созданный шум, которым

 232
 00:12:11.764 --> 00:12:15.273
 подменяют производимый при квантовании шум.

 233
 00:12:15.273 --> 00:12:18.025
 Дизеринг не заглушает или маскирует шум квантования,

 234
 00:12:18.025 --> 00:12:20.190
 он фактически заменяет его

 235
 00:12:20.190 --> 00:12:22.612
 желаемыми шумовыми характеристиками,

 236
 00:12:22.612 --> 00:12:24.794
 не попадающими под влияние входного сигнала.

 237
 00:12:25.256 --> 00:12:27.081
 Давайте <u>посмотрим</u>, что делает дизеринг.

 238
 00:12:27.081 --> 00:12:30.078
 У генератора сигналов слишком много шумов для данного опыта,

 239
 00:12:30.431 --> 00:12:33.161
 поэтому будем создавать математически

 240
 00:12:33.161 --> 00:12:34.782
 идеальную синусоиду с помощью ThinkPad

 241
 00:12:34.782 --> 00:12:38.205
 и квантовать с глубиной дискретизации 8 бит и дизерингом.

 242
 00:12:39.006 --> 00:12:41.342
 Мы видим хорошую синусоиду на экране временных диаграмм

 243
 00:12:41.342 --> 00:12:43.452
 и на выходе осциллографа

 244
 00:12:44.222 --> 00:12:44.972
 и…

 245
 00:12:46.588 --> 00:12:49.375
 как только аналоговый анализатор спектра оживится…

 246
 00:12:50.713 --> 00:12:53.588
 отчетливый частотный пик с равномерным уровнем шума

 247
 00:12:56.864 --> 00:12:58.611
 на обоих экранах со спектром,

 248
 00:12:58.61 1 --> 00:12:59.646
 как и ранее.

 249
 00:12:59.646 --> 00:13:01.549
 Повторюсь, это с дизерингом.

 250
 00:13:02.196 --> 00:13:04.225
 Теперь я выключаю дизеринг.

 251
 00:13:05.779 --> 00:13:07.913
 Шум квантования, который был распределен дизерингом

 252
 00:13:07.913 --> 00:13:09.577
 в хороший плоский уровень шума,

 253
 00:13:09.577 --> 00:13:12.286
 сплющился в пики гармонического искажения.

 254
 00:13:12.286 --> 00:13:16.030
 Уровень шума ниже, но уровень искажений уже ненулевой,

 255
 00:13:16.030 --> 00:13:19.668
 и пики искажений установились выше, чем шум шум дизеринга.

 256
 00:13:19.668 --> 00:13:22.318
 На восьми битах этот эффект утрирован.

 257
 00:13:22.488 --> 00:13:24.200
 На шестнадцати битах,

 258
 00:13:24.692 --> 00:13:25.929
 даже без дизеринга,

 259
 00:13:25.929 --> 00:13:28.308
 гармонические искажения будут такими низкими,

 260
 00:13:28.308 --> 00:13:30.708
 что их практически не услышать.

 261
 00:13:30.708 --> 00:13:34.581
 Все равно, мы можем использовать дизеринг, чтобы полностью устранить искажения,

 262
 00:13:34.581 --> 00:13:36.489
 если мы так выберем.

 263
 00:13:37.642 --> 00:13:39.273
 Снова выключим дизеринг ненадолго,

 264
 00:13:40.934 --> 00:13:43.444
 и вы заметите, что абсолютный уровень искажений

 265
 00:13:43.444 --> 00:13:47.070
 при квантовании без дизеринга остается примерно постоянным

 266
 00:13:47.070 --> 00:13:49.033
 независимо от амплитуды входного сигнала.

 267
 00:13:49.033 --> 00:13:51.998
 Но когда уровень сигнала опускается немного ниже половины,

 268
 00:13:51.998 --> 00:13:54.036
 все квантуется в ноль.

 269
 00:13:54.036 --> 00:13:54.910
 По сути,

 270
 00:13:54.910 --> 00:13:58.557
 "все квантуется в ноль" просто означает 100% искажение!

 271
 00:13:58.833 --> 00:14:01.588
 Дизеринг тоже устраняет эти искажения.

 272
 00:14:01.588 --> 00:14:03.599
 Мы снова включаем дизеринг и…

 273
 00:14:03.599 --> 00:14:06.377
 наш сигнал появляется на 1/4 бит,

 274
 00:14:06.377 --> 00:14:09.076
 вместе с хорошим плоским уровнем шума.

 275
 00:14:09.630 --> 00:14:11.220
 Уровень шума не обязан быть плоским.

 276
 00:14:11.220 --> 00:14:12.798
 Дизеринг – это шум, выбираемый нами,

 277
 00:14:12.798 --> 00:14:15.006
 так давайте выберем шум настолько безобидный

 278
 00:14:15.006 --> 00:14:17.017
 и труднозаметный, насколько возможно.

 279
 00:14:18.142 --> 00:14:22.484
 Наш слух наиболее чувствителен в промежутке от 2 до 4 кГц,

 280
 00:14:22.484 --> 00:14:25.438
 поэтому здесь фоновый шум будет наиболее заметным.

 281
 00:14:25.438 --> 00:14:29.406
 Мы можем сформировать шум дизеринга подальше от чувствительных частот

 282
 00:14:29.406 --> 00:14:31.241
 туда, где слух менее восприимчив – 

 283
 00:14:31.241 --> 00:14:33.910
 обычно это область высоких частот.

 284
 00:14:34.249 --> 00:14:37.460
 16 бит шум дизеринга, как правило, слишком тихий, чтобы услышать,

 285
 00:14:37.460 --> 00:14:39.668
 но давайте послушаем пример работы нойз-шейпинга,

 286
 00:14:39.668 --> 00:14:42.234
 опять же, с усилением сигнала…

 287
 00:14:56.020 --> 00:14:59.977
 И наконец, общая мощность шума квантования после дизеринга <u>выше</u>,

 288
 00:14:59.977 --> 00:15:04.276
 чем шум квантования без дизеринга, даже если первый звучит тише.

 289
 00:15:04.276 --> 00:15:07.902
 Можете увидеть это на измерителе уровня звука во время тишины.

 290
 00:15:07.902 --> 00:15:10.537
 Но дизеринг не только можно включить или выключить.

 291
 00:15:10.537 --> 00:15:14.712
 Мы можем ослабить мощность дизеринга, балансируя между тишиной шума  

 292
 00:15:14.712 --> 00:15:18.313
 и незначительными искажениями, минимизируя общий эффект.

 293
 00:15:19.605 --> 00:15:22.790
 Также мы будем модулировать входной сигнал вот так:

 294
 00:15:27.098 --> 00:15:30.206
 …чтобы показать, как изменение входного сигнала влияет на шум квантования.

 295
 00:15:30.206 --> 00:15:33.289
 На полной мощности дизеринга, шум единообразен, постоянен

 296
 00:15:33.289 --> 00:15:35.643
 и невыразителен, как мы и ожидали:

 297
 00:15:40.937 --> 00:15:42.772
 При уменьшении мощности дизеринга,

 298
 00:15:42.772 --> 00:15:46.356
 входной сигнал все больше и больше влияет на амплитуду и свойства

 299
 00:15:46.356 --> 00:15:47.977
 шума квантования:

 300
 00:16:09.883 --> 00:16:13.844
 Поведение дизеринга после ноиз-шейпинга схоже,

 301
 00:16:13.844 --> 00:16:16.553
 но ноиз-шейпинг дает еще одно хорошее преимущество.

 302
 00:16:16.553 --> 00:16:18.804
 Короче говоря, он может использовать

 303
 00:16:18.804 --> 00:16:20.937
 слегка меньшую мощность дизеринга прежде, чем входной сигнал

 304
 00:16:20.937 --> 00:16:23.662
 окажет соответствующее влияние на выходной.

 305
 00:16:49.172 --> 00:16:51.508
 Несмотря на все это время, что я потратил на дизеринг,

 306
 00:16:51.508 --> 00:16:53.012
 мы говорим о различиях,

 307
 00:16:53.012 --> 00:16:56.372
 начинающихся на 100 дБ ниже измеряемого диапазона.

 308
 00:16:56.372 --> 00:16:59.806
 Возможно, если бы CD имели 14 бит, как изначально задумывалось,

 309
 00:16:59.806 --> 00:17:01.513
 дизеринг <u>мог бы</u> быть важнее.

 310
 00:17:01.989 --> 00:17:02.644
 Возможно.

 311
 00:17:02.644 --> 00:17:05.438
 С 16 бит, на самом деле, почти без разницы.

 312
 00:17:05.438 --> 00:17:08.019
 Вы можете думать о дизеринге как о страховке,

 313
 00:17:08.019 --> 00:17:11.443
 дающей несколько дополнительных дБ к динамическому диапазону

 314
 00:17:11.443 --> 00:17:12.804
 на всякий случай.

 315
 00:17:12.990 --> 00:17:14.196
 Тем не менее, факт в том, что,

 316
 00:17:14.196 --> 00:17:16.361
 никто не уничтожил великолепную запись,

 317
 00:17:16.361 --> 00:17:19.182
 не воспользовавшись дизерингом при мастеринге звукозаписи.

 318
 00:17:24.414 --> 00:17:25.790
 Мы использовали синусоиды.

 319
 00:17:25.790 --> 00:17:28.254
 Они являются очевидным выбором когда то, что хотим увидеть –

 320
 00:17:28.254 --> 00:17:32.212
 это поведение системы на данной отдельной частоте.

 321
 00:17:32.212 --> 00:17:34.217
 Теперь давайте рассмотрим кое-что посложнее.

 322
 00:17:34.217 --> 00:17:35.923
 Что нам следует ожидать,

 323
 00:17:35.923 --> 00:17:39.671
 когда я изменю входной сигнал на меандр?

 324
 00:17:42.718 --> 00:17:45.921
 Осциллограф на входе выводит наш 1 кГц меандр.

 325
 00:17:45.921 --> 00:17:47.351
 А осциллограф на выходе показывает…

 326
 00:17:48.614 --> 00:17:51.102
 В точности, что и следует.

 327
 00:17:51.102 --> 00:17:53.900
 Что такое меандр на самом деле?

 328
 00:17:54.654 --> 00:17:57.982
 Скажем, это диаграмма сигнала, где есть положительное значение

 329
 00:17:57.982 --> 00:18:00.788
 во время одного полупериода, мгновенно меняющееся

 330
 00:18:00.788 --> 00:18:02.910
 на отрицательное в другом полупериоде.

 331
 00:18:02.910 --> 00:18:05.076
 Но это на самом деле не сообщает ничего полезного о том,

 332
 00:18:05.076 --> 00:18:07.241
 как этот входной сигнал

 333
 00:18:07.241 --> 00:18:09.378
 становится таким на выходе.

 334
 00:18:10.132 --> 00:18:12.713
 Далее, мы помним, что любая волна

 335
 00:18:12.713 --> 00:18:15.508
 также является суммой дискретных частот,

 336
 00:18:15.508 --> 00:18:18.302
 и меандр, в частности, – просто сумма

 337
 00:18:18.302 --> 00:18:19.636
 несущей частоты и

 338
 00:18:19.636 --> 00:18:22.228
 бесконечного числа нечетных гармоник.

 339
 00:18:22.228 --> 00:18:24.597
 Сложите их все, и вы получите меандр.

 340
 00:18:26.398 --> 00:18:27.433
 На первый взгляд,

 341
 00:18:27.433 --> 00:18:29.225
 это тоже не похоже на полезную информацию.

 342
 00:18:29.225 --> 00:18:31.561
 Необходимо сложить бесконечное число гармоник,

 343
 00:18:31.561 --> 00:18:33.108
 чтобы получить ответ.

 344
 00:18:33.108 --> 00:18:35.977
 А, но у нас нет бесконечного числа гармоник.

 345
 00:18:36.960 --> 00:18:39.902
 У нас антиалиасинговый фильтр с крутым спадом переходной полосы,

 346
 00:18:39.902 --> 00:18:42.206
 частота среза которого 20 кГц,

 347
 00:18:42.206 --> 00:18:44.158
 поэтому наш сигнал ограничен по полосе частот,

 348
 00:18:44.158 --> 00:18:46.421
 что означает следующее:

 349
 00:18:52.500 --> 00:18:56.468
 …и это в точности, что мы видим на осциллографе с выхода.

 350
 00:18:56.468 --> 00:18:59.550
 Пульсация, которую вы видите по краям сигнала с ограниченной полосой частот,

 351
 00:18:59.550 --> 00:19:00.926
 называется "явлением Гиббса".

 352
 00:19:00.926 --> 00:19:04.137
 Оно происходит всякий раз, когда вы срезаете часть области частот

 353
 00:19:04.137 --> 00:19:07.006
 в пределах которой сосредоточена энергия сигнала.

 354
 00:19:07.006 --> 00:19:09.854
 Обычно вы услышите эмпирическое правило: чем круче спад переходной полосы,

 355
 00:19:09.854 --> 00:19:11.188
 тем сильнее пульсация.

 356
 00:19:11.188 --> 00:19:12.777
 Что в общем-то правда,

 357
 00:19:12.777 --> 00:19:14.900
 но нужно быть осторожнее в наших представлениях.

 358
 00:19:14.900 --> 00:19:15.774
 Например…

 359
 00:19:15.774 --> 00:19:19.529
 Что по-вашему будет делать наш "крутой" антиалиасинговый

 360
 00:19:19.529 --> 00:19:23.181
 фильтр, если я пропущу через него сигнал дважды?

 361
 00:19:34.136 --> 00:19:37.588
 Помимо добавления нескольких незначительных циклов задержек,

 362
 00:19:37.588 --> 00:19:39.348
 ответ будет…

 363
 00:19:39.348 --> 00:19:40.857
 вообще ничего.

 364
 00:19:41.257 --> 00:19:43.302
 Сигнал уже ограничен по полосе частот.

 365
 00:19:43.656 --> 00:19:46.590
 Повторное ограничение полосы частот ни на что не влияет.

 366
 00:19:46.590 --> 00:19:50.686
 Второй проход не может убрать частоты, которые уже были удалены.

 367
 00:19:52.070 --> 00:19:53.737
 И это важно.

 368
 00:19:53.737 --> 00:19:56.233
 Люди склонны думать о пульсации как о своего рода артефакте,

 369
 00:19:56.233 --> 00:19:59.945
 добавляемом антиалиасинговым и реконструкционным фильтрами,

 370
 00:19:59.945 --> 00:20:01.737
 считая, что пульсация становится хуже

 371
 00:20:01.737 --> 00:20:03.913
 с каждым проходом сигнала через них.

 372
 00:20:03.913 --> 00:20:05.950
 Мы видим, что в данном случае этого не случилось.

 373
 00:20:05.950 --> 00:20:09.492
 Так был ли это на самом деле фильтр, добавивший пульсацию при 1-м проходе?

 374
 00:20:09.492 --> 00:20:10.537
 Нет, не совсем.

 375
 00:20:10.537 --> 00:20:12.126
 Это деликатный момент,

 376
 00:20:12.126 --> 00:20:15.252
 т.к. пульсация при эффекте Гиббса добавляется не фильтрами –

 377
 00:20:15.252 --> 00:20:18.836
 она просто часть того, <u>чем является</u> сигнал с ограниченной полосой частот.

 378
 00:20:18.836 --> 00:20:20.798
 Даже если мы искусственно сгенерируем сигнал,

 379
 00:20:20.798 --> 00:20:23.508
 который выглядит как идеальный цифровой меандр,

 380
 00:20:23.508 --> 00:20:26.206
 его полоса частот все равно ограничена полосой пропускания передающего канала.

 381
 00:20:26.206 --> 00:20:29.140
 Вспомните, что ступенчатое представление кривой неточно.

 382
 00:20:29.140 --> 00:20:32.222
 Что на самом деле есть у нас – это точки отсчета,

 383
 00:20:32.222 --> 00:20:36.148
 и только 1 сигнал с ограниченной полосой частот подходит к этим точкам.

 384
 00:20:36.148 --> 00:20:39.614
 Все что мы сделали, когда рисовали наш идеальный меандр,

 385
 00:20:39.614 --> 00:20:43.198
 это расставили точки отсчета как раз, чтобы сложилось впечатление,

 386
 00:20:43.198 --> 00:20:47.785
 что здесь нет пульсаций, если мы сыграем в "Соедини точки".

 387
 00:20:47.785 --> 00:20:49.449
 Но исходный сигнал с ограниченной полосой частот

 388
 00:20:49.449 --> 00:20:52.742
 вместе с пульсациями все еще там.

 389
 00:20:54.004 --> 00:20:56.542
 И это ведет нас к еще одному важному моменту.

 390
 00:20:56.542 --> 00:20:59.550
 Вы наверняка уже слышали, что точность синхронизации цифрового сигнала

 391
 00:20:59.550 --> 00:21:02.409
 ограничена его частотой дискретизации; другими словами,

 392
 00:21:02.409 --> 00:21:05.140
 якобы цифровые сигналы не могут представлять ничего,

 393
 00:21:05.140 --> 00:21:08.041
 что попадает между точками отсчетов…

 394
 00:21:08.041 --> 00:21:11.422
 имеется в виду, что импульсы или резкие скачки должны быть четко

 395
 00:21:11.422 --> 00:21:14.473
 выравнены с отсчетами, или синхронизация будет утрачена…

 396
 00:21:14.473 --> 00:21:16.219
 и они просто исчезнут.

 397
 00:21:16.711 --> 00:21:20.820
 Теперь мы легко можем увидеть, почему это не так.

 398
 00:21:20.820 --> 00:21:23.742
 Еще раз, наш входной сигнал ограничен по полосе частот.

 399
 00:21:23.742 --> 00:21:26.036
 И цифровой сигнал – это точки отсчета,

 400
 00:21:26.036 --> 00:21:29.340
 не ступеньки, не "Соедини точки".

 401
 00:21:31.572 --> 00:21:34.592
 Мы определенно можем, например,

 402
 00:21:36.777 --> 00:21:39.337
 разместить фронт нашего меандра с ограниченной полосой частот

 403
 00:21:39.337 --> 00:21:42.004
 в любом месте между отсчетами.

 404
 00:21:42.004 --> 00:21:44.354
 Меандр отлично изображается

 405
 00:21:47.508 --> 00:21:50.218
 и отлично восстанавливается.

 406
 00:22:04.620 --> 00:22:06.526
 Как и в предыдущей части,

 407
 00:22:06.526 --> 00:22:08.393
 мы охватили широкий круг тем,

 408
 00:22:08.393 --> 00:22:10.868
 и при этом лишь едва коснулись каждой из них.

 409
 00:22:10.868 --> 00:22:13.620
 Если уж на то пошло, то в этот раз у меня больше грехов упущения…

 410
 00:22:13.620 --> 00:22:16.286
 но это хороший момент все завершить.

 411
 00:22:16.286 --> 00:22:17.833
 Или, может, хорошая отправная точка.

 412
 00:22:17.833 --> 00:22:18.708
 Пробуйте копнуть глубже.

 413
 00:22:18.708 --> 00:22:19.710
 Экспериментируйте.

 414
 00:22:19.710 --> 00:22:21.374
 Я со всей тщательностью подбирал опыты,

 415
 00:22:21.374 --> 00:22:23.668
 чтобы они были простыми и красноречивыми.

 416
 00:22:23.668 --> 00:22:26.217
 Вы можете воспроизвести каждый из них самостоятельно, если хотите.

 417
 00:22:26.217 --> 00:22:28.766
 Только давайте признаемся, что иногда мы узнаем больше

 418
 00:22:28.766 --> 00:22:30.516
 о модной игрушке, разобрав ее до основания

 419
 00:22:30.516 --> 00:22:32.553
 и изучая все выпавшие кусочки.

 420
 00:22:32.553 --> 00:22:35.230
 И это нормально – мы инженеры.

 421
 00:22:35.230 --> 00:22:36.350
 Поиграйтесь с демо-параметрами,

 422
 00:22:36.350 --> 00:22:37.972
 хакните код,

 423
 00:22:37.972 --> 00:22:39.774
 проведите другие опыты.

 424
 00:22:39.774 --> 00:22:40.692
 Исходный код для всего,

 425
 00:22:40.692 --> 00:22:42.398
 включая небольшое кнопочное демо-приложение,

 426
 00:22:42.398 --> 00:22:44.361
 выложен на Xiph.Org.

 427
 00:22:44.361 --> 00:22:45.940
 В ходе экспериментов,

 428
 00:22:45.940 --> 00:22:47.401
 вы, скорее всего, столкнетесь с чем-то,

 429
 00:22:47.401 --> 00:22:49.950
 чего не ожидали и не можете объяснить.

 430
 00:22:49.950 --> 00:22:51.198
 Не переживайте!

 431
 00:22:51.198 --> 00:22:54.537
 Без шуток, Википедия потрясающе подходит

 432
 00:22:54.537 --> 00:22:56.788
 как раз для подобных неформальных исследований.

 433
 00:22:56.788 --> 00:22:59.956
 Если вы действительно серьезно намерены разобраться в сигналах,

 434
 00:22:59.956 --> 00:23:03.337
 у некоторых университетов есть онлайн материалы продвинутого уровня,

 435
 00:23:03.337 --> 00:23:07.380
 например курсы 6.003 и 6.007 "Signals and Systems"

 436
 00:23:07.380 --> 00:23:08.798
 на MIT OpenCourseWare.

 437
 00:23:08.798 --> 00:23:11.593
 И, конечно же, сообщество Xiph.Org всегда доступно вам.

 438
 00:23:12.792 --> 00:23:13.929
 Копать глубже или нет,

 439
 00:23:13.929 --> 00:23:14.974
 у меня кончился кофе,

 440
 00:23:14.974 --> 00:23:16.436
 так что до следующих встреч,

 441
 00:23:16.436 --> 00:23:19.316
 веселого хакинга!
diff --git a/vid1-ru_edited.srt b/vid1-ru_edited.srt
 1
 00:00:08,124 --> 00:00:10,742
 Рабочие станции и топовые персональные компьютеры справляются 

 2
 00:00:10,742 --> 00:00:14,749
 с обработкой цифрового звука довольно легко последние пятнадцать лет. 

 3
 00:00:14,749 --> 00:00:17,470
 Только около пяти лет приличные рабочие станции способны 

 4
 00:00:17,470 --> 00:00:21,643
 справляться с несжатым видео без кучи дорогого специализированного оборудования.

 5
 00:00:21,643 --> 00:00:25,400
 Но сегодня даже самый дешевый домашний компьютер имеет процессор и 

 6
 00:00:25,400 --> 00:00:28,092
 жесткий диск, достаточные, чтобы реально раскидывать несжатое видео, 

 7
 00:00:28,092 --> 00:00:30,479
 по крайней мере, без излишнего напряжения.

 8
 00:00:30,479 --> 00:00:33,579
 Итак, теперь, когда у каждого есть все это необходимое недорогое оборудование,

 9
 00:00:33,579 --> 00:00:36,651
 все больше людей, что неудивительно, хотят заниматься интересными

 10
 00:00:36,651 --> 00:00:39,908
 вещами с цифровым контентом, особенно потоковым воспроизведением.

 11
 00:00:39,908 --> 00:00:44,017
 YouTube явился первым огромным успехом, и теперь каждый хочет поучаствовать.

 12
 00:00:44,017 --> 00:00:47,413
 Ну хорошо! Потому что это очень весело!

 13
 00:00:48,250 --> 00:00:51,179
 Совсем не проблема найти потребителя цифрового контента.

 14
 00:00:51,179 --> 00:00:54,649
 Но здесь я бы хотел обратиться к инженерам, к математикам,

 15
 00:00:54,649 --> 00:00:57,869
 хакерам, людям, заинтересованным в открытиях,

 16
 00:00:57,869 --> 00:01:01,302
 создании вещей и создании самих технологий.

 17
 00:01:01,302 --> 00:01:03,282
 Людям, близким мне по духу.

 18
 00:01:04,250 --> 00:01:08,723
 Цифровой контент, особенно сжатие, воспринимается как что-то сверх-элитное,

 19
 00:01:08,723 --> 00:01:12,822
 почему-то невероятно более сложное, чем что-либо другое в компьютерной науке.

 20
 00:01:12,822 --> 00:01:15,700
 Крупные индустриальные игроки в этой области вообще не против такого восприятия;

 21
 00:01:15,700 --> 00:01:19,734
 это помогает оправдывать ошеломляющее количество фундаментальных патентов, которые они держат.

 22
 00:01:19,734 --> 00:01:23,870
 Им нравится образ, представляющий их исследователей лучшими из лучших,

 23
 00:01:23,870 --> 00:01:27,738
 которые настолько умнее всех остальных, что их блестящие идеи не могут

 24
 00:01:27,738 --> 00:01:29,903
 быть даже поняты простыми смертными.

 25
 00:01:30,625 --> 00:01:33,716
 Это чушь.

 26
 00:01:35,205 --> 00:01:38,900
 Цифровое аудио, видео, потоковая передача и сжатие

 27
 00:01:38,900 --> 00:01:42,738
 представляют бесконечно глубокие и стимулирующие умственные испытания,

 28
 00:01:42,738 --> 00:01:44,662
 как и любая другая дисциплина.

 29
 00:01:44,662 --> 00:01:47,929
 Это выглядит элитным, потому что слишком мало людей вовлечены.

 30
 00:01:47,929 --> 00:01:51,223
 Так мало людей были вовлечены, возможно, потому, что так мало людей

 31
 00:01:51,223 --> 00:01:54,665
 могли позволить себе необходимое дорогое специализированное оборудование.

 32
 00:01:54,665 --> 00:01:58,792
 Но сегодня почти любой смотрящий это видео, имеет дешевый

 33
 00:01:58,792 --> 00:02:03,317
 универсальный компьютер, достаточно мощный, чтобы играть с большими парнями.

 34
 00:02:05,926 --> 00:02:11,108
 Сегодня идут сражения вокруг HTML5, браузеров,

 35
 00:02:11,108 --> 00:02:13,671
 видео и открытого против закрытого.

 36
 00:02:13,671 --> 00:02:17,048
 Поэтому, сейчас самое подходящее время принять участие.

 37
 00:02:17,048 --> 00:02:20,000
 Легче всего начать, возможно, с понимания

 38
 00:02:20,000 --> 00:02:22,619
 имеющейся у нас технологии.

 39
 00:02:23,500 --> 00:02:25,071
 Это - вступление.

 40
 00:02:25,071 --> 00:02:28,180
 Поскольку это вступление, оно опускает массу деталей,

 41
 00:02:28,180 --> 00:02:30,882
 так что большую картину несколько легче понять.

 42
 00:02:30,882 --> 00:02:33,908
 Порядочное число смотрящих уже знакомы со всем,

 43
 00:02:33,908 --> 00:02:36,378
 о чем я буду говорить, по крайней мере пока.

 44
 00:02:36,378 --> 00:02:39,293
 С другой стороны, возможно, я буду рассказывать слишком быстро для тех,

 45
 00:02:39,293 --> 00:02:44,558
 кто совсем не знаком со всем этим, поэтому, если все это ново для вас, расслабьтесь.

 46
 00:02:44,558 --> 00:02:48,629
 Важно выделить все идеи, которые действительно захватывают ваше воображение.

 47
 00:02:48,629 --> 00:02:52,497
 Особенно уделите внимание терминологии, связанной с этими идеями,

 48
 00:02:52,479 --> 00:02:56,078
 потому что с ними, а так же с Гуглом и Википедией, вы можете копать

 49
 00:02:56,078 --> 00:02:57,753
 настолько глубоко, насколько вы заинтересованы.

 50
 00:02:57,753 --> 00:03:00,094
 Итак, без лишних церемоний,

 51
 00:03:00,094 --> 00:03:03,351
 добро пожаловать в чертовски хорошее хобби.

 52
 00:03:10,291 --> 00:03:13,030
 Звук - это распространение волн давления по воздуху,

 53
 00:03:13,030 --> 00:03:16,981
 расходящихся от источника подобно кругам на воде от брошенного в пруд камня.

 54
 00:03:16,981 --> 00:03:19,489
 Микрофон, или человеческое ухо в его роли,

 55
 00:03:19,489 --> 00:03:22,876
 преобразовывает эту распространяющуюся пульсацию в электрический сигнал.

 56
 00:03:22,876 --> 00:03:25,800
 Верно, это курс средней школы, это помнит каждый.

 57
 00:03:25,800 --> 00:03:26,771
 Двигаемся дальше.

 58
 00:03:27,465 --> 00:03:32,527
 Этот аудиосигнал является одномерной функцией, единственным значением, изменяющимся во времени.

 59
 00:03:32,527 --> 00:03:34,248
 Если мы немного замедлим осциллограф...

 60
 00:03:36,450 --> 00:03:38,190
 это будет несколько легче увидеть.

 61
 00:03:38,190 --> 00:03:40,688
 Также важны несколько других аспектов сигнала.

 62
 00:03:40,688 --> 00:03:43,418
 Он непрерывен и во времени и в значениях;

 63
 00:03:43,418 --> 00:03:46,813
 то есть, в любой момент времени у него есть действительное значение,

 64
 00:03:46,813 --> 00:03:50,228
 а также его значение плавно меняется от одной точки во времени к другой.

 65
 00:03:50,228 --> 00:03:52,439
 Не важно, насколько мы увеличиваем масштаб,

 66
 00:03:54,068 --> 00:03:58,510 
 не будет никаких разрывов, сингулярностей, мгновенных изменений значений

 67
 00:03:58,510 --> 00:04:01,285
 или точек, в которых сигнал прекращает существовать.

 68
 00:04:03,247 --> 00:04:08,475
 Он определён везде. Классическая непрерывная математика хорошо применима к этим сигналам.

 69
 00:04:11,001 --> 00:04:15,378
 Цифровой сигнал, с другой стороны, является дискретным по значению и по времени.

 70
 00:04:15,378 --> 00:04:19,107
 В самой простой и наиболее общепринятой системе, которая называется "импульсно-кодовая модуляция",

 71
 00:04:19,107 --> 00:04:24,058
 каждое из фиксированного числа значений напрямую представляет амплитуду непрерывного сигнала

 72
 00:04:24,058 --> 00:04:30,165
 в точках времени, разделённых равными промежутками. Конечным результатом является поток чисел.

 73
 00:04:30,674 --> 00:04:35,309
 Теперь это выглядит ужасно похоже на это.

 74
 00:04:35,309 --> 00:04:38,964
 Кажется интуитивным, что должен быть способ как-то строго преобразовывать

 75
 00:04:38,964 --> 00:04:44,683
 одно в другое, и, хорошие новости, теорема отсчетов гласит, что мы можем, и рассказывает, как.

 76
 00:04:44,683 --> 00:04:48,477
 Опубликованная в своей самой известной форме Клодом Шенноном в 1949

 77
 00:04:48,477 --> 00:04:52,409
 и основанная на работах Найквиста и Хартли, и многих других,

 78
 00:04:52,409 --> 00:04:56,138
 теорема отсчетов не только утверждает, что мы можем переходить туда-обратно между

 79
 00:04:56,138 --> 00:05:00,913
 аналоговым и цифровым представлением, но также устанавливает ряд условий, при которых конверсия

 80
 00:05:00,913 --> 00:05:06,779
 происходит без потерь и два представления становятся эквивалентными и взаимозаменяемыми.

 81
 00:05:06,779 --> 00:05:10,601
 Когда эти условия не выполняются, теорема отсчетов говорит нам,

 82
 00:05:10,601 --> 00:05:14,247
 как и сколько информации потеряно или испорчено.

 83
 00:05:14,900 --> 00:05:21,270
 До самого последнего времени, аналоговая технология была основой для практически всей работы со звуком,

 84
 00:05:21,270 --> 00:05:25,267
 и не только потому, что большинство аудиоданных имеют аналоговое происхождение.

 85
 00:05:25,267 --> 00:05:28,450
 Вы могли подумать, что раз компьютеры появились относительное недавно,

 86
 00:05:28,450 --> 00:05:31,643
 технология аналогового сигнала, должно быть, появилась первой.

 87
 00:05:31,643 --> 00:05:34,428
 Нет. Цифровая, на самом деле, старше.

 88
 00:05:34,428 --> 00:05:37,611
 Телеграф предшествовал телефону на полвека

 89
 00:05:37,611 --> 00:05:41,951
 и был почти полностью механически автоматизирован к 1860м, посылая закодированные,

 90
 00:05:41,951 --> 00:05:46,476
 мультиплексированные цифровые сигналы на длинные дистанции. Вы знаете... Телеграфная лента.

 91
 00:05:46,476 --> 00:05:50,427
 Гарри Найквист из Bell Labs исследовал импульсную телеграфическую передачу,

 92
 00:05:50,427 --> 00:05:53,027
 когда опубликовал своё описание того, что потом стало известно как

 93
 00:05:53,027 --> 00:05:57,219
 частота Найквиста, ключевая концепция теоремы отсчетов.

 94
 00:05:57,219 --> 00:06:01,642
 Теперь правда в том, что телеграф передавал символьную информацию, текст,

 95
 00:06:01,642 --> 00:06:06,883
 а не оцифрованный аналоговый сигнал, но с пришествием телефона и радио

 96
 00:06:06,883 --> 00:06:12,000
 технологии аналогового и цифрового сигнала развивались быстро бок о бок.

 97
 00:06:12,699 --> 00:06:18,732
 Аудио всегда обрабатывалось как аналоговый сигнал потому что... ну, это настолько легче!

 98
 00:06:18,732 --> 00:06:23,257
 Фильтр низких частот второго порядка, например, требует двух пассивных компонентов.

 99
 00:06:23,257 --> 00:06:26,505
 Полностью аналогичное оконное преобразование Фурье - нескольких сотен.

 100
 00:06:26,505 --> 00:06:30,752
 Хорошо, возможно, тысячи, если вы хотите собрать что-то действительно хорошее.

 101
 00:06:31,844 --> 00:06:35,989
 Обработка сигналов цифровым способом требует от миллионов до миллиардов транзисторов,

 102
 00:06:35,989 --> 00:06:40,366
 работающих на микроволновых частотах, аппаратную поддержку по меньшей мере оцифровки

 103
 00:06:40,366 --> 00:06:43,836
 и реконструкции аналоговых сигналов, законченную программную экосистему

 104
 00:06:43,836 --> 00:06:47,362
 для программирования и управления этим миллиардно-транзисторным Джаггернаутом,

 105
 00:06:47,362 --> 00:06:51,091
 и цифровое хранилище, на тот случай, если вы хотите сохранить результаты на будущее...

 106
 00:06:51,091 --> 00:06:56,171
 Таким образом, мы приходим к выводу, что только аналоговый подход практичен для работы с аудио...

 107
 00:06:56,171 --> 00:07:07,019
 ну, по крайней мере, если у вас не завалялись миллиард транзисторов и все остальное.

 108
 00:07:07,850 --> 00:07:12,660
 А поскольку у нас завалялись, цифровая обработка сигнала становится очень заманчивой.

 109
 00:07:13,363 --> 00:07:18,906
 Во-первых, аналоговые комплектующие просто не имеют гибкости компьютера общего назначения.

 110
 00:07:18,906 --> 00:07:21,182
 Добавление новой функции в этого зверя...

 111
 00:07:22,191 --> 00:07:24,578
 да, вероятно, этого не произойдёт.

 112
 00:07:24,578 --> 00:07:26,567
 Хотя на цифровом процессоре...

 113
 00:07:28,668 --> 00:07:34,127
 ...просто напишите новую программу. Программирование не тривиально, но оно намного легче.

 114
 00:07:34,127 --> 00:07:39,550
 Возможно более важно, что каждый аналоговый компонент является приближением.

 115
 00:07:39,550 --> 00:07:44,352
 Не существует такой вещи как идеальный транзистор или идеальный проводник, или идеальный конденсатор.

 116
 00:07:44,352 --> 00:07:51,569
 В аналоговой  обработке каждый компонент добавляет шума и искажений, обычно не очень много, но они суммируются.

 117
 00:07:51,569 --> 00:07:55,669
 Одна только передача аналогового сигнала, особенно на длинные дистанции,

 118
 00:07:55,669 --> 00:08:00,434
 постепенно, ощутимо, необратимо портит его.

 119
 00:08:00,434 --> 00:08:06,513
 Кроме того, все эти одноцелевые аналоговые компоненты занимают много места.

 120
 00:08:06,513 --> 00:08:09,946
 Две строки кода на миллиарде транзисторов здесь

 121
 00:08:09,946 --> 00:08:14,702
 могут реализовать фильтр, который бы потребовал катушку индуктивности размером с холодильник.

 122
 00:08:14,702 --> 00:08:17,941
 Цифровые системы не имеют этих недостатков.

 123
 00:08:17,941 --> 00:08:24,335
 Цифровые сигналы могут храниться, копироваться, обрабатываться и передаваться без наложения шумов и искажений.

 124
 00:08:24,335 --> 00:08:26,889
 Да, мы используем время от времени алгоритмы с потерей,

 125
 00:08:26,889 --> 00:08:31,284
 но единственно неизбежными неидеальными шагами являются оцифровка и восстановление,

 126
 00:08:31,284 --> 00:08:35,929
 когда цифровое должно взаимодействовать со всем этим неряшливым аналоговым.

 127
 00:08:35,929 --> 00:08:40,750
 Неряшливые или нет, современные этапы преобразования очень, очень хороши.

 128
 00:08:40,750 --> 00:08:45,849
 По меркам наших ушей, мы можем также считать их без потерь.

 129
 00:08:45,849 --> 00:08:50,429
 С небольшим дополнительным оборудованием, большинство из которого компактно и недорого

 130
 00:08:50,429 --> 00:08:55,379
 благодаря нашей современной промышленной инфраструктуре, цифровое аудио одерживает чистую победу над аналоговым.

 131
 00:08:55,379 --> 00:09:00,857
 Давайте тогда перейдем к хранению, копированию, обработке и передаче.

 132
 00:09:04,956 --> 00:09:08,639
 Импульсно-кодовая модуляция - самое распространенное представление необработанного аудио.

 133
 00:09:08,639 --> 00:09:13,867
 Существуют и другие представления, например, сигма-дельта кодирование, используемое в SACD,

 134
 00:09:13,867 --> 00:09:16,625
 которое является разновидностью импульсно-кодовой модуляции.

 135
 00:09:16,625 --> 00:09:19,687
 Что говорит, что импульсно-кодовая модуляция значительно доминирует,

 136
 00:09:19,687 --> 00:09:22,158
 главным образом потому, что она так математически удобна.

 137
 00:09:22,158 --> 00:09:26,350
 Аудио инженер может провести целую карьеру, не работая ни с чем другим.

 138
 00:09:26,350 --> 00:09:29,135
 Кодирование ИКМ можно охарактеризовать тремя параметрами,

 139
 00:09:29,135 --> 00:09:34,187
 что позволяет посчитать каждый возможный вариант ИКМ без больших хлопот.

 140
 00:09:34,187 --> 00:09:36,426
 Первый параметр - это частота дискретизации.

 141
 00:09:36,426 --> 00:09:40,886
 Наивысшая частота, которую кодирование может передать, называется частотой Найквиста. 

 142
 00:09:40,886 --> 00:09:45,124
 Частота Найквиста ИКМ равняется ровно половине частоты дискретизации.

 143
 00:09:45,124 --> 00:09:51,389
 Следовательно, частота дискретизации непосредственно определяет наивысшую возможную частоту в оцифрованном сигнале.

 144
 00:09:51,389 --> 00:09:56,515
 Аналоговые телефонные системы традиционно ограничивали полосу голосовых каналов до чуть менее, чем 4 кГц,

 145
 00:09:56,515 --> 00:10:02,224
 поэтому цифровая телефония и самые классические голосовые приложения используют частоту дискретизации 8 кГц,

 146
 00:10:02,224 --> 00:10:07,277
 минимальную частоту, необходимую для охвата целевой полосы в 4 кГц.

 147
 00:10:07,227 --> 00:10:14,263
 Вот как звучит частота дискретизации в 8 кГц--- немного приглушенно, но совсем разборчиво для голоса.

 148
 00:10:17,263 --> 00:10:18,149
 Это самая низкая частота дискретизации, когда-либо широко использованная на практике.

 149
 00:10:18,149 --> 00:10:23,322
 С этих пор, с увеличением производительности, памяти и накопителей, компьютеры потребителей

 150
 00:10:23,322 --> 00:10:29,642
 смогли обеспечить частоту 11, потом 16, потом 22, а потом - 32 кГц.

 151
 00:10:29,642 --> 00:10:33,491
 Очевидно, что с каждым увеличением частоты дискретизации и частоты Найквиста,

 152
 00:10:33,491 --> 00:10:38,302
 качество звучания топовых конфигураций становится немного чище и звучит более естественно.

 153
 00:10:38,301 --> 00:10:44,576
 Compact-Disk использует частоту дискретизации 44,1 кГц, которая немного лучше, чем 32 кГц,

 154
 00:10:44,576 --> 00:10:46,788
 но улучшения становятся все менее различимыми.

 155
 00:10:46,788 --> 00:10:52,053
 44,1 кГц - это несколько странноватый выбор, особенно при том, что он никогда не использовался

 156
 00:10:52,053 --> 00:10:56,559
 до Compact-Disk, но огромный успех компакт-дисков сделал его общепринятой частотой.

 157
 00:10:56,559 --> 00:11:01,195
 Наиболее распространённой частотой дискретизации высокого качества за пределами CD является 48 кГц.

 158
 00:11:05,710 --> 00:11:08,597
 Фактически между ними нет ощутимой разницы в звучании.

 159
 00:11:08,597 --> 00:11:13,640
 Это видео, по крайней мере его оригинальная версия, было снято и выпущено с аудио 48 кГц,

 160
 00:11:13,640 --> 00:11:18,545
 что является первоначальным стандартом для высококачественного звука в видеозаписях.

 161
 00:11:18,545 --> 00:11:25,100
 Сверхвысококачественные частоты дискретизации в 88, 96 и 192кГц также имели место.

 162
 00:11:25,100 --> 00:11:30,888
 Суть в дискретизации на частоте выше 48 кГц заключается не в дальнейшем расширении высокочастотного диапазона.

 163
 00:11:30,888 --> 00:11:32,489
 Его суть в другом.

 164
 00:11:32,896 --> 00:11:37,319
 Отвлекаясь на секунду, скажу, что французский математик Жан Батист Жозеф Фурье

 165
 00:11:37,319 --> 00:11:42,353
 показал, что мы также можем рассматривать сигналы вроде аудио как набор составных частот.

 166
 00:11:42,353 --> 00:11:45,841
 Это представление частотной области эквивалентно временному представлению;

 167
 00:11:45,841 --> 00:11:49,719
 сигнал точно такой же, просто мы рассматриваем его по-другому.

 168
 00:11:49,719 --> 00:11:56,131
 Здесь мы видим представление частотной области гипотетического аналогового сигнала, который мы собираемся оцифровать.

 169
 00:11:56,131 --> 00:11:59,888
 Теорема Найквиста-Шеннона рассказывает о двух вещах, связанных с процессом дискретизации.

 170
 00:11:59,888 --> 00:12:04,727
 Во-первых, цифровой сигнал не может передавать частоты выше частоты Найквиста.

 171
 00:12:04,727 --> 00:12:10,640
 Во-вторых, и это новая часть, если мы не удалим их низкочастотным фильтром перед дискретизацией,

 172
 00:12:10,640 --> 00:12:16,414
 при этом процессе они будут накладываться на допустимую полосу частот, создав искажения наложения.

 173
 00:12:16,414 --> 00:12:20,069
 Наложение (алиасинг), в двух словах, звучит ужасно,

 174
 00:12:20,069 --> 00:12:25,242
 поэтому весьма важно удалять все частоты выше частоты Найквиста перед дискретизацией и после восстановления.

 175
 00:12:25,871 --> 00:12:31,265
 Считается, что восприятие звука человеком простирается примерно до 20 кГц.

 176
 00:12:31,265 --> 00:12:37,548
 При частоте 44,1 или 48 кГц, фильтрация низких частот перед стадией дискретизации должна быть предельно точной,

 177
 00:12:37,548 --> 00:12:42,101
 чтобы избежать удаления слышимых частот ниже 20 кГц,

 178
 00:12:42,101 --> 00:12:49,439
 и в то же время не допуская попадания частот выше частоты Найквиста в процесс дискретизации.

 179
 00:12:49,439 --> 00:12:55,342
 Этот тяжело реализуемый фильтр и ни один фильтр на практике не преуспел полностью.

 180
 00:12:55,342 --> 00:13:00,024
 С другой стороны, если частота дискретизации 96 кГц или 192 кГц,

 181
 00:13:00,024 --> 00:13:07,223
 низкочастотный фильтр имеет дополнительно октаву или две в переходной полосе. Такой фильтр намного легче построить.

 182
 00:13:07,223 --> 00:13:14,348
 Частоты дискретизации ниже 48 кГц являются на самом деле одним из неприятных компромиссов на аналоговом этапе.

 183
 00:13:15,014 --> 00:13:20,844
 Второй фундаментальный параметр ИКМ - это формат выборки, то есть форма каждого цифрового числа.

 184
 00:13:20,844 --> 00:13:26,285
 Число - это число, но оно может быть представлено несколькими разными путями.

 185
 00:13:26,942 --> 00:13:30,902
 Ранняя ИКМ была линейной 8 битной, кодировалась беззнаковым байтом.

 186
 00:13:30,902 --> 00:13:37,028
 Динамический диапазон ограничен примерно 50 дБ и шум квантования, как вы можете слышать, достаточно резок.

 187
 00:13:37,028 --> 00:13:39,970
 Восьмибитное аудио сегодня исчезающе встречается.

 188
 00:13:41,007 --> 00:13:47,484
 В цифровой телефонии обычно используется одна из двух связанных нелинейных восьмибитных кодировок, называемых А-закон и мю-закон.

 189
 00:13:47,484 --> 00:13:51,287
 Эти форматы кодируют примерно 14 битный динамический диапазон в восьми битах,

 190
 00:13:51,287 --> 00:13:54,674
 раздвигая более высокие значения амплитуды дальше друг от друга.

 191
 00:13:54,674 --> 00:13:59,226
 А-закон и мю-закон, очевидно, улучшают шум квантования в сравнении с линейным 8-битным,

 192
 00:13:59,226 --> 00:14:03,557
 а голосовые гармоники хорошо скрывают оставшийся шум квантования.

 193
 00:14:03,557 --> 00:14:08,248
 Все три восьмибитные кодировки - линейная, А-закон и мю-закон, обычно используются

 194
 00:14:08,248 --> 00:14:13,328
 вместе с частотой дискретизации 8 кГц, хотя я демонстрирую их на 48 кГц.

 195
 00:14:13,328 --> 00:14:18,491
 Большинство современных ИКМ использует знаковые целые 16 или 24 бит с дополнением до двух для кодирования

 196
 00:14:18,491 --> 00:14:23,858
 диапазона от минус бесконечности до нуля децибел с точностью 16 или 24 бита.

 197
 00:14:23,858 --> 00:14:27,800
 Максимальное абсолютное значение соответствует нулю децибел.

 198
 00:14:27,800 --> 00:14:31,584
 Как и во всех современных форматах дискретизации, сигналы выше нуля децибел

 199
 00:14:31,584 --> 00:14:35,619
 и, таким образом, за пределами представимого диапазона, обрезаются.

 200
 00:14:35,619 --> 00:14:41,199
 В микшировании и сведении не является редкостью использование чисел с плавающей точкой для ИКМ вместо целых чисел.

 201
 00:14:41,199 --> 00:14:47,222
 32-битное число с плавающей точкой, обыкновенная разновидность плавающей точки на современных компьютерах,

 202
 00:14:47,222 --> 00:14:52,793
 представляет 24 бит для разрешения, а семь бит плавающей экспоненты увеличивает передаваемый диапазон.

 203
 00:14:52,793 --> 00:14:57,040
 В числах с плавающей точкой, ноль децибел обычно представляется как +/-1.0,

 204
 00:14:57,040 --> 00:15:00,547
 и, поскольку они могут, очевидно, представлять диапазон значительно выше этого,

 205
 00:15:00,547 --> 00:15:05,220
 временно превышение нуля децибел в процессе смешивания не приводит к обрезанию.

 206
 00:15:05,220 --> 00:15:11,077 
 ИКМ с плавающей точкой занимает больше объема, поэтому она, как правило, используется только в качестве промежуточного производственного формата.

 207
 00:15:11,077 --> 00:15:15,796
 Наконец, большинство компьютеров общего назначения по-прежнему читают и пишут данные восьмиразрядными байтами,

 208
 00:15:15,796 --> 00:15:18,489
 потому важно помнить, что семплы больше восьми бит

 209
 00:15:18,489 --> 00:15:22,838
 могут быть в порядке big или little endian, и оба порядка распространены.

 210
 00:15:22,838 --> 00:15:28,751
 Например, файлы Microsoft WAV - в little endian, а Apple AIFC - как правило в big-endian.

 211
 00:15:28,751 --> 00:15:30,139
 Имейте это в виду.

 212
 00:15:30,870 --> 00:15:34,071
 Третий параметр ИКМ - это число каналов.

 213
 00:15:34,071 --> 00:15:38,485
 Соглашением в сыром ИКМ является кодирование множества каналов, чередуя семплы каждого

 214
 00:15:38,485 --> 00:15:43,398
 канала вместе в едином потоке. Просто и расширяемо.

 215
 00:15:43,398 --> 00:15:47,701
 Вот и все. Это описывает все возможные представления ИКМ.

 216
 00:15:47,701 --> 00:15:51,578
 Готово. Цифровое аудио _настолько просто_!

 217
 00:15:51,578 --> 00:15:56,436
 Конечно, есть ещё много чего, но на данный момент у нас есть хороший полезный кусок аудиоданных,

 218
 00:15:56,436 --> 00:15:58,092
 давайте добудем также немного видео.

 219
 00:16:02,571 --> 00:16:08,798
 Можно рассматривать видео как аудио, только с двумя пространственными измерениями, X и Y,

 220
 00:16:08,798 --> 00:16:12,787
 в дополнение к измерению времени. Математически, это звук.

 221
 00:16:12,787 --> 00:16:19,097
 Теорема отсчетов применима ко всем трем измерениям видео точно также, как и к одному измерению времени в аудио.

 222
 00:16:19,097 --> 00:16:25,815
 Очевидно, на практике аудио и видео немного различны. С одной стороны, в сравнении с аудио, видео огромно.

 223
 00:16:25,815 --> 00:16:29,294
 Несжатое CD-аудио - это примерно 1,4 мегабита в секунду.

 224
 00:16:29,294 --> 00:16:33,958
 Несжатое видео 1080i HD - более 700 мегабит в секунду.

 225
 00:16:33,958 --> 00:16:40,056
 Приходится захватывать, обрабатывать и сохранять в 500 раз больше данных в секунду.

 226
 00:16:40,056 --> 00:16:43,711
 По закону Мура... выходит... давайте посмотрим... примерно восемь удвоений раз в два года,

 227
 00:16:43,711 --> 00:16:47,838
 так что да, компьютеры требуют около пятнадцати дополнительных лет для овладения несжатым видео

 228
 00:16:47,838 --> 00:16:51,252
 после укрощения несжатого аудио.

 229
 00:16:51,252 --> 00:16:55,425
 Основы сырого видео также несколько сложнее, чем основы сырого аудио.

 230
 00:16:55,425 --> 00:16:58,599
 Большой объем данных в настоящее время требуется представления

 231
 00:16:58,599 --> 00:17:02,106 
 более эффективного, чем линейная ИКМ, используемая в аудио.

 232
 00:17:02,106 --> 00:17:06,705
 К тому же, электронное видео происходит практически полностью из одного телевизионного вещания,

 233
 00:17:06,705 --> 00:17:13,423
 а комитеты по стандартам, которые регулируют телевещание всегда были очень озабочены обратной совместимостью.

 234
 00:17:13,423 --> 00:17:17,559  
 До самых последних лет в США старый, шестидесятилетний черно-белый телевизор

 235
 00:17:17,559 --> 00:17:21,038
 мог по-прежнему показывать обычные аналоговые телевизионные передачи.

 236
 00:17:21,038 --> 00:17:23,879
 На самом деле это действительно искусный трюк.

 237
 00:17:23,879 --> 00:17:28,718
 Недостатком обратной совместимости является то, что если когда-то что-то попадает в стандарт,

 238
 00:17:28,718 -->  00:17:30,985
 вы не можете на самом деле больше никогда выкинуть его.

 239
 00:17:30,985 --> 00:17:37,305
 Электронное видео никогда не переделывалось с нуля, как это было неоднократно с аудио.

 240
 00:17:37,305 --> 00:17:43,958
 Шестьдесят лет стоят умных но устаревших хаков, необходимых в связи с уходом технологии данной эпохи,

 241
 00:17:43,958 --> 00:17:50,102
 образующих на самом деле нагромождение, а поскольку цифровые стандарты также пришли с телевидения,

 242
 00:17:50,102 --> 00:17:54,664
 все эти жуткие хаки были перенесены также и в цифровые стандарты.

 243
 00:17:54,664 --> 00:18:00,022
 Вкратце, в цифровом видео замешано намного больше деталей, чем в аудио.

 244
 00:18:00,022 --> 00:18:05,592
 Нет надежды охватить здесь их все полностью, поэтому мы широко охватим основы.

 245
 00:18:06,036 --> 00:18:10,857
 Наиболее очевидными параметрами сырого видео являются ширина и высота изображения в пикселях.

 246
 00:18:10,857 --> 00:18:15,882
 Так же просто, как это может показаться, разрешение в пикселях само по себе на самом деле не определяет абсолютные

 247
 00:18:15,882 --> 00:18:22,016
 ширину и высоту изображения, поскольку большинство видео, происходящего из телевещания не использует квадратные пиксели.

 248
 00:18:22,016 --> 00:18:25,005
 Число растровых строк в трансляционном изображении было фиксированным,

 249
 00:18:25,005 --> 00:18:29,021
 но действительное количество горизонтальных пикселей зависело от ширины канала.

 250
 00:18:29,021 --> 00:18:31,945
 Действительное горизонтальное разрешение могло приводить к тому, что пиксели

 251
 00:18:31,945 --> 00:18:35,489
 были либо уже, либо шире, чем интервал между строками.

 252
 00:18:35,489 --> 00:18:38,395
 Стандарты в основном указывают, что оцифрованное видео

 253
 00:18:38,395 --> 00:18:41,902
 должно отражать реальное разрешение оригинального аналогового источника,

 254
 00:18:41,902 --> 00:18:45,566
 поэтому большое количество цифрового видео также использует не квадратные пиксели.

 255
 00:18:45,566 --> 00:18:49,924
 Например, обычное NTSC DVD с соотношением 4:3 обычно кодируется

 256
 00:18:49,924 --> 00:18:55,374
 с разрешением экрана 704 на 408, соотношение, более широкое, чем 4:3.

 257
 00:18:55,374 --> 00:18:59,640
 В данном случае сами пиксели получают соотношение 10:11,

 258
 00:18:59,640 --> 00:19:04,553
 что делает их выше собственной ширины и сужает изображение горизонтально до правильного соотношения.

 259
 00:19:04,553 --> 00:19:09,800
 Такое изображение должно проходить ресемплинг для корректного отображения на дисплеях с квадратными пикселями.

 260
 00:19:10,253 -->  00:19:15,287
 Второй очевидный параметр видео - это частота смены кадров, количество полных кадров в секунду.

 261
 00:19:15,287 --> 00:19:19,655
 Активно используются несколько стандартных частот кадров. Цифровое видео, в той или иной форме,

 262
 00:19:19,655 --> 00:19:23,689
 может использовать их все. Или, другую частоту кадров. Или даже переменные частоты,

 263
 00:19:23,689 --> 00:19:27,113
 когда частота кадров адаптивно меняется по ходу видео.

 264
 00:19:27,113 --> 00:19:32,998
 Чем выше частота кадров, тем более плавны движения, и это приводит нас, к сожалению, к интерлейсингу.

 265
 00:19:32,998 --> 00:19:37,967
 В самые ранние дни трансляции видео, инженеры искали наивысшую практическую частоту кадров

 266
 00:19:37,967 --> 00:19:42,075
 для гладкого движения и с минимальным мерцанием на фосфорных ЭЛТ.

 267
 00:19:42,075 --> 00:19:45,277
 Им было необходимо использовать минимальную ширину полосы

 268
 00:19:45,277 --> 00:19:48,182
 для достижения максимального разрешения и наивысшей частоты кадров.

 269
 00:19:48,182 --> 00:19:51,208
 Их решением было чередование видео, когда четные линии отправляются

 270
 00:19:51,208 --> 00:19:54,826
 в один проход и нечетные - в следующий.

 271
 00:19:54,826 --> 00:19:59,961
 Каждый проход называется полем, а два поля как бы образуют законченный кадр.

 272
 00:19:59,961 --> 00:20:05,319
 "Как бы" - потому что четные и нечетные поля на самом деле не принадлежат одному исходному кадру.

 273
 00:20:05,319 --> 00:20:10,797
 В изображении с 60 полями в секунду исходная частота кадров соответствует 60 полным кадрам в секунду,

 274
 00:20:10,797 --> 00:20:15,386
 а половина каждого кадра, каждая лишняя линия, просто отбрасывается.

 275
 00:20:15,386 --> 00:20:20,272
 Вот почему мы не можем применить деинтерлейсинг к видео простым комбинированием двух полей в один кадр;

 276
 00:20:20,272 --> 00:20:23,039
 на самом деле они не из одного и того же кадра.

 277
 00:20:24,047 --> 00:20:29,683
 Электронно-лучевая трубка была единственной доступной технологией отображения на протяжении большей части истории электронного видео.

 278
 00:20:29,683 --> 00:20:32,949
 Выходная яркость ЭЛТ нелинейна, приблизительно равняется

 279
 00:20:32,949 --> 00:20:36,585
 входному управляющему напряжению, возведённому в степень 2,5.

 280
 00:20:36,585 --> 00:20:43,821
 Эта степень, 2,5 - избранная гамма, и поэтому она часто обозначается как гамма дисплея.

 281
 00:20:43,821 --> 00:20:50,493
 Камеры, напротив, являются линейными, и если вы передадите ЭЛТ линейный входной сигнал, это будет выглядеть следующим образом.

 282
 00:20:51,270 --> 00:20:56,637
 Поскольку первоначально было очень мало камер, которые были фантастически дорогими,

 283
 00:20:56,637 --> 00:21:01,634
 и предполагалось много, много телевизоров, которые должны быть как можно менее дорогими,

 284
 00:21:01,634 --> 00:21:08,222
 инженеры решили добавить необходимую схему гамма-коррекции в камеры, а не телевизоры.

 285
 00:21:08,222 --> 00:21:13,062
 Видео, переданное по радиоволнам, таким образом, должно иметь нелинейную интенсивность, используя 

 286
 00:21:13,062 --> 00:21:18,271
 обратную степень гаммы телевизора, поэтому, как только сигнал с камеры, наконец, отображен на ЭЛТ,

 287
 00:21:18,271 --> 00:21:23,305
 общий ответ системы камера-телевизор вновь становится линейным.

 288
 00:21:23,777 --> 00:21:25,118
 Почти.

 289
 00:21:30,393 --> 00:21:33,113
 Также есть ещё две настройки.

 290
 00:21:33,113 --> 00:21:40,442
 Телекамера на самом деле использует экспоненту гаммы, обратную 2,2, а не 2,5.

 291
 00:21:40,442 --> 00:21:43,754
 Это просто коррекция для просмотра в темном окружении.

 292
 00:21:43,754 --> 00:21:48,279
 Кроме того, экспоненциальная кривая переходит в линейных закон вблизи черного цвета.

 293
 00:21:48,279 --> 00:21:52,360
 Это просто старый хак для подавления шума датчика в камере.

 294
 00:21:54,941 --> 00:21:57,347
 Гамма-коррекция также имела удачную выгоду.

 295
 00:21:57,347 --> 00:22:02,214
 По воле случая, человеческий глаз имеет гамму восприятия около 3.

 296
 00:22:02,214 --> 00:22:05,962
 Это относительно близко к гамме ЭЛТ, 2,5.

 297
 00:22:05,962 --> 00:22:10,607
 Изображение, использующее гамма-коррекцию уделяет больше разрешения низким интенсивностям,

 298
 00:22:10,607 --> 00:22:14,336
 где, как оказалось, у глаза наилучшая различимость,

 299
 00:22:14,336 --> 00:22:18,222
 а следовательно, использует имеющееся разрешение более эффективно.

 300
 00:22:18,222 --> 00:22:22,784
 Хотя в  настоящее время ЭЛТ исчезают, стандартный дисплей компьютера sRGB

 301
 00:22:22,784 --> 00:22:28,419
 по-прежнему использует нелинейную кривую интенсивности, схожую с телевизионной, с линейным законом в области черного,

 302
 00:22:28,419 --> 00:22:32,491
 с экспоненциальной кривой со значением гаммы 2,4.

 303
 00:22:32,491 --> 00:22:36,636
 Это кодирует шестнадцатибитный линейный диапазон в восьми битах.

 304 
 00:22:37,580 --> 00:22:41,790
 В человеческом глазу есть три раздельных цветовых канала - красный, зеленый и синий,

 305
 00:22:41,790 --> 00:22:47,407
 и большинство дисплеев использует эти три цвета как компоненты смешивания, чтобы получить полный спектр цветов.

 306
 00:22:49,258 --> 00:22:54,190
 В печати, по той же причине, основными пигментами являются голубой (Cyan), пурпурный (Magenta) и Желтый (Yellow);

 307
 00:22:54,190 --> 00:22:59,381
 пигменты являются вычитаемыми, и каждый из этих пигментов вычитает один чистый цвет из отраженного света.

 308
 00:22:59,381 --> 00:23:05,682
 Голубой вычитает красный, пурпурный вычитает зеленый, а желтый вычитает синий.

 309
 00:23:05,682 --> 00:23:10,919
 Видео может, и иногда бывает, представлено красным, зеленым и синим каналами,

 310
 00:23:10,919 --> 00:23:17,211
 но RGB-видео нетипично. Человеческий глаз намного более чувствителен к яркости, нежели к её цвету,

 311
 00:23:17,211 --> 00:23:21,329
 а RGB стремится распределять энергию на изображение равномерно по всем трем каналам.

 312
 00:23:21,329 --> 00:23:25,326
 Посмотрите, красная плоскость выглядит как красная версия оригинально изображения,

 313
 00:23:25,326 --> 00:23:28,769
 зеленая плоскость выглядит как зеленая версия оригинального изображения,

 314
 00:23:28,769 --> 00:23:32,063
 а синяя плоскость выглядит как синяя версия оригинально изображения.

 315
 00:23:32,063 --> 00:23:35,705
 Черно-белый в тройном объеме. Неэффективно.

 316
 00:23:35,706 --> 00:23:39,438
 По этой причине и потому, что телевидение изначально все равно было черно-белым,

 317
 00:23:39,438 --> 00:23:45,017
 видео обычно представляется как канал яркости высокого разрешения,

 318
 00:23:45,017 --> 00:23:51,041
 черно-белый, вместе с дополнительными, зачастую с меньшим разрешением, каналами цвета.

 319
 00:23:51,041 --> 00:23:57,074
 Канал яркости, Y, получают взвешиванием, а затем сложением отдельных, красного, зеленого и синего сигналов.

 320
 00:23:57,074 --> 00:24:01,867
 Каналы насыщенности (цвета) U и V потом получают вычитанием сигнала яркости из синего,

 321
 00:24:01,867 --> 00:24:04,070
 и вычитанием сигнала яркости из красного.

 322
 00:24:04,070 --> 00:24:11,750
 Когда YUV масштабируется, смещается и дискретизируется для цифрового видео, его на самом деле правильнее называть Y'CbCr,

 323
 00:24:11,750 --> 00:24:15,238
 но более общий термин YUV широко распространен для описания

 324
 00:24:15,238 --> 00:24:18,301
 всех аналоговых и цифровых вариантов данной цветовой модели.

 325
 00:24:18,912 --> 00:24:22,983
 Цветовые каналы U и V могут быть того же разрешения, что и канал Y,

 326
 00:24:22,983 --> 00:24:28,674
 но, поскольку человеческий глаз имеет куда худшее пространственное разрешение насыщенности цвета, нежели разрешение яркости,

 327
 00:24:28,674 --> 00:24:34,346
 разрешение насыщенности обычно берется половиной или даже четвертью в горизонтальном направлении, вертикальном,

 328
 00:24:34,346 --> 00:24:39,528
 или обоих, обычно без какого-либо существенного влияния на качество видимого изображения.

 329
 00:24:39,528 --> 00:24:43,942
 Практически любой возможный вариант субдискретизации был использован в то или иное время,

 330
 00:24:43,942 --> 00:24:46,875
 но сегодня распространенными являются

 331
 00:24:46,875 --> 00:24:51,187
 4:4:4, который, в действительности вообще не субдискретизируется,

 332
 00:24:51,187 --> 00:24:56,711
 4:2:2, в котором горизонтальное разрешение каналов U и V делится пополам,

 333
 00:24:56,711 --> 00:25:02,587
 и наиболее общепринятый из всех, 4:2:0, при котором и горизонтальное и вертикальное разрешения

 334
 00:25:02,587 --> 00:25:08,897
 каналов насыщенности делятся пополам, что приводит к тому, что каждая из плоскостей U и V в четыре раза меньше Y.

 335
 00:25:08,897 --> 00:25:17,096
 Термины 4:2:2, 4:2:0, 4:1:1 и т.д., и т.п. не являются полными описаниями субдискретизации насыщенности.

 336
 00:25:17,096 --> 00:25:21,186
 Существует несколько возможных способов позиционирования пикселей насыщенности относительно пикселей яркости,

 337
 00:25:21,096 --> 00:25:24,776 
 и опять, есть несколько активно используемых для каждой субдискретизации.

 338
 00:25:24,776 --> 00:25:32,502
 Например, motion JPEG, MPEG-1 video, MPEG-2 video, DV, Theora и WebM, все используют

 339
 00:25:32,502 --> 00:25:38,137
 или могут использовать субдискретизацию 4:2:0, но они располагают цветовые пиксели  тремя разными способами.

 340
 00:25:38,498 --> 00:25:43,023
 Motion JPEG, MPEG1 video, Theora и WebM располагают пиксели насыщенности

 341
 00:25:43,023 --> 00:25:46,345
 горизонтально и вертикально между пикселями яркости.

 342
 00:25:46,345 --> 00:25:51,989
 MPEG2 располагает пиксели насыщенности между линий, но горизонтально выравнивает их с каждым пикселем яркости.

 343
 00:25:51,989 --> 00:25:57,106
 Режимы с интерлейсингом несколько все усложняют, размещая их немного странно.

 344
 00:25:57,106 --> 00:26:00,909
 И наконец, PAL-DV, который всегда использует интерлейсинг, размещает пиксели насыщенности

 345
 00:26:00,909 --> 00:26:04,398
 в горизонтальном направлении в том же положении, что и пиксели яркости,

 346
 00:26:04,398 --> 00:26:07,303
 а вертикально чередует канал насыщенности в каждой линии.

 347
 00:26:07,683 --> 00:26:12,282
 И это все - только видео 4:2:0. Я оставлю остальные варианты субдискретизации как домашнее задание зрителю.

 348
 00:26:12,282 --> 00:26:14,882
 У вас есть основная идея, двигайтесь дальше.

 349
 00:26:15,511 --> 00:26:21,128
 В аудио мы обычно представляем несколько каналов в потоке ИКМ, чередуя по порядку

 350
 00:26:21,128 --> 00:26:26,383
 семплы каждого канала. Видео использует как запакованные форматы, которые чередуют цветовые каналы,

 351
 00:26:26,383 --> 00:26:30,584
 так и плоские форматы, которые хранят пиксели из каждого канала вместе в отдельных плоскостях,

 352
 00:26:30,584 --> 00:26:35,415
 составленных по порядку в кадре. Существуют как минимум 50 различных форматов в этих двух больших категориях,

 353
 00:26:35,415 --> 00:26:41,549
 возможно десять или пятнадцать из которых широко используются. Каждая субдискретизация насыщенности и

 354
 00:26:41,549 --> 00:26:46,574
 разная битность требуют разного порядка упаковки, а потому и разного формата пикселей. Для каждой уникальной субдискретизации

 355
 00:26:46,574 --> 00:26:50,858 
 обычно также существует несколько эквивалентных форматов, состоящих из тривиальных перестановок или перепаковок

 356
 00:26:50,858 --> 00:26:55,966
 порядка каналов, связанных либо с удобством на определённом железе в определенном случае

 357
 00:26:55,966 --> 00:27:00,352
 либо, иногда, просто из-за упрямства.

 358
 00:27:00,352 --> 00:27:04,692
 Пиксельные форматы описываются уникальным названием четырехсимвольного кода (FourCC).

 359
 00:27:04,692 --> 00:27:08,115
 Их существует довольно много, и нет смысла сейчас приводить их все.

 360
 00:27:08,115 --> 00:27:13,704
 Google ваш друг. Имейте в виду, что коды FourCC для сырого видео определяют порядок пикселей

 361
 00:27:13,704 --> 00:27:20,339
 и субдискретизации насыщенности, но в общем случае не говорят ничего конкретного о размещении пикселей насыщенности или пространстве цветов.

 362
 00:27:20,339 --> 00:27:25,807
 Для примера, YV12 video может использовать размещение JPEG, MPEG-2 или DV,

 363
 00:27:25,807 --> 00:27:28,991
 а также любой из нескольких определений пространств цвета YUV.

 364
 00:27:29,472 --> 00:27:33,913
 Это завершает наше не столь быстрое и ещё не совсем законченное путешествие в сырое видео.

 365
 00:27:33,913 --> 00:27:38,651
 Хорошие новости в том, что мы уже можем выполнить достаточно много настоящей работы, опираясь на данный обзор.

 366
 00:27:38,651 --> 00:27:42,528
 Во множестве ситуаций, кадр видеоданных является кадром видеоданных.

 367
 00:27:42,528 --> 00:27:46,451
 Детали приобретают значение, когда приходит время писать программы,

 368
 00:27:46,452 --> 00:27:52,086
 а сейчас я удовлетворен тем, что уважаемый зритель широко осведомлен в соответствующих вопросах.

 369
 00:27:55,640 --> 00:27:59,230
 Итак. У нас есть аудиоданные. У нас есть видеоданные.

 370
 00:27:59,230 --> 00:28:03,246
 Что осталось - так более знакомые не-сигнальные данные и непосредственное проектирование

 371
 00:28:03,246 --> 00:28:07,410
 программного обеспечения, используемого разработчиками. И многое из всего этого!

 372
 00:28:07,928 --> 00:28:11,768 
 Цепочки данных сырого аудио или видео не имеют внешней видимой структуры,

 373
 00:28:11,768 -->  00:28:15,173
 но они часто имеют одинаковый размер. Мы можем просто выстроить их вместе

 374
 00:28:15,173 --> 00:28:18,097
 в жестком предопределенном порядке для стримминга или хранения,

 375
 00:28:18,097 --> 00:28:21,040
 и многие простые системы делают примерно то же самое.

 376
 00:28:21,040 --> 00:28:24,195
 С другой стороны, сжатые кадры не обязательно имеют предсказуемый размер,

 377
 00:28:24,195 --> 00:28:29,405
 и нам часто может требоваться некоторая гибкость в использовании данных ряда различных типов в потоках.

 378
 00:28:29,405 --> 00:28:34,281
 Если мы расположим произвольные бесформенные данные вместе, мы потеряем границы, разделяющие кадры

 379
 00:28:34,281 --> 00:28:37,871
 и не сможем при необходимости узнать, какие данные к какому потоку относятся.

 380
 00:28:37,871 --> 00:28:42,192
 Потоку необходима некоторая обобщенная структура, чтобы он был полезен.

 381
 00:28:42,192 --> 00:28:46,606
 В дополнение к нашим сигнальным данным, у нас также есть наши параметры ИКМ и видео.

 382
 00:28:46,606 --> 00:28:49,752
 Также существует множество других метаданных, с которыми мы также хотим работать,

 383
 00:28:49,752 --> 00:28:55,415
 таких как аудио теги и главы видео, субтитры - все естественные компоненты rich media.

 384
 00:28:55,415 --> 00:29:01,633
 Имеет смысл располагать эти метаданные, другими словами данные о данных, внутри самого носителя.

 385
 00:29:01,633 --> 00:29:06,445
 Хранение и структурирование бесформенных данных и разнородных метаданных - это работа контейнера.

 386
 00:29:06,445 --> 00:29:09,221
 Контейнеры предоставляют структурирование blob'ов (бинарных блоков) данных,

 387
 00:29:09,221 --> 00:29:12,015
 чередование и идентификацию множества потоков данных,

 388
 00:29:12,015 --> 00:29:15,337
 предоставляют информацию синхронизации и хранят метаданные, необходимые

 389
 00:29:15,337 --> 00:29:19,140
 для разбора, навигации, управления и представления данных

 390
 00:29:19,140 --> 00:29:22,222
 В общем, любой контейнер может содержать любой вид данных.

 391
 00:29:22,222 --> 00:29:24,970
 И данные могут размещаться в любом контейнере.

 392
 00:29:28,801 --> 00:29:32,391 
 За последние тридцать минут мы охватили цифровое аудио и видео,

 393
 00:29:32,391 --> 00:29:35,435
 немного истории и математики и немного проектирования.

 394
 00:29:35,435 --> 00:29:39,377
 Мы только начали, но пришло время для заслуженного перерыва.

 395
 00:29:41,107 --> 00:29:45,373
 Есть ещё так много, о чем стоит поговорить, поэтому я надеюсь, что вы присоединитесь ко мне снова в нашем следующем эпизоде.

 396
 00:29:45,373 --> 00:29:47,159
 До тех пор--- Пока!