«Как работает музыка»

Музыку охотно исследуют с точки зрения ее воздействия на эмоции и восприятие человека, но это — только один из возможных подходов к явлению. В книге «Как работает музыка», переведенной на русский язык Евгением Искольским, бывший лидер рок-группы Talking Heads Дэвид Бирн сосредотачивается на том, как множество факторов — от способа записи до места исполнения и модели распространения — определяют, будет ли музыкальное произведение работать. N + 1 предлагает своим читателям ознакомиться с отрывком, посвященным рождению технологии оцифровки звука и последующим инновациям в сфере аудиозаписи и не только.

Как технологии меняют музыку: цифра

Недавно мне довелось услышать на симпозиуме выступление специалиста в области компьютерных наук Джарона Ланье. Сыграв несколько пьес на китайской губной гармошке шэн, он рассказал про ее удивительное и богатое наследие. Он утверждал, что этот инструмент был, возможно, первым, в котором звучащие ноты выбирались механизмом, созданным раньше бинарной теории и, следовательно, прежде всех компьютеров.

Этот древний инструмент нашел свой путь в Рим по Шелковому пути, и Римская империя, вполне в духе империи, заказала постройку гигантского аналога. Чтобы играть на этом огромном инструменте, музыканту требовался помощник качать воздух — в такую штуковину ртом дуть бессмысленно, и, что важнее, у великана имелся ряд рычагов, которыми и определялись ноты. Эта система породила, по сути, первые клавишные инструменты, а именно ряд рычагов, которые используются для воспроизведения нот у органов (также большой духовой инструмент) и фортепиано. Со временем эта система вдохновила француза Жозефа Мари Жаккара, и он в 1801 году изобрел ткацкий станок, сложные узоры которого задавались перфокартами. Можно было управлять дизайном ткани, нанизывая перфокарты одну за другой.

Десятилетия спустя жаккардовый ткацкий станок, в свою очередь, вдохновил Чарльза Бэббиджа, владевшего одним из автопортретов Жаккара, вытканным на шелке с помощью этих перфокарт. Бэббидж придумал «аналитическую машину» — вычислительную машину, которая, будь она построена, также управлялась бы перфокартами. В версии Бэббиджа перфокарты контролировали уже не нити: он совершил скачок к двоичной абстракции, математическим вычислениям. Юная подруга Бэббиджа Ада Байрон (дочь поэта) пришла в восторг от устройства, а в ХХ веке, спустя много лет после ее смерти, Аду стали прославлять как первого программиста. Таким образом, по словам Ланье, наш нынешний компьютерный мир обязан своим происхождением музыкальному инструменту. И компьютерные технологии, вскоре после того, как они появились, в свою очередь, повлияли на музыку.

Технология, которая позволила оцифровывать звуковую информацию (а вскоре и всю остальную информацию), была в значительной степени разработана телефонной компанией. Bell Labs (исследовательскому подразделению Bell Telephone Company) было поручено найти более эффективные и надежные способы передачи разговоров. До 1960-х годов все телефонные линии были аналоговыми, и количество разговоров, которые можно было обрабатывать одновременно, было ограничено. Единственный способ протолкнуть больше звонков через линии состоял в том, чтобы подрезать высокие и низкие частоты в  звуке голоса, а  затем превратить полученный низкокачественный звук в волны, которые могли бы перемещаться параллельно, не мешая друг другу — так же как это происходит с наземными радиопередачами.

Bell Labs имела огромный штат и породила множество новых изобретений: транзисторы и полупроводники, которые образуют интегральные схемы на основе кремния (что делает возможными современные крошечные устройства), лазер, микроволновые технологии и солнечные панели — список на этом не заканчивается. Монополист может себе позволить тратиться на исследования и разработки, и у компании хватало для этого и возможностей, и дальновидности. Ученые и инженеры могли работать над проектом, который не давал результатов в течение десятка лет.

В 1962 году Bell Labs выяснила, как оцифровать звук: по сути, взять образец звуковой волны и нарезать его на крошечные кусочки, которые можно разбить на единицы и нули. Когда это удалось, причем таким способом, который не был чрезмерно дорогим и который все еще оставлял человеческий голос узнаваемым, телефонщики немедленно применили эту технологию для того, чтобы сделать междугородние линии более эффективными. Теперь удавалось осуществлять больше звонков одновременно, так как голоса превратились в поток единиц и нулей, который можно было протиснуть (с помощью кодирования и транспонирования) в телефонные кабели. Это было особенно актуально, учитывая ограничения, связанные с  подводными телефонными кабелями: нельзя просто взять и проложить еще больше линий, если бы вдруг оказалось, что больше людей хотят позвонить из США во Францию. Голос — в абстрактном смысле — это своего рода информация, с точки зрения Белла. Поэтому бóльшая часть исследований, изучавших, что делает передачу понятной и как можно сжать больше передач, опиралась на науку об информации в сочетании с психоакустикой, то есть с изучением того, как мозг воспринимает звук во всех его аспектах. Иными словами, углубляющееся понимание того, как мы воспринимаем звук, сочеталось с поиском способов наиболее эффективно передавать информацию всех видов. Учитывался также и метавопрос: «А что вообще такое информация?»

Психоакустика применяется к  сирене машин скорой помощи (почему мы никогда не можем определить, откуда она воет?), к голосу и, конечно же, к музыке. Корень психо- подразумевает, что слух — явление не только механическое, но и умственное («умственное» в смысле мозговое, то есть мозг «слышит» столько же, сколько и ухо, к умственной отсталости или продвинутости это отношения не имеет).

Конечно, многое из того, что мы слышим, частично определяется и ограничивается механикой наших ушей. Мы знаем, что не можем услышать все высоко частотные звуки, которые издают летучие мыши, или полный спектр звуков, которые может слышать собака. Существуют и низкочастотные звуки, которыми общаются киты, их мы тоже не можем услышать, хотя они достаточно сильны, чтобы причинить нам физический вред, если мы находимся слишком близко к источнику.

Но есть вещи, не имеющие ничего общего с физикой барабанной перепонки и слухового прохода, которые мы «слышим». Мы можем, например, изолировать голос человека, говорящего с нами в шумной обстановке. Если слушать запись, сделанную в битком набитом ресторане, это звучит как акустический хаос, но иногда нам удается упорядочить его и вести застольную беседу. Мы перестаем спустя некоторое время обращать внимание на повторяющиеся звуки — шорох волн или шум то и дело проезжающих машин, к примеру. У нас есть возможность избирательно слышать только то, что нас интересует, а остальное превращать в далекий акустический фон. У нас также есть способность воспринимать повторы в том, что мы слышим. И это также не имеет никакого отношения к устройству ушей. Мы можем запомнить высоту тона, и некоторые люди с совершенным слухом могут точно определить ноты, услышанные вне музыкального контекста. Мы можем сказать, что визг тормозов электрички и самая высокая нота на кларнете одинаковы. Мы можем вспомнить последовательность звуков — пение птицы или скрип двери, сопровождаемый хлопком, — и точный тембр звуков. Порой мы узнаем голос друга, услышав лишь одно слово.

Как это работает? Можем ли мы смоделировать этот мыслительный процесс с помощью математической формулы или компьютерной программы? Как вы понимаете, именно такие вопросы — какой минимум информации требуется, чтобы узнать чей-то голос, например — имели первостепенное значение для сотрудников телефонной компании. Если бы они могли определить, что именно делает речь понятной и разборчивой, и выделить именно этот аспект, усовершенствовать его и контролировать, тогда, устранив все лишние элементы, они могли бы повысить эффективность телефонной системы. Цель состояла в том, чтобы люди общались все больше и больше, используя меньшее или то же самое количество механического и физического (электрического) материала. Такое увеличение потока информации принесло бы компании гораздо больше денег. Психоакустика в конечном счете привела к более глубокому пониманию механизма передачи информации. Эта загадочная наука внезапно оказалась чрезвычайно полезной.

Непредвиденным результатом этого исследования, изначально связанного с телефонией, стало рождение цифровой аудиотехнологии, которая стала применяться в том числе и в студиях звукозаписи. В 1970-е годы в студиях звукозаписи появился новый прибор размером с портфель. Это новое устройство называлось гармонайзером, и оно могло изменять высоту звука, не меняя его скорости или темпа (прежде, для того чтобы изменить высоту звука, требовалось ускорить ленту). Устройство разрезало звуковые волны на цифровые ломтики, математически транспонируя теперь уже просто числа, а затем восстанавливало их в виде звуков с более высоким или низким тоном. Ранние версии этих аппаратов звучали довольно глючно, но эффект был классным, даже когда не все получалось.

Примерно в то же время появились другие устройства, называемые цифровыми дилеями, которые по сути были примитивными семплерами. Цифровые семплы, которые они создавали для имитации акустического эха, обычно длились менее секунды и использовались для получения очень коротких эффектов задержки.

Затем последовали и  другие устройства, которые могли захватывать и удерживать более длинные звуковые образцы с бóльшим разрешением, а некоторые могли свободно манипулировать этими «звуками» (на самом деле — числами). И тут начались всякие причуды. Bell Labs была вовлечена в производство звукового процессора-вокодера, который мог изолировать определенные аспекты речи или пения — речевые форманты (формы звуков, которые мы используем для формирования слов). Это устройство может удалить эти аспекты нашей речи или пения из тона, изолируя только перкуссионные звуки «т» и «б» и шипящие «с» и «ф». Устройство могло передавать эти формантные аспекты голоса отдельно от остальной вокализации, и получалась тарабарщина, но компоненты разумной речи все еще присутствовали. Элементы звучания речи или пения были деконструированы и обретали смысл, когда их собирали заново. Прекрасная идея, но какой в этом толк? Одним из применений этой технологии была своего рода криптология для голоса: искаженная бессмыслица могла быть «расшифрована» на другом конце, при условии что было известно, чего не хватает. Эти устройства также стали использоваться при производстве музыки. Ниже — сделанный на заказ вокодер немецкой группы Kraftwerk.

Вокодер обычно использовался для смешения изолированных и разделенных речевых формантов со звуком инструмента определенной высоты. Таким образом получалось, что инструмент словно говорил или пел. Часто «голос» звучал несколько роботизированно, что, вероятно, и привлекало Kraftwerk. Мне однажды довелось опробовать такой вокодер. Я  позаимствовал его у Берни Краузе, музыканта и пионера ранней синтезаторной музыки, с которым я познакомился, когда мы с Брайаном Ино записывали альбом My Life in the Bush of Ghosts. Вокодер на вид был красив, но оказался довольно сложным в использовании и очень дорогим.

Первые модели гармонайзеров (цифровых приборов, меняющих высоту звука) стоили тысячи долларов. Хороший цифровой ревербератор обошелся бы студии, возможно, в 10 000 долларов, а полноценный семплер, наподобие вскоре появившихся Fairlight и Synclavier, стоил и того дороже. Впрочем, вскоре цена на память и обработку данных упала, и технология стала более доступной. Недорогие семплеры Akai стали опорой хипхопа и  DJ-миксов, придя на  замену ранее использовавшемуся винилу, а семплированные или цифровые звуки барабанов заняли во многих записях место живых барабанщиков. Начиналось веселье, результат которого предсказать было невозможно.

С появлением оцифровки звука стала возможной цифровая запись, и потребителям был предложен новый формат: компакт-диск (CD). Целые альбомы были разобраны на мелкие частички — единицы и нули. Вскоре после этого емкость памяти и  скорость домашних компьютеров стали достаточными для записи, хранения и обработки музыки. И все это выросло из желания Bell Labs повысить эффективность телефонных линий.

Bell Labs позднее превратились в компанию Lucent. Я посетил их лаборатории в середине 1990-х, и мне показали процессор, который мог сжать то, что на слух обладало CD-качеством, до крошечной полосы пропускания. Кажется, к тому времени кодирование музыки в формат MP3 уже было изобретено в Германии, поэтому этот чрезвычайно эффективный трюк сжатия / кодирования не был полной неожиданностью. И конечно же, неудивительно, что сжатие большего количества звуковой информации в меньшие объемы по-прежнему оставалось приоритетом для телефонной компании. Но, как и многие другие, я беспокоился, что при этом процессе снижения разрешения пострадает и качество музыки.

И я был прав. Ранние узкополосные цифровые файлы звучали немного странно, как будто чего-то невыразимого не хватало. Было трудно понять, почему именно они звучали неправильно. Все частоты, казалось, были на месте, но что-то словно пропало, было высосано в процессе конвертации. Зомбимузыка. Записи MP3 с тех пор заметно улучшились, и теперь я слушаю бóльшую часть музыки именно в этом формате. Насколько я понимаю, разработки Lucent в конечном итоге нашли применение в спутниковых радиопередачах: при меньшей полосе пропускания спутник может передавать по множеству каналов звук CD-качества. Аналогичная обработка применялась к фотографиям и видеосигналам, что позволяет стримить* фильмы без излишней зернистости или пикселизации.

*
stream

В 1988 году мне довелось одному из первых взглянуть на эту технологию в применении к визуальной информации, когда мы с дизайнером Тибором Калманом посетили полиграфическую студию на Лонг-Айленде. В студии была машина, которая могла оцифровывать изображения, а затем тонко манипулировать ими (мы хотели «улучшить» изображение, предназначенное для обложки альбома Talking Heads). Как и первые компьютеры и оборудование звукозаписывающей студии, этот аппарат был невероятно дорогим и редким. Мы сами должны были прийти к нему (его нельзя было принести в студию дизайна), и, кроме того, потребовалось заранее бронировать время. Кажется, этот аппарат назывался Sytex. Хотя он и произвел на нас впечатление, его стоимость и редкость не позволяли нам даже мечтать о его использовании в новых проектах.

Через некоторое время, как и в случае с семплированием, цена сканирования изображений упала, а манипулирование изображениями с помощью Photoshop стало обычным делом. Да, до  сих пор остаются приверженцы пленки, и я не сомневаюсь, что, как и с MP3, что-то было утрачено при переходе на цифровые изображения, но для большинства из нас компромисс приемлем и кажется неизбежным. Излишне говорить, что по мере оцифровки изображений они попадают в поток сетевых данных. Образы все чаще предстают в виде последовательности единиц и нулей — они стали информацией, как и все остальное. Оцифровка всех видов медиа позволила интернету стать таким, какой он есть — чем-то гораздо большим, чем просто средой для передачи текстовых документов. Разделение контента на малые элементы позволило широкому спектру средств массовой информации пойти по тому же пути, и в некотором смысле мы обязаны всеми фотографиями, звуками, песнями, играми и фильмами, которые являются частью нашего интернет-опыта, телефонной компании, информатике и психоакустике.

Подробнее читайте:
Бирн, Д. Как работает музыка / Дэвид Бирн ; Пер. с англ. [Евгения Искольского] — М.: Альпина нонфикшн, 2020. — 400 с.