Распечатать запись Распечатать запись

Математика, которая стоит за MP3, JPEG и портретом Гомера Симпсона

Аатиш Бхатия

Девять лет назад в колледже я слушал курс математической физики, и мой преподаватель рассказал об идее, которая потрясла мое воображение. Я думаю, не будет преувеличением сказать, что это одно из самых широко применяемых математических открытий, оно используется начиная от оптики и заканчивая квантовой физикой, радиоастрономией, MP3 и сжатием JPEG, рентгеновской кристаллографией, распознаванием голоса и ПЭТ (позитронно-эмиссионной томографией) или МРТ (магнитно-резонансной томографией). Этот математический инструмент, называемый преобразованием Фурье в честь французского физика и математика 18-го века Жозефа Фурье, использовали даже Джеймс Уотсон и Фрэнсис Крик, чтобы декодировать структуру двойной спирали ДНК по рентгенограммам, полученным Розалинд Франклин. (Крик был экспертом по преобразованиям Фурье, он шутил о написании статьи под названием “Преобразование Фурье для орнитологов’’, чтобы объяснить математику Уотсону, заядлому птицеводу.)

Вы, вероятно, каждый день используете идеи, ведущие происхождение от Фурье, когда слушаете MP3, просматриваете изображения в Интернете, звоните на радио или настраиваетесь на радиостанцию. (Фурье, кстати, не было бездельником. Кроме своей работы в области теоретической физики и математики, он первым открыл парниковый эффект.)

Так что же такое открыл Фурье, и чем оно полезно? Представьте себе, что вы играете на фортепиано. При нажатии клавиши молоток ударяет по струне, которая вибрирует на определенной фиксированной частоте (440 раз в секунду для ноты ля, например). Когда струна вибрирует, молекулы воздуха вокруг нее прыгают взад и вперед, создавая волну колышущихся молекул воздуха, которую мы называем звуком. Если бы вы могли наблюдать, как воздух совершает этот периодический танец, вы бы увидели непрерывную волнообразную бесконечно повторяющуюся кривую, которая называется синусоидой. (Пояснение. В примере фортепиано в действительности получается более одной синусоиды. Богатство реального звучания происходит из-за присутствия многих более мягких обертонов, которые получаются в дополнение к основной синусоиде. Звучание фортепианной ноты можно аппроксимировать синусоидой, но более подходящий пример звука, который хорошо аппроксимируется одной синусоидой, дает камертон.)

Звук клавиши фортепиано может быть изображен простой синусоидой

Теперь вместо одной клавиши вы играете, скажем, три клавиши вместе, звучит аккорд. В результате звуковая волна не столь симпатична — это похоже на сложный беспорядок. Но скрытая в этом беспорядке звуковая волна имеет простую структуру. В конце концов, всего три клавиши звучали вместе, и такая беспорядочная звуковая волна, которая получилась, на самом деле просто складывается из трех нот (или синусоид).

Звук аккорда как сумма трех простых звуков

Идея Фурье состояла в том, что мы имеем не просто особое свойство музыкальных аккордов, но общее свойство любой повторяющейся волны — квадратной, круглой, извилистой, треугольной, какой угодно. Преобразование Фурье как математическая призма — вы подаете на вход волну и на выходе получаете ингредиенты этой волны, то есть ноты (или синусоиды), при суммировании которых получается данная волна.

Если это звучит для вас немного абстрактно, вот несколько различных способов визуализации идей Фурье. Первый способ принадлежит Лукасу В. Барбоса, бразильскому студенту-физику, который посвящает свое время тому, чтобы сделать фантастические анимации по математике и естественным наукам для Википедии, (его ник LucasVB ). Так давайте же возьмем квадратную по виду волну, пропустим ее через призму Фурье и посмотрим, что получится.

На этих рисунках красная квадратная волна переходит в набор чистых звуков (синие синусоиды). Представляйте себе эти синие волны математическими ингредиентами красной волны. Следуя этой аналогии, преобразование Фурье является рецептом — он точно говорит, сколько каждого звука нужно смешать вместе, чтобы восстановить исходную волну. Вертикальные синие линии на рисунке по существу являются визуальным представлением количества каждого звука.

Вот еще один способ представить это, придуманный Мэтью Хендерсоном, или Matthen , аспирантом Кембриджского университета, который также создает анимированные GIF-файлы, представляющие различные любопытные вещи из математики. Matthen объясняет идею Фурье, используя окружности вместо синусоиды. Имеется набор окружностей различных размеров, центр каждой из которых находится на окружности большего радиуса. Окружности начинают вращаться, вокруг больших окружностей вращаются меньшие, маленькие вращаются быстрее, чем большие. Если проследить движение одной точки наименьшей окружности, можно получить волну любой формы, как показано на анимации и ниже. Опять же, преобразование Фурье говорит, как построить волну: какие окружности должны двигаться с какой скоростью.

Если вы знаете о спирографе, идея представления сложных моделей с помощью кругов может быть вам знакома. Вот это интерактивная версия той же анимации, созданной LucasVB, где вы можете попробовать создавать модели сами, изменять размеры кругов.

Итак, преобразование Фурье говорит вам, сколько каждый ингредиент звука (синусоида или круг) вносит вклад в общую волну. И вот почему идея Фурье полезна. Представьте, что вы говорили с вашим другом по телефону и вы хотите нарисовать такую квадратную волну. Утомительный способ сделать это — зачитать длинный список цифр, которые представляют высоту волны в каждый момент времени. Зная все эти цифры, ваш друг может терпеливо воссоздать исходную волну. Так, по существу, работают старые аудио форматы, такие как WAV. Но если ваш друг знает преобразование Фурье, вы можете сделать нечто лучшее: вы можете просто назвать чисел — размеров различных кругов на картинке, которая приведена выше. Затем можно использовать данную картинку с кругами для восстановления исходной волны.

И это не просто какой-то мутный математический фокус. Преобразование Фурье дает почти все, что делают волны. Вездесущий MP3 формат использует вариант преобразования Фурье для достижения огромной степени сжатия по сравнению с WAV(произносится как wave — “волна’’) файлами, которые предшествовали ему. MP3 разбивает песню на короткие сегменты. Для каждого звукового сегмента преобразование Фурье разбивает звуковые волны на ее ингредиенты — ноты, которые затем хранятся вместо исходной волны. Преобразование Фурье также дает информацию, какой вклад каждая нота дает в песню, так что вы знаете, какие из них являются существенными. По-настоящему высокие ноты не так важны (наши уши могут с трудом их слышать), МР3 выбрасывает их, в результате чего сжатие данных усиливается. Меломанам МР3 по этой причине не нравится — этот аудио формат допускает потери, и они утверждают, что слышат разницу.

Таким же образом приложение для смартфона Shazam распознает песни. Оно разбивает музыку на куски, а затем использует преобразование Фурье для нахождения звуковых ингредиентов, которые составляют каждый кусок. Затем оно в базе данных ищет, с какой песней совпадает полученный “отпечаток пальца’’, полученный из файла. Распознавание речи использует ту же идею отпечатков Фурье — сравнение звуков в речи со звуками из известного списка слов.

Вы можете даже использовать преобразование Фурье для изображений. Вот отличное видео, которое показывает, как можно использовать круги, чтобы нарисовать Гомера Симпсона. Он-лайн энциклопедия Wolfram Alpha использует подобную идею для того, чтобы нарисовать лица известных людей. Это может показаться фокусом, который вы прибережете для вечеринки с яйцеголовыми, но это также используется для сжатия изображений в формате JPEG. В старые времена на Microsoft Paint изображения были растровыми и хранились в BMP-файлах, которые были длинными списками чисел, кодирующих цвет каждого пикселя. JPEG — это формат MP3 для изображений. Чтобы построить JPEG, сначала изображение делится на мелкие квадраты 8 на 8 пикселей. Для воссоздания каждого куска изображения используется та же идея кругов, которые воссоздают лицо Гомера Симпсона. Так же, как МР3 отбрасывает действительно высокие ноты, в формате JPEG отбрасываются крошечные круги. В результате получается огромное уменьшение размера файла с небольшим снижением качества, эта идея привела к визуальному он-лайн миру, который мы все любим (и что в конечном итоге дало нам анимированные GIF-файлы).

Как преобразование Фурье используются в науке? Ученые используют преобразование Фурье для изучения колебаний погружаемых структур, взаимодействующих с жидкостями, для попыток предсказать будущие землетрясения, для определения состава очень далеких галактик, для поиска новой физики в тепловых остатках Большого Взрыва, для определения структуры белков по рентгеновской дифракционной картине, для анализа цифровых сигналов для НАСА, для изучения акустики музыкальных инструментов, для уточнения модели круговорота воды, для поиска пульсаров (вращающихся нейтронных звезд) , и для выяснения структуры молекул с помощью ядерного магнитного резонанса. Преобразование Фурье даже использовалось для идентификации фальшивых картин Джексона Поллока с помощью определения химического состава красок.

Вот так! Это довольно много для одного маленького математического трюка.

Источник: http://nautil.us/blog/the-math-trick-behind-mp3s-jpegs-and-homer-simpsons-face

Оставьте свой отзыв

Добавить изображение