На пути к теории всего

Что такое действие и почему физики все время о нем говорят

Дмитрий Трунин

Как современные физики-теоретики разрабатывают новые теории, описывающие мир? Что такого они добавляют к квантовой механике и общей теории относительности, чтобы построить «теорию всего»? О каких ограничениях идет речь в статьях, говорящих про отсутствие «новой физики»? На все эти вопросы можно ответить, если разобраться, что такое действие — объект, лежащий в основе всех существующих физических теорий. В этой статье я расскажу, что физики понимают под действием, а также покажу, как с его помощью можно построить настоящую физическую теорию, используя всего несколько простых предположений о свойствах рассматриваемой системы.

Сразу предупреждаю: в статье будут формулы и даже несложные вычисления. Впрочем, их вполне можно пропускать без большого вреда для понимания. Вообще говоря, я привожу здесь формулы только для тех заинтересованных читателей, которые непременно хотят разобраться во всем самостоятельно.

Уравнения

Физика описывает наш мир с помощью уравнений, связывающих вместе различные физические величины — скорость, силу, напряженность магнитного поля и так далее. Практически все такие уравнения являются дифференциальными, то есть содержат не только функции, зависящие от величин, но и их производные. Например, одно из самых простых уравнений, описывающее движение точечного тела, содержит вторую производную от его координаты:

Здесь я обозначил вторую производную по времени двумя точками (соответственно, одной точкой будет обозначаться первая производная). Конечно же, это второй закон Ньютона, открытый им в конце XVII века. Ньютон одним из первых осознал необходимость записывать уравнения движения в такой форме, а также разработал дифференциальное и интегральное исчисление, необходимое для их решения. Разумеется, большинство физических законов гораздо сложнее, чем второй закон Ньютона. Например, система уравнений гидродинамики настолько сложна, что ученые до сих пор не знают, разрешима она в общем случае или нет. Проблема существования и гладкости решений этой системы даже входит в список «проблем тысячелетия», и математический институт Клэя назначил за ее решение приз в один миллион долларов.

Однако как же физики находят эти дифференциальные уравнения? В течение долгого времени единственным источником новых теорий был эксперимент. Другими словами, первым делом ученый проводил измерения нескольких физических величин, и только потом пытался определить, как они связаны. Например, именно таким образом Кеплер открыл три знаменитых закона небесной механики, которые впоследствии привели Ньютона к его классической теории тяготения. Получалось, что эксперимент как будто «бежит впереди теории».

В современной же физике дела устроены немного по-другому. Конечно, эксперимент до сих пор играет в физике очень важную роль. Без экспериментального подтверждения любая теория является всего лишь математической моделью — игрушкой для ума, не имеющей отношения к реальному миру. Однако сейчас физики получают уравнения, описывающие наш мир, не эмпирическим обобщением экспериментальных фактов, а выводят их «из первых принципов», то есть на основании простых предположений о свойствах описываемой системы (например, пространства-времени или электромагнитного поля). В конечном счете, из эксперимента определяются только параметры теории — произвольные коэффициенты, которые входят в выведенное теоретиком уравнение. При этом ключевую роль в теоретической физике играет принцип наименьшего действия, впервые сформулированный Пьером Мопертюи в середине XVIII века и окончательно обобщенный Уильямом Гамильтоном в начале XIX века.

Действие

Что же такое действие? В самой общей формулировке действие — это функционал, который ставит в соответствие траектории движения системы (то есть функции от координат и времени) некоторое число. А принцип наименьшего действия утверждает, что на истинной траектории действие будет минимально. Чтобы разобраться в значении этих умных слов, рассмотрим следующий наглядный пример, взятый из Фейнмановских лекций по физике.

Допустим, мы хотим узнать, по какой траектории будет двигаться тело, помещенное в поле тяжести. Для простоты будем считать, что движение полностью описывается высотой x(t), то есть тело движется вдоль вертикальной прямой. Предположим, что мы знаем о движении только то, что тело стартует в точке x₁ в момент времени t₁ и приходит в точку x₂ в момент t₂, а полное время в пути составляет T = t₂ − t₁. Рассмотрим функцию L, равную разности кинетической энергии К и потенциальной энергии П: L = К − П. Будем считать, что потенциальная энергия зависит только от координаты частицы x(t), а кинетическая — только от ее скорости ẋ(t). Также определим действие — функционал S, равный среднему значению L за все время движения: S = ∫ L(x, ẋ, t) dt.

Очевидно, что значение S будет существенно зависеть от формы траектории x(t) — собственно, поэтому мы называем его функционалом, а не функцией. Если тело слишком высоко поднимется (траектория 2), вырастет средняя потенциальная энергия, а если оно станет слишком часто петлять (траектория 3), увеличится кинетическая — мы ведь предположили, что полное время движения в точности равно T, а значит, телу нужно увеличить скорость, чтобы успеть пройти все повороты. В действительности функционал S достигает минимума на некоторой оптимальной траектории, которая является участком параболы, проходящей через точки x₁ и x₂ (траектория 1). По счастливому стечению обстоятельств, эта траектория совпадает с траекторией, предсказанной вторым закон Ньютона.

Случайно ли это совпадение? Разумеется, не случайно. Чтобы показать это, предположим, что мы знаем истинную траекторию, и рассмотрим ее вариации. Вариация δx(t) — это такая добавка к траектории x(t), которая изменяет ее форму, но оставляет начальную и конечную точки на своих местах (смотри рисунок). Посмотрим, какое значение принимает действие на траекториях, отличающихся от истинной траектории на бесконечно малую вариацию. Раскладывая функцию L и вычисляя интеграл по частям, мы получаем, что изменение S пропорционально вариации δx:

Здесь нам пригодился тот факт, что вариация в точках x₁ и x₂ равна нулю — это позволило отбросить члены, которые появляются после интегрирования по частям. Получившееся выражение очень напоминает формулу для производной, записанную через дифференциалы. Действительно, выражение δS/δx иногда называют вариационной производной. Продолжая эту аналогию, мы заключаем, что при добавлении малой добавки δx к истинной траектории действие измениться не должно, то есть δS = 0. Поскольку добавка может быть практически произвольной (мы зафиксировали только ее концы), это означает, что подынтегральное выражение тоже обращается в ноль. Таким образом, зная действие, можно получить дифференциальное уравнение, описывающее движение системы, — уравнение Эйлера-Лагранжа.

Вернемся к нашей задаче с телом, перемещающимся в поле силы тяжести. Напомню, что мы определили функцию L как разность кинетической и потенциальной энергии тела. Подставляя это выражение в уравнение Эйлера-Лагранжа, мы действительно получаем второй закон Ньютона. В самом деле, наша догадка о виде функции L оказалась очень удачной:

Получается, что с помощью действия можно записывать уравнения движения в очень краткой форме, как будто «упаковывая» все особенности системы внутри функции L. Уже само по себе это достаточно интересно. Однако действие является не просто математической абстракцией, оно обладает глубоким физическим смыслом. В общем-то, современный физик-теоретик первым делом выписывает действие, а только потом выводит уравнения движения и исследует их. Во многих случаях действие для системы можно построить, делая только простейшие предположения о ее свойствах. Посмотрим, как это можно сделать, на нескольких примерах.

Свободная релятивистская частица

Когда Эйнштейн строил специальную теорию относительности (СТО), он постулировал несколько простых утверждений о свойствах нашего пространства-времени. Во-первых, оно является однородным и изотропным, то есть не меняется при конечных смещениях и поворотах. Другими словами, неважно, где вы находитесь — на Земле, на Юпитере или в галактике Малое Магелланово Облако — во всех этих точках законы физики работают одинаково. Кроме того, вы не заметите никаких отличий, если будете двигаться равномерно прямолинейно — в этом заключается принцип относительности Эйнштейна. Во-вторых, никакое тело не может превысить скорость света. Это приводит к тому, что привычные правила пересчета скоростей и времени при переходе между различными системами отсчета — преобразования Галилея — нужно заменить на более правильные преобразования Лоренца. В результате по-настоящему релятивистской величиной, одинаковой во всех системах отсчета, становится не расстояние, а интервал — собственное время частицы. Интервал s₁ − s₂ между двумя заданными точками можно найти с помощью следующей формулы, где c — скорость света:

Как мы увидели в предыдущей части, нам достаточно выписать действие для свободной частицы, чтобы найти ее уравнение движения. Разумно предположить, что действие является релятивистским инвариантом, то есть выглядит одинаково в разных системах отсчета, поскольку физические законы в них одинаковы. Кроме того, мы хотели бы, чтобы действие записывалось как можно проще (сложные выражения оставим на потом). Самый простой релятивистский инвариант, который можно связать с точечной частицей — это длина ее мировой линии. Выбирая этот инвариант в качестве действия (чтобы размерность выражения была правильной, умножим его на коэффициент −mc) и варьируя его, мы получаем следующее уравнение:

Проще говоря, 4-ускорение свободной релятивистской частицы должно быть равно нулю. 4-ускорение, как и 4-скорость — это обобщения понятий ускорения и скорости на четырехмерное пространство-время. В результате свободная частица может двигаться только вдоль заданной прямой с постоянной 4-скоростью. В пределе низких скоростей изменение интервала практически совпадает с изменением времени, а потому полученное нами уравнение переходит в уже обсуждавшийся выше второй закон Ньютона: mẍ = 0. С другой стороны, условие равенства нулю 4-ускорения выполняется для свободной частицы и в общей теории относительности, только в ней пространство-время уже начинает искривляться и частица не обязательно будет двигаться вдоль прямой даже при отсутствии внешних сил.

Электромагнитное поле

Как известно, электромагнитное поле проявляет себя во взаимодействии с заряженными телами. Обычно это взаимодействие описывают с помощью векторов напряженности электрического и магнитного поля, которые связаны системой из четырех уравнений Максвелла. Практически симметричный вид уравнений Максвелла наводит на мысль, что эти поля не являются независимыми сущностями — то, что кажется нам электрическим полем в одной системе отсчета, может превратиться в магнитное поле, если перейти в другую систему.

В самом деле, рассмотрим провод, по которому бегут с одинаковой и постоянной скоростью электроны. В системе отсчета, связанной с электронами, есть только постоянное электрическое поле, которое можно найти с помощью закона Кулона. Однако в исходной системе отсчета движение электронов создает постоянный электрический ток, который, в свою очередь, наводит постоянное магнитное поле (закон Био-Савара). В то же время, согласно с принципом относительности, в выбранных нами системах отсчета законы физики должны совпадать. Это значит, что и электрическое, и магнитное поля являются частями какой-то одной, более общей сущности.

Тензоры

Прежде чем мы перейдем к ковариантной формулировке электродинамики, стоит сказать несколько слов по поводу математики специальной и общей теории относительности. Важнейшую роль в этих теориях играет понятие тензора (да и в других современных теориях тоже, если честно). Если совсем грубо, то тензор ранга (n, m) можно представлять себе как (n+m)-мерную матрицу, компоненты которой зависят от координат и времени. Вдобавок к этому тензор должен определенным хитрым образом меняться при переходе из одной системы отсчета в другую или при изменениях координатной сетки. Как именно, определяет число контравариантных и ковариантных индексов (n и m соответственно). При этом сам тензор как физическая сущность при подобных преобразованиях не меняется — так же как не меняется при них 4-вектор, который является частным случаем тензора ранга 1.

Нумеруются компоненты тензора с помощью индексов. Для удобства различают верхние и нижние индексы, чтобы сразу видеть, как преобразуется тензор при смене координат или системы отсчета. Так, например, компонента тензора T ранга (3, 0) записывается как T^αβγ, а тензора U ранга (2, 1) — как U^α^β_γ. По сложившейся традиции, компоненты четырехмерных тензоров нумеруют греческими буквами, а трехмерных — латинскими. Впрочем, некоторые физики предпочитают делать наоборот (например, Ландау).

Кроме того, для краткости Эйнштейн предложил не писать знак суммы «Σ» при сворачивании тензорных выражений. Свертка — это суммирование тензора по двум заданным индексам, причем один из них обязательно должен быть «верхним» (контравариантным), а другой — «нижним» (ковариантным). Например, чтобы вычислить след матрицы — тензора ранга (1, 1) — нужно свернуть ее по двум имеющимся индексам: Tr[A_μ^ν] = Σ A_μ^μ = A_μ^μ. Поднимать и опускать индексы можно с помощью метрического тензора: T_αβ^γ = T_αβμ g^μγ.

Наконец, удобно ввести абсолютно антисимметричный псевдотензор ε^μνρσ — тензор, который меняет знак при любых перестановках индексов (например, ε^μνρσ = −ε^νμρσ) и у которого компонента ε¹²³⁴ = +1. Еще его называют тензором Леви-Чивита. При поворотах системы координат ε^μνρσ ведет себя как обычный тензор, однако при инверсиях (замене вроде x → −x) он преобразуется по-другому.

Действительно, векторы электрического и магнитного поля объединяются в такую структуру, которая является инвариантной относительно преобразований Лоренца — то есть не меняется при переходе между различными (инерциальными) системами отсчета. Это так называемый тензор электромагнитного поля F_μν. Нагляднее всего будет записать его в виде следующей матрицы:

Здесь компоненты электрического поля обозначены буквой E, а компоненты магнитного поля — буквой H. Легко видеть, что тензор электромагнитного поля является антисимметричным, то есть его компоненты, стоящие по разные стороны от диагонали, равны по модулю и имеют противоположные знаки. Если мы хотим получить уравнения Максвелла «из первых принципов», нам нужно выписать действие электродинамики. Чтобы сделать это, мы должны сконструировать самую простую скалярную комбинацию из имеющихся у нас тензорных объектов, так или иначе связанных с полем или со свойствами пространства-времени.

Если задуматься, выбор у нас невелик — в качестве «строительных блоков» может выступать только тензор поля F_μν, метрический тензор g_μν и абсолютно антисимметричный тензор ε^μνρσ. Из них можно собрать всего две скалярные комбинации, причем одна из них является полной производной, то есть ее можно не учитывать при выводе уравнений Эйлера-Лагранжа — после интегрирования эта часть просто обратится в ноль. Выбирая оставшуюся комбинацию в качестве действия и варьируя его, мы получим пару уравнений Максвелла — половину системы (первая строчка). Казалось бы, двух уравнений мы не досчитались. Однако на самом деле нам не нужно выписывать действие, чтобы вывести оставшиеся уравнения — они следуют напрямую из антисимметричности тензора F_μν (вторая строчка):

И снова мы получили правильные уравнения движения, выбрав в качестве действия простейшую возможную комбинацию. Правда, поскольку мы не учитывали существование зарядов в нашем пространстве, мы получили уравнения для свободного поля, то есть для электромагнитной волны. При добавлении зарядов в теорию их влияние тоже нужно учитывать. Это делается включением вектора 4-тока в действие.

Гравитация

Настоящим триумфом принципа наименьшего действия в свое время стало построение общей теории относительности (ОТО). Благодаря ему впервые были выведены законы движения, которые ученые не могли получить путем анализа экспериментальных данных. Или могли, но не успели. Вместо этого Эйнштейн (и Гильберт, если угодно) вывел уравнения на метрику, отталкиваясь от предположений о свойствах пространства-времени. Начиная с этого момента, теоретическая физика стала «обгонять» экспериментальную.

В ОТО метрика перестает быть постоянной (как в СТО) и начинает зависеть от плотности помещенной в нее энергии. Замечу, что корректнее говорить все-таки об энергии, а не о массе, хотя эти две величины связаны соотношением E = mc² в собственной системе отсчета. Напомню, что метрика задает правила, по которым вычисляется расстояние между двумя точками (строго говоря, бесконечно близкими точками). Важно, что метрика не зависит от выбора системы координат. Например, плоское трехмерное пространство можно описать с помощью декартовой либо сферической системы координат, но в обоих случаях метрика пространства будет совпадать.

Чтобы выписать действие для гравитации, нам нужно построить из метрики какой-нибудь инвариант, который не будет меняться при изменении координатной сетки. Самым простым таким инвариантом является детерминант метрики. Тем не менее, если мы включим в действие только его, мы не получим дифференциальное уравнение, поскольку это выражение не содержит производных метрики. А если уравнение не является дифференциальным, оно не может описывать ситуации, в которых метрика меняется со временем. Поэтому нам нужно добавить к действию простейший инвариант, который содержит производные g_μν. Таким инвариантом является так называемый скаляр Риччи R, который получается сверткой тензора Римана R_μνρσ, описывающего кривизну пространства-времени:

Сейчас это действие называют действием Эйнштейна-Гильберта. Добавляя в теорию материю и варьируя действие стандартным образом, мы получим знаменитое уравнение Эйнштейна (материя в нем учитывается с помощью тензора энергии-импульса T_μν). Это уравнение описывает все возможные гравитационные явления — в том числе движение планет вокруг Солнца, рождение черных дыр и расширение нашей Вселенной. К сожалению, в общем случае оно является очень сложным. В то же время, когда пространство-время искривляется очень слабо, теория Эйнштейна переходит в теорию Ньютона. Например, существенные поправки к движению Меркурия набираются примерно за сто лет, а для Земли их заметить практически невозможно. Поэтому при моделировании скоплений галактик, в которых средняя плотность материи невелика, астрофизики продолжают пользоваться приближением Ньютона.

Теория всего

Наконец, пришло время поговорить о «теории всего». Так называют несколько теорий, которые пытаются объединить ОТО и Стандартную модель — две основные известные на данный момент физические теории. Ученые предпринимают такие попытки не только из эстетических соображений (чем меньше теорий нужно для понимания мира — тем лучше), но и по более веским причинам.

И у ОТО, и у Стандартной модели есть границы применимости, после которых они перестают работать. Например, ОТО предсказывает существование сингулярностей — точек, в которых плотность энергии, а значит, и кривизна пространства-времени, стремится к бесконечности. Мало того, что бесконечности сами по себе малоприятны — вдобавок к этой проблеме Стандартная модель утверждает, что энергию невозможно локализовать в точке, ее нужно размазывать по некоторому, пусть и небольшому, объему. Поэтому вблизи сингулярности эффекты и ОТО, и Стандартной модели должны быть велики. В то же время ОТО до сих пор не удалось проквантовать, а Стандартная модель строится в предположении плоского пространства-времени. Если мы хотим понимать, что происходит около сингулярностей, нам нужно разработать теорию, которая будет включать в себя обе указанные теории.

Имея в виду, какой успех имел принцип наименьшего действия в прошлом, ученые основывают на нем все свои попытки построить новую теорию. Помните, мы рассматривали только самые простые комбинации, когда строили действие для различных теорий? Тогда наши действия увенчались успехом, но это вовсе не значит, что самое простое действие является самым правильным. Вообще говоря, природа не обязана подстраивать свои законы, чтобы упростить нашу жизнь.

Поэтому разумно включить в действие следующие, более сложные инвариантные величины и посмотреть, к чему это приведет. Чем-то это напоминает последовательное приближении функции многочленами все более высоких степеней. Проблема тут только в том, что все такие поправки входят в действие с некими неизвестными коэффициентами, которые нельзя вычислить теоретически. К тому же, поскольку Стандартная модель и ОТО в целом все-таки хорошо работают, эти коэффициенты должны быть очень маленькими — следовательно, их сложно определить из эксперимента. Многочисленные работы, сообщающие об «ограничениях на новую физику», как раз-таки направлены на определение коэффициентов при высших порядках теории. До сих пор им удалось найти только ограничения сверху.

С другой стороны, еще один способ построить «теорию всего» — нарушить правило «работает — не трогай». Другими словами, теоретики предполагают, что какой-то из постулатов существующих теорий не выполняется, и смотрят, что от этого изменится. Например, что получится, если снять с действия требование лоренц-инвариантности. В подобных случаях за основу новой теории также берется действие Стандартной модели или ОТО, а затем к нему дописывают нарушающие постулаты поправки. Коэффициенты при этих поправках тоже можно найти только из эксперимента, и на данный момент все, что у нас есть — очень сильные ограничения сверху. В данном случае «очень сильные» означает, что величина коэффициентов при поправках примерно на десять порядков меньше, чем величина коэффициентов при стандартных членах.

Кроме того, существуют подходы, вводящие новые, нетривиальные концепции. Например, теория струн предполагает, что свойства нашего мира можно описать с помощью колебаний не точечных, а протяженных объектов — струн. К сожалению, экспериментальные подтверждения теории струн до сих пор не найдены. Например, она предсказывала некоторые возбуждения на ускорителях, но они так и не проявились.

В общем, пока не похоже, что ученые близко подобрались к открытию «теории всего». Наверное, теоретикам все-таки придется придумывать что-то существенно новое. Впрочем, можно не сомневаться, что первым делом они выпишут для новой теории действие.

***

Если все эти рассуждения показались вам сложными и вы пролистали статью не читая, вот краткая выжимка тех фактов, которые в ней обсуждались. Во-первых, все современные физические теории так или иначе полагаются на понятие действия — величины, которая описывает, насколько системе «нравится» та или иная траектория движения. Во-вторых, уравнения движения системы можно получить, разыскивая траекторию, на которой действие принимает наименьшее значение. В-третьих, действие можно построить, используя всего несколько элементарных предположений о свойствах системы. Например, о том, что законы физики совпадают в системах отсчета, которые движутся с разными скоростями. В-четвертых, некоторые из кандидатов на «теорию всего» получаются простым добавлением в действие Стандартной модели и ОТО членов, которые нарушают какое-то из предположений этих теорий. Например, лоренц-инвариантность. Если после прочтения статьи вы запомнили перечисленные утверждения, это уже хорошо. А если вы еще и поняли, откуда они берутся — просто замечательно.

Дмитрий Трунин

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

12:21 04.09.23 5.1 Физика

Степень поляризации и запутанность света проиллюстрировали механической аналогией

У этих величин нашлась геометрическая и динамическая интерпретация

Николай Мартыненко

Физики научились сопоставлять электромагнитным волнам системы материальных точек, механические параметры которых численно совпадают с характеристиками исходной волны: степенью поляризации и мерой квантовой запутанности. При этом соотношение, которое связывает эти две величины, на языке механической аналогии сводится к теореме Пифагора. Статья опубликована в Physical Review Research.