Как современные физики-теоретики разрабатывают новые теории, описывающие мир? Что такого они добавляют к квантовой механике и общей теории относительности, чтобы построить «теорию всего»? О каких ограничениях идет речь в статьях, говорящих про отсутствие «новой физики»? На все эти вопросы можно ответить, если разобраться, что такое действие — объект, лежащий в основе всех существующих физических теорий. В этой статье я расскажу, что физики понимают под действием, а также покажу, как с его помощью можно построить настоящую физическую теорию, используя всего несколько простых предположений о свойствах рассматриваемой системы.
Сразу предупреждаю: в статье будут формулы и даже несложные вычисления. Впрочем, их вполне можно пропускать без большого вреда для понимания. Вообще говоря, я привожу здесь формулы только для тех заинтересованных читателей, которые непременно хотят разобраться во всем самостоятельно.
Уравнения
Физика описывает наш мир с помощью уравнений, связывающих вместе различные физические величины — скорость, силу, напряженность магнитного поля и так далее. Практически все такие уравнения являются дифференциальными, то есть содержат не только функции, зависящие от величин, но и их производные. Например, одно из самых простых уравнений, описывающее движение точечного тела, содержит вторую производную от его координаты:
Однако как же физики находят эти дифференциальные уравнения? В течение долгого времени единственным источником новых теорий был эксперимент. Другими словами, первым делом ученый проводил измерения нескольких физических величин, и только потом пытался определить, как они связаны. Например, именно таким образом Кеплер открыл три знаменитых закона небесной механики, которые впоследствии привели Ньютона к его классической теории тяготения. Получалось, что эксперимент как будто «бежит впереди теории».
В современной же физике дела устроены немного по-другому. Конечно, эксперимент до сих пор играет в физике очень важную роль. Без экспериментального подтверждения любая теория является всего лишь математической моделью — игрушкой для ума, не имеющей отношения к реальному миру. Однако сейчас физики получают уравнения, описывающие наш мир, не эмпирическим обобщением экспериментальных фактов, а выводят их «из первых принципов», то есть на основании простых предположений о свойствах описываемой системы (например, пространства-времени или электромагнитного поля). В конечном счете, из эксперимента определяются только параметры теории — произвольные коэффициенты, которые входят в выведенное теоретиком уравнение. При этом ключевую роль в теоретической физике играет принцип наименьшего действия, впервые сформулированный Пьером Мопертюи в середине XVIII века и окончательно обобщенный Уильямом Гамильтоном в начале XIX века.
Действие
Что же такое действие? В самой общей формулировке действие — это функционал, который ставит в соответствие траектории движения системы (то есть функции от координат и времени) некоторое число. А принцип наименьшего действия утверждает, что на истинной траектории действие будет минимально. Чтобы разобраться в значении этих умных слов, рассмотрим следующий наглядный пример, взятый из Фейнмановских лекций по физике.
Допустим, мы хотим узнать, по какой траектории будет двигаться тело, помещенное в поле тяжести. Для простоты будем считать, что движение полностью описывается высотой x(t), то есть тело движется вдоль вертикальной прямой. Предположим, что мы знаем о движении только то, что тело стартует в точке x1 в момент времени t1 и приходит в точку x2 в момент t2, а полное время в пути составляет T = t2 − t1. Рассмотрим функцию L, равную разности кинетической энергии К и потенциальной энергии П: L = К − П. Будем считать, что потенциальная энергия зависит только от координаты частицы x(t), а кинетическая — только от ее скорости ẋ(t). Также определим действие — функционал S, равный среднему значению L за все время движения: S = ∫ L(x, ẋ, t) dt.
Очевидно, что значение S будет существенно зависеть от формы траектории x(t) — собственно, поэтому мы называем его функционалом, а не функцией. Если тело слишком высоко поднимется (траектория 2), вырастет средняя потенциальная энергия, а если оно станет слишком часто петлять (траектория 3), увеличится кинетическая — мы ведь предположили, что полное время движения в точности равно T, а значит, телу нужно увеличить скорость, чтобы успеть пройти все повороты. В действительности функционал S достигает минимума на некоторой оптимальной траектории, которая является участком параболы, проходящей через точки x1 и x2 (траектория 1). По счастливому стечению обстоятельств, эта траектория совпадает с траекторией, предсказанной вторым закон Ньютона.
Вернемся к нашей задаче с телом, перемещающимся в поле силы тяжести. Напомню, что мы определили функцию L как разность кинетической и потенциальной энергии тела. Подставляя это выражение в уравнение Эйлера-Лагранжа, мы действительно получаем второй закон Ньютона. В самом деле, наша догадка о виде функции L оказалась очень удачной:

Robert Couse-Baker / flickr.com
Свободная релятивистская частица
Когда Эйнштейн строил специальную теорию относительности (СТО), он постулировал несколько простых утверждений о свойствах нашего пространства-времени. Во-первых, оно является однородным и изотропным, то есть не меняется при конечных смещениях и поворотах. Другими словами, неважно, где вы находитесь — на Земле, на Юпитере или в галактике Малое Магелланово Облако — во всех этих точках законы физики работают одинаково. Кроме того, вы не заметите никаких отличий, если будете двигаться равномерно прямолинейно — в этом заключается принцип относительности Эйнштейна. Во-вторых, никакое тело не может превысить скорость света. Это приводит к тому, что привычные правила пересчета скоростей и времени при переходе между различными системами отсчета — преобразования Галилея — нужно заменить на более правильные преобразования Лоренца. В результате по-настоящему релятивистской величиной, одинаковой во всех системах отсчета, становится не расстояние, а интервал — собственное время частицы. Интервал s1 − s2 между двумя заданными точками можно найти с помощью следующей формулы, где c — скорость света:
Электромагнитное поле
Как известно, электромагнитное поле проявляет себя во взаимодействии
с заряженными телами. Обычно это взаимодействие описывают с помощью
векторов напряженности электрического и магнитного поля, которые связаны
системой из четырех уравнений Максвелла.
Практически симметричный вид уравнений Максвелла наводит на мысль, что
эти поля не являются независимыми сущностями — то, что кажется нам
электрическим полем в одной системе отсчета, может превратиться
в магнитное поле, если перейти в другую систему.
В самом деле, рассмотрим провод, по которому бегут с одинаковой и постоянной скоростью электроны. В системе отсчета, связанной с электронами, есть только постоянное электрическое поле, которое можно найти с помощью закона Кулона. Однако в исходной системе отсчета движение электронов создает постоянный электрический ток, который, в свою очередь, наводит постоянное магнитное поле (закон Био-Савара). В то же время, согласно с принципом относительности, в выбранных нами системах отсчета законы физики должны совпадать. Это значит, что и электрическое, и магнитное поля являются частями какой-то одной, более общей сущности.
Тензоры
Прежде чем мы перейдем к ковариантной формулировке электродинамики, стоит сказать несколько слов по поводу математики специальной и общей теории относительности. Важнейшую роль в этих теориях играет понятие тензора (да и в других современных теориях тоже, если честно). Если совсем грубо, то тензор ранга (n, m) можно представлять себе как (n+m)-мерную матрицу, компоненты которой зависят от координат и времени. Вдобавок к этому тензор должен определенным хитрым образом меняться при переходе из одной системы отсчета в другую или при изменениях координатной сетки. Как именно, определяет число контравариантных и ковариантных индексов (n и m соответственно). При этом сам тензор как физическая сущность при подобных преобразованиях не меняется — так же как не меняется при них 4-вектор, который является частным случаем тензора ранга 1.
Нумеруются компоненты тензора с помощью индексов. Для удобства различают верхние и нижние индексы, чтобы сразу видеть, как преобразуется тензор при смене координат или системы отсчета. Так, например, компонента тензора T ранга (3, 0) записывается как Tαβγ, а тензора U ранга (2, 1) — как Uαβγ. По сложившейся традиции, компоненты четырехмерных тензоров нумеруют греческими буквами, а трехмерных — латинскими. Впрочем, некоторые физики предпочитают делать наоборот (например, Ландау).
Кроме того, для краткости Эйнштейн предложил не писать знак суммы «Σ» при сворачивании тензорных выражений. Свертка — это суммирование тензора по двум заданным индексам, причем один из них обязательно должен быть «верхним» (контравариантным), а другой — «нижним» (ковариантным). Например, чтобы вычислить след матрицы — тензора ранга (1, 1) — нужно свернуть ее по двум имеющимся индексам: Tr[Aμν] = Σ Aμμ = Aμμ. Поднимать и опускать индексы можно с помощью метрического тензора: Tαβγ = Tαβμ gμγ.
Наконец, удобно ввести абсолютно антисимметричный псевдотензор εμνρσ — тензор, который меняет знак при любых перестановках индексов (например, εμνρσ = −ενμρσ) и у которого компонента ε1234 = +1. Еще его называют тензором Леви-Чивита. При поворотах системы координат εμνρσ ведет себя как обычный тензор, однако при инверсиях (замене вроде x → −x) он преобразуется по-другому.
Если задуматься, выбор у нас невелик — в качестве «строительных блоков» может выступать только тензор поля Fμν, метрический тензор gμν и абсолютно антисимметричный тензор εμνρσ. Из них можно собрать всего две скалярные комбинации, причем одна из них является полной производной, то есть ее можно не учитывать при выводе уравнений Эйлера-Лагранжа — после интегрирования эта часть просто обратится в ноль. Выбирая оставшуюся комбинацию в качестве действия и варьируя его, мы получим пару уравнений Максвелла — половину системы (первая строчка). Казалось бы, двух уравнений мы не досчитались. Однако на самом деле нам не нужно выписывать действие, чтобы вывести оставшиеся уравнения — они следуют напрямую из антисимметричности тензора Fμν (вторая строчка):
Гравитация
Настоящим триумфом принципа наименьшего действия в свое время стало построение общей теории относительности (ОТО). Благодаря ему впервые были выведены законы движения, которые ученые не могли получить путем анализа экспериментальных данных. Или могли, но не успели. Вместо этого Эйнштейн (и Гильберт, если угодно) вывел уравнения на метрику, отталкиваясь от предположений о свойствах пространства-времени. Начиная с этого момента, теоретическая физика стала «обгонять» экспериментальную.
В ОТО метрика перестает быть постоянной (как в СТО) и начинает зависеть от плотности помещенной в нее энергии. Замечу, что корректнее говорить все-таки об энергии, а не о массе, хотя эти две величины связаны соотношением E = mc2 в собственной системе отсчета. Напомню, что метрика задает правила, по которым вычисляется расстояние между двумя точками (строго говоря, бесконечно близкими точками). Важно, что метрика не зависит от выбора системы координат. Например, плоское трехмерное пространство можно описать с помощью декартовой либо сферической системы координат, но в обоих случаях метрика пространства будет совпадать.
Чтобы выписать действие для гравитации, нам нужно построить из метрики какой-нибудь инвариант, который не будет меняться при изменении координатной сетки. Самым простым таким инвариантом является детерминант метрики. Тем не менее, если мы включим в действие только его, мы не получим дифференциальное уравнение, поскольку это выражение не содержит производных метрики. А если уравнение не является дифференциальным, оно не может описывать ситуации, в которых метрика меняется со временем. Поэтому нам нужно добавить к действию простейший инвариант, который содержит производные gμν. Таким инвариантом является так называемый скаляр Риччи R, который получается сверткой тензора Римана Rμνρσ, описывающего кривизну пространства-времени:

Robert Couse-Baker / flickr.com
Теория всего
Наконец, пришло время поговорить о «теории всего». Так называют
несколько теорий, которые пытаются объединить ОТО и Стандартную модель —
две основные известные на данный момент физические теории. Ученые
предпринимают такие попытки не только из эстетических соображений (чем
меньше теорий нужно для понимания мира — тем лучше), но и по более
веским причинам.
И у ОТО, и у Стандартной модели есть границы применимости, после которых они перестают работать. Например, ОТО предсказывает существование сингулярностей — точек, в которых плотность энергии, а значит, и кривизна пространства-времени, стремится к бесконечности. Мало того, что бесконечности сами по себе малоприятны — вдобавок к этой проблеме Стандартная модель утверждает, что энергию невозможно локализовать в точке, ее нужно размазывать по некоторому, пусть и небольшому, объему. Поэтому вблизи сингулярности эффекты и ОТО, и Стандартной модели должны быть велики. В то же время ОТО до сих пор не удалось проквантовать, а Стандартная модель строится в предположении плоского пространства-времени. Если мы хотим понимать, что происходит около сингулярностей, нам нужно разработать теорию, которая будет включать в себя обе указанные теории.
Имея в виду, какой успех имел принцип наименьшего действия в прошлом,
ученые основывают на нем все свои попытки построить новую теорию.
Помните, мы рассматривали только самые простые комбинации, когда строили
действие для различных теорий? Тогда наши действия увенчались успехом,
но это вовсе не значит, что самое простое действие является самым
правильным. Вообще говоря, природа не обязана подстраивать свои законы,
чтобы упростить нашу жизнь.
Поэтому разумно включить в действие следующие, более сложные инвариантные величины и посмотреть, к чему это приведет. Чем-то это напоминает последовательное приближении функции многочленами все более высоких степеней. Проблема тут только в том, что все такие поправки входят в действие с некими неизвестными коэффициентами, которые нельзя вычислить теоретически. К тому же, поскольку Стандартная модель и ОТО в целом все-таки хорошо работают, эти коэффициенты должны быть очень маленькими — следовательно, их сложно определить из эксперимента. Многочисленные работы, сообщающие об «ограничениях на новую физику», как раз-таки направлены на определение коэффициентов при высших порядках теории. До сих пор им удалось найти только ограничения сверху.
Кроме того, существуют подходы, вводящие новые, нетривиальные концепции. Например, теория струн предполагает, что свойства нашего мира можно описать с помощью колебаний не точечных, а протяженных объектов — струн. К сожалению, экспериментальные подтверждения теории струн до сих пор не найдены. Например, она предсказывала некоторые возбуждения на ускорителях, но они так и не проявились.
В общем, пока не похоже, что ученые близко подобрались к открытию «теории всего». Наверное, теоретикам все-таки придется придумывать что-то существенно новое. Впрочем, можно не сомневаться, что первым делом они выпишут для новой теории действие.
***
Если все эти рассуждения показались вам сложными и вы пролистали статью не читая, вот краткая выжимка тех фактов, которые в ней обсуждались. Во-первых, все современные физические теории так или иначе полагаются на понятие действия — величины, которая описывает, насколько системе «нравится» та или иная траектория движения. Во-вторых, уравнения движения системы можно получить, разыскивая траекторию, на которой действие принимает наименьшее значение. В-третьих, действие можно построить, используя всего несколько элементарных предположений о свойствах системы. Например, о том, что законы физики совпадают в системах отсчета, которые движутся с разными скоростями. В-четвертых, некоторые из кандидатов на «теорию всего» получаются простым добавлением в действие Стандартной модели и ОТО членов, которые нарушают какое-то из предположений этих теорий. Например, лоренц-инвариантность. Если после прочтения статьи вы запомнили перечисленные утверждения, это уже хорошо. А если вы еще и поняли, откуда они берутся — просто замечательно.
Дмитрий Трунин