Эта статья входит в число избранных

Квантовая теория поля

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Ква́нтовая тео́рия по́ля (КТП) — раздел физики, изучающий поведение квантовых систем с бесконечно большим числом степеней свободы — квантовых полей; является теоретической основой описания микрочастиц, их взаимодействий и превращений. На языке КТП основываются физика высоких энергий и физика элементарных частиц, её математический аппарат используется в физике конденсированного состояния[⇨]. КТП в виде Стандартной модели в настоящее время является единственной экспериментально подтверждённой теорией, способной описывать и предсказывать результаты экспериментов при достижимых в современных ускорителях высоких энергиях[⇨].

Квантовая теория поля — результат работы нескольких поколений физиков на протяжении большей части XX века. Её развитие началось в 1920-х годах с описания взаимодействий между светом и электронами, что привело к появлению первой КТП — квантовой электродинамики[⇨]. Вскоре обнаружилось первое серьёзное теоретическое препятствие для построения более строгой теории, связанное с появлением и сохранением различных бесконечностей при вычислении рядов теории возмущений. Эта проблема нашла решение только в 50-х годах XX века после изобретения процедуры перенормировки[⇨]. Вторым серьёзным препятствием стала очевидная неспособность КТП описать слабые и сильные взаимодействия, до такой степени, что некоторые теоретики призывали отказаться от теоретико-полевого подхода[1][2]. Развитие калибровочной теории в 70-х годах XX века привело к возрождению КТП в виде Стандартной модели элементарных частиц[⇨].

Математический аппарат КТП строится на основе прямого произведения гильбертовых пространств состояний (пространство Фока) квантового поля и действующих в нём операторов. В отличие от квантовой механики, где исследуют свойства волновой функции «микрочастиц» как неких неуничтожимых объектов; в КТП основными объектами исследования являются квантовые поля и их элементарные возбуждения, а главную роль играет аппарат вторичного квантования с операторами рождения и уничтожения частиц, действующими в пространстве состояний Фока[⇨]. Аналогом квантовомеханической волновой функции в КТП является полевой оператор, способный действовать на вакуумный вектор фоковского пространства и порождать одночастичные возбуждения квантового поля. Физическим наблюдаемым величинам здесь также соответствуют операторы, составленные из полевых операторов[⇨].

История[править | править код]

Основное уравнение квантовой механики — уравнение Шрёдингера — является релятивистски неинвариантным, что видно из несимметричного вхождения времени и пространственных координат в уравнение[3]. Оно соответствует классической связи кинетической энергии и импульса частицы . Релятивистское соотношение между энергией и импульсом[en] имеет вид [4]. Предполагая, что оператор импульса в релятивистском случае такой же, как и в нерелятивистской области, и, используя эту формулу для построения релятивистского гамильтониана по аналогии[5], в 1926 году было предложено релятивистски инвариантное уравнение для свободной частицы с нулевым спином (уравнение Клейна — Гордона — Фока). Однако проблема предложенного уравнения заключается в том, что волновую функцию здесь сложно интерпретировать как амплитуду вероятности, потому что плотность вероятности не будет положительно определённой величиной во всём пространстве, что связано с наличием второй производной по времени[6][7].

Несколько иной подход был реализован в 1928 году П. Дираком, который пытался получить дифференциальное уравнение первого порядка, где обеспечено равноправие временной координаты и пространственных координат[6]. Поскольку оператор импульса пропорционален первой производной по координатам, то гамильтониан Дирака должен быть линейным по оператору импульса[8]. С учётом того же релятивистского соотношения энергии и импульса на квадрат этого оператора налагаются ограничения. Соответственно и линейные «коэффициенты» также должны удовлетворять определённому ограничению, а именно их квадраты должны быть равны единице и быть взаимно антикоммутативны. Таким образом, они точно не могут быть числами, но могут быть матрицами, причём размерности не менее 4, а волновая функция — четырёхкомпонентным объектом, получившим название биспинора. В результате было получено уравнение Дирака, в котором участвуют 4-матрицы Дирака и четырёхкомпонентная волновая функция. Формально уравнение Дирака записывается в виде, аналогичном уравнению Шрёдингера с гамильтонианом Дирака[8]. Однако это уравнение, как и уравнение Клейна — Гордона, имеет решения с отрицательными энергиями[9]. Данное обстоятельство явилось причиной для предсказания существования античастиц, что позже подтвердилось в эксперименте (открытие позитрона)[10]. Наличие античастиц есть следствие релятивистского соотношения между энергией и импульсом[11].

Релятивистские уравнения Клейна — Гордона и Дирака рассматриваются в КТП как уравнения для операторных полевых функций[К 1]. Соответственно вводится в рассмотрение «новое» гильбертово пространство состояний системы квантовых полей, на которые действуют полевые операторы. Иногда эту процедуру квантования полей называют «вторичным квантованием»[13][14][К 2].

Теоретические основы[править | править код]

Линии магнитного поля визуализируемые с помощью железных опилок. Когда лист бумаги посыпают железными опилками и помещают над постоянным магнитом, то опилки выравниваются в соответствии с направлением магнитного поля, образуя дуги.

В основе квантовой теории поля лежат классическая теория поля, квантовая механика и специальная теория относительности (СТО)[16][17].

В основе самой ранней успешной классической теории поля лежал закон всемирного тяготения Ньютона, несмотря на полное отсутствие концепции полей в его трактате 1687 года Philosophiæ Naturalis Principia Mathematica[18]. Описанная И. Ньютоном сила тяжести представляет собой «действие на расстоянии», и её влияние на далёкие объекты происходит мгновенно, независимо от расстояния. Однако в переписке с Р. Бентли И. Ньютон заявлял, что «немыслимо, чтобы неодушевлённая грубая материя без посредничества чего-то ещё, что не является материальным, действовала бы на другую материю и влияла на неё без взаимного контакта»[19]. Только в XVIII веке физики-теоретики открыли удобное описание гравитации на основе полей — числовую величину (вектор), присвоенную каждой точке пространства, указывающую действие гравитации на любую пробную частицу в этой точке. Однако это считалось просто математическим трюком[18].

Понятие о полях обрело более формальное описание с развитием электромагнетизма в XIX веке. М. Фарадей ввёл английский термин «поле» (англ. field) в 1845 году. Он представил поле как обладающее физическими эффектами свойство пространства (даже если оно лишено материи). Фарадей выступал против «действия на расстоянии» (дальнодействия) и предполагал, что взаимодействия между объектами происходят через заполняющие пространство «силовые линии». Это описание полей сохранилось по сей день[19][20][21].

Теория классического электромагнетизма приобрела завершённую форму в 1864 году в виде уравнений Максвелла, которые описывали взаимосвязь между электрическим полем, магнитным полем, электрическим током и электрическим зарядом. Уравнения Максвелла подразумевали существование электромагнитных волн — явления, при котором электрические и магнитные поля распространяются из одной точки пространства в другую с конечной скоростью света. Таким образом, действие на расстоянии было окончательно опровергнуто[22][23]. В теории Максвелла все взаимодействия передавались через эфир — среду с необычными механическими свойствами. Многочисленные экспериментальные проверки не подтвердили никаких движений среды, что послужило причиной отказа от этой идеи, — для объяснения эффектов специальной теории относительности оказалось достаточно пустоты. Однако в современной теории пустота — это вакуум, который, по словам А. Мигдала, можно было назвать эфиром, если бы не путаница со старым понятием[24].

Несмотря на успех электродинамики, она не смогла объяснить ни дискретных линий в атомных спектрах, ни распределение излучения чёрного тела[en]* на разных длинах волн[25]. Исследование М. Планком излучения абсолютно чёрного тела положило начало квантовой механике. Он рассматривал атомы, которые поглощают и излучают электромагнитное излучение, как крошечные осцилляторы, энергия которых может принимать только серию дискретных, а не непрерывных значений. Сегодня они известны как квантовые гармонические осцилляторы. Этот процесс ограничения энергии дискретными значениями называется квантованием[26]. Основываясь на этой идее, А. Эйнштейн в 1905 году предложил объяснение фотоэффекта, согласно которому свет состоит из отдельных пакетов энергии, называемых фотонами. Это означало, что электромагнитное излучение, описываемое в виде волн в классическом электромагнитном поле, также существует в форме частиц[27][28].

В том же году, когда была опубликована статья о фотоэффекте, Эйнштейн опубликовал свою специальную теорию относительности, пересекающуюся с электродинамикой Максвелла. Новые правила, называемые преобразованиями Лоренца, описывали изменение временных и пространственных координат событий при изменении скорости наблюдателя, и различие между временем и пространством оказалось размыто. Эйнштейн предположил, что все физические законы должны быть одинаковыми для движущихся при различных скоростях наблюдателей, то есть, что физические законы инвариантны относительно преобразований Лоренца[23].

В 1913 году Н. Бор представил модель атомной структуры, в которой электроны внутри атомов могут принимать только серию дискретных, а не непрерывных энергий[28]. Это ещё один пример квантования. Модель Бора успешно объяснила дискретную природу спектральных линий атомов. В 1924 году Л. де Бройль выдвинул гипотезу дуальности волна-частица, согласно которой микроскопические частицы проявляют как волнообразные, так и частицеподобные свойства при различных обстоятельствах[27]. Объединив эти различные идеи, между 1925 и 1926 годами была сформулирована новая научная теория: квантовая механика. Существенный вклад в новую теорию внесли М. Планк, Л. де Бройль, В. Гейзенберг, М. Борн, Э. Шрёдингер, П. Дирак и В. Паули[29].

С экспериментальной точки зрения, уравнение Шрёдингера, лежащее в основании квантовой механики, могло объяснить вынужденное излучение атомов, когда электрон испускает новый фотон под действием внешнего электромагнитного поля, но оно не могло объяснить спонтанное излучение, при котором энергия электрона спонтанно уменьшается и происходит излучение фотона даже без действия внешнего электромагнитного поля. Теоретически уравнение Шредингера не могло описывать фотоны и оказалось несовместимо с принципами СТО — оно рассматривает время как обычный числовой параметр, одновременно представляя пространственные координаты линейными операторами[30][31].

Квантовая электродинамика[править | править код]

КТП началась с изучения электромагнитных взаимодействий, поскольку электромагнитное поле было единственным известным классическим полем в 1920-х годах[32].

Благодаря работам М. Борна, В. Гейзенберга и П. Йордана в 1925—1926 годах была разработана квантовая теория, описывающая свободное (не взаимодействующее с материей) электромагнитное поле, используя каноническое квантование и рассматривая электромагнитное поле как набор бесконечного числа квантовых гармонических осцилляторов. Однако такая теория, не учитывавшая взаимодействия, была не в состоянии сделать количественные предсказания о реальном мире[33].

В своей основополагающей статье 1927 года «Квантовая теория испускания и поглощения излучения» П. Дирак ввёл термин квантовая электродинамика (КЭД) — теория, в которой к условиям, описывающим свободное электромагнитное поле, добавляется дополнительный член взаимодействия между плотностью электрического тока и электромагнитным векторным потенциалом[34]. Используя теорию возмущений первого порядка, он успешно объяснил явление спонтанного излучения. Согласно принципу неопределённости, квантовые гармонические осцилляторы не могут оставаться неподвижными, но они обладают ненулевым минимумом энергии и всегда должны колебаться, даже в состоянии с самой низкой энергией (в основном состоянии). Следовательно, даже в идеальном вакууме остаётся колеблющееся электромагнитное поле с нулевой энергией. Именно такие квантовые флуктуации электромагнитных полей в вакууме «стимулируют» спонтанное излучение электронов в атомах. Теория Дирака[35] оказалась чрезвычайно успешной в объяснении как испускания, так и поглощения излучения атомами[К 3]. Применяя теорию возмущений второго порядка, он смог учесть рассеяние фотонов и объяснил другие квантовые эффекты, такие как резонансная флуоресценция[en] и нерелятивистское комптоновское рассеяние. Тем не менее применение теории возмущений в более высоких порядках столкнулось с бесконечностями при вычислениях[34].

В 1927 году Ф. Хунд (при расчётах основного состояния двухъямного потенциала)[37] и независимо от него Л. Мандельштам и М. Леонтович[38] впервые выявили «туннельный эффект». В 1928 году Г. Гамовым (который знал об результатах Л. Мандельштама и М. Леонтовича[39]) и американскими учёными Р. Гёрни[en] и Э. Ко́ндоном при разработке теории альфа-распада были получены первые формулы эффекта туннелирования[40][41]. Применив идею о квантово-механическом проникновении волновой функции альфа-частицы через кулоновский барьер, Гамову удалось показать, что частицы даже с не очень большой энергией могут с определённой вероятностью вылетать из ядра[40].

В 1928 году П. Дирак записал волновое уравнение, описывающее релятивистские электроны, — уравнение Дирака. Оно имело важные следствия: спин электрона равен 1/2 (в единицах приведённой постоянной Планка ħ); g-фактор электрона равен 2. Это привело к правильной формуле Зоммерфельда[en] для тонкой структуры атома водорода; и уравнение Дирака можно использовать для вывода формулы Клейна — Нисины, описывающей релятивистское комптоновское рассеяние. Несмотря на то, что результаты находились в согласии с теорией, оставались и нерешённые вопросы — в частности, в теории предполагалось существование состояний с отрицательной энергией, которые могли бы сделать атомы нестабильными, поскольку они, в этом случае, всегда могли распадаться на состояния с более низкой энергией с излучением[42].

В то время преобладало мнение, что мир состоит из двух очень разных ингредиентов: материальных частиц (таких как электроны) и квантовых полей (таких как фотоны). Материальные частицы считались вечными, а их физическое состояние описывалось вероятностями нахождения каждой частицы в любой заданной области пространства или диапазоне скоростей. С другой стороны, фотоны считались просто возбуждёнными состояниями лежащего в основе квантованного электромагнитного поля и могли свободно рождаться или уничтожаться. Между 1928 и 1930 годами П. Йордан, Ю. Вигнер, В. Гейзенберг, В. Паули и Э. Ферми обнаружили, что материальные частицы также можно рассматривать как возбуждённые состояния квантовых полей. Как фотоны являются возбуждёнными состояниями квантованного электромагнитного поля, так и каждому типу частиц соответствует своё квантовое поле: электронное поле, протонное поле и так далее. Имея достаточно энергии, теперь можно было бы создавать материальные частицы. Основываясь на этой идее, Э. Ферми в 1932 году предложил объяснение бета-распада, известное как взаимодействие Ферми. Ядра атомов не содержат электронов сами по себе, но в процессе распада электрон создаётся из окружающего электронного поля, аналогично рождённому из окружающего электромагнитного поля фотону при излучении возбуждённого атома[43].

В 1930 году Д. Иваненко с В. Амбарцумяном высказали гипотезу рождения массивных и элементарных частиц в процессе их взаимодействия (включая рождение электрона при бета-распаде), что исключало господствовавшую до этого теорию их спонтанного рождения и легло в основу КТП и теории элементарных частиц[44][45]. Тогда же П. Дирак и другие поняли, что состояния с отрицательной энергией, появляющиеся из решений уравнения Дирака, можно интерпретировать как частицы с той же массой, что и электроны, но с противоположным электрическим зарядом. Это не только обеспечило стабильность атомов, но и стало первым предсказанием существования антивещества. Позитроны были обнаружены в 1932 году К. Андерсоном в космических лучах[43]. При наличии достаточного количества энергии, например, путём поглощения фотона, можно создать электрон-позитронную пару, процесс, называемый рождением пары; обратный процесс, аннигиляция, также может происходить с испусканием фотона. Это показало, что количество частиц не обязательно остаётся фиксированным во время взаимодействия[46]. При квантовании полей Дирака с учётом запрета Паули не возникает проблем с отрицательными энергиями из-за симметричного описания электронов и позитронов, как показал В. Гейзенберг в 1934 году[47]. Поэтому КТП естественным образом включает античастицы в свой формализм[48], и уравнения Дирака и Клейна — Гордона следует понимать как уравнения для полевых операторов, действующих на вектор состояний квантовых полей, которые удовлетворяют уравнению Шрёдингера[47].

Бесконечности и перенормировка[править | править код]

Р. Оппенгеймер показал в 1934 году, что пертурбативные (то есть, основанные на теории возмущений) вычисления в более высоких порядках КЭД всегда приводят к бесконечным величинам, например для собственно-энергетической части[en] электрона и нулевой энергии вакуума для электронного и фотонного полей[49]. Это означало, что существующие вычислительные методы не могли должным образом справиться с взаимодействиями, в которых принимали участие фотоны с чрезвычайно высокими импульсами[50]. Проблема нашла решение 20 лет спустя, когда был разработан системный подход к устранению таких бесконечностей[51]. Между 1934 и 1938 годами Э. Штюкельберг опубликовал серию статей, в которых была представлена релятивистски инвариантная формулировка КТП. В 1947 году Штюкельберг также независимо разработал полную процедуру перенормировки для устранения расходимостей. Однако в то время эти достижения не были поняты и признаны теоретическим сообществом[52].

В 1947 году У. Лэмб и Р. Ризерфорд измерили малую разницу в энергетических уровнях 2S1/2 и 2P1/2 атома водорода, также названную лэмбовским сдвигом. Пренебрегая вкладом фотонов, энергия которых превышает массу электрона, Г. Бете успешно оценил численное значение этой разницы[52][53]. Впоследствии Н. Кролл[en], У. Лэмб, Дж. Френч[en] и В. Вайскопф использовали другой метод для вывода, в котором бесконечности взаимно сокращались и получалась конечная величина. Однако этот метод был громоздким и ненадёжным, и его нельзя было обобщить на другие вычисления[54][55].

Прорыв в конечном итоге произошёл примерно в 1950 году, когда Дж. Швингер, Р. Фейнман, Ф. Дайсон и С. Томонага разработали более приемлемый метод устранения бесконечностей. Его основная идея состоит в замене вычисленных значений массы и заряда электрона, какими бы бесконечными они ни были, их конечными экспериментальными значениями. Эта систематическая вычислительная процедура известна как перенормировка и может применяться к произвольному порядку в теории возмущений[51]. С. Томонага так описал это в своей Нобелевской лекции[56]:

Поскольку эти части модифицированной массы и заряда из-за полевых вкладов [становятся бесконечными], их невозможно вычислить с помощью теории. Однако масса и заряд, наблюдаемые в экспериментах, являются не исходной массой и зарядом, а массой и зарядом, изменёнными полевыми вкладами, и они конечны. С другой стороны, масса и заряд, фигурирующие в теории, являются… значениями, модифицированными полевыми вкладами. Поскольку это так, и, в частности, поскольку теория не может вычислить модифицированные массу и заряд, мы можем принять процедуру феноменологической подстановки их экспериментальных значений… Эта процедура называется перенормировкой массы и заряда … После долгих и кропотливых вычислений, менее искусных, чем у Швингера, мы получили результат … который согласуется с американцами.

С применением процедуры перенормировки были окончательно проведены расчёты, объясняющие аномальный магнитный момент электрона (отклонение g-фактора электрона от 2) и поляризацию вакуума. Эти результаты в значительной степени совпадали с экспериментальными измерениями, что ознаменовало конец «войны с бесконечностями»[54].

В то же время Р. Фейнман ввёл в обиход формулировку квантовой теории через интегралы по траекториям и диаграммы Фейнмана[57]. Последние используются для визуализации вычислений в теории возмущений. Каждую диаграмму можно интерпретировать как пути частиц и их взаимодействия, причём каждой вершине и линии ставится в соответствие определённое математическое выражение, а произведение этих выражений даёт амплитуду рассеяния процесса, представленного диаграммой[58].

Именно с изобретением процедуры перенормировки и диаграммной техники Фейнмана КТП получила законченную теоретическую основу[57]. Многие теоретики после 1949 года из-за успеха КЭД полагали, что КТП вскоре сможет объяснить все микроскопические явления, а не только взаимодействия между элементарными частицами КЭД. Вопреки этому оптимизму, КТП вступила в очередной период депрессии, который длился почти два десятилетия[59].

Первым препятствием оказалась ограниченная применимость процедуры перенормировки. В вычислениях теории возмущений в КЭД все бесконечные величины можно исключить путём переопределения небольшого числа физических величин (массы и заряда электрона). Ф. Дайсон доказал в 1949 году, что это возможно только для «перенормируемых теорий», примером которых является КЭД. Однако большинство теорий, включая теорию слабого взаимодействия Ферми, неперенормируемы[59].

Вторая серьёзная проблема возникает из ограниченной применимости метода диаграмм Фейнмана. Для сходимости рядов необходимо, чтобы константа связи была достаточно малым числом. Константа связи в КЭД — это постоянная тонкой структуры α ≈ 1/137, величина которой позволяет учитывать только простейшие диаграммы Фейнмана низшего порядка. Напротив, константа связи при сильном взаимодействии примерно равна единице, что делает сложные диаграммы Фейнмана более высокого порядка столь же важными, как и простые. Таким образом, не оказалось возможности получить надёжные количественные предсказания в задачах с сильным взаимодействием при использовании теории возмущений[60].

Столкнувшись с этими бесконечностями, Дж. Уилер и В. Гейзенберг предложили в 1937 и 1943 годах соответственно заменить проблематичную КТП так называемой теорией S-матриц[en]. Поскольку конкретные детали микроскопических взаимодействий недоступны для наблюдений, теория должна пытаться описать только отношения между небольшим количеством наблюдаемых (например, энергией атома) во взаимодействии, а не заниматься микроскопическими деталями взаимодействия. В 1945 году Р. Фейнман и Дж. Уилер смело предложили полностью отказаться от КТП и предложили действие на расстоянии в качестве механизма взаимодействия частиц[61][62]. В то время КТП использовалась эвристически как руководящий принцип, но не как основа для количественных расчётов[60].

Стандартная модель[править | править код]

Элементарные частицы Стандартной модели: шесть типов кварков, шесть типов лептонов, четыре типа калибровочных бозонов, несущих фундаментальные взаимодействия, а также бозон Хиггса, который наделяет элементарные частицы массой.

В 1954 году Я. Чжэньнин и Р. Миллс обобщили локальную калибровочную симметрию КЭД, что привело к созданию неабелевых калибровочных теорий (теорий Янга — Миллса), основанных на более сложных локальных группах симметрии[63]. В КЭД электрически заряженные частицы взаимодействуют посредством обмена фотонами, тогда как в неабелевой калибровочной теории частицы, несущие новый тип «заряда», взаимодействуют посредством обмена безмассовыми калибровочными бозонами. В отличие от фотонов, эти калибровочные бозоны сами несут заряд[64][65].

В 1960 году Ш. Глэшоу разработал неабелеву калибровочную теорию, объединившую электромагнитное и слабое взаимодействия. В 1964 году А. Салам и Дж. Уорд пришли к той же теории другим путём, но их теория была неперенормируемой[66]. П. Хиггс, Р. Браут, Ф. Энглер, Дж. Гуральник, К. Хаген[en] и Т. Киббл в своих знаменитых статьях в Physical Review Letters[en] предложили, что калибровочная симметрия в теориях Янга — Миллса нарушается с помощью механизма, называемого спонтанным нарушением симметрии, благодаря которому калибровочные бозоны могут приобретать массу[67]. Объединив более раннюю теорию Глэшоу, Салама и Уорда с идеей спонтанного нарушения симметрии, С. Вайнберг и независимо А. Салам в 1967 году[68] создали теорию, описывающую электрослабые взаимодействия между всеми лептонами и влияние бозона Хиггса. Его теория была вначале проигнорирована[66][63], пока интерес к ней не вернул в 1971 году Г. т’Хоофт, который доказал перенормируемость неабелевых калибровочных теорий. Для включения кварков теорию электрослабого взаимодействия С. Вайнберга и А. Салама обобщили Ш. Глэшоу, И. Илиопулос и Л. Майани в 1970 году, что ознаменовало завершение её построения[66]. Г. т’Хоофт и М. Велтман развили технику рамерной регуляризации для расчёта перенормируемых диаграмм. Эти результаты привели к завершению построения теории возмущений для унитарной матрицы рассеяния в теориях с калибровочными полями[68].

Х. Фрич, М. Гелл-Манн и Г. Лойтвилер[en] в 1971 году обнаружили, что некоторые явления, связанные с сильным взаимодействием, также могут быть объяснены в рамках неабелевой калибровочной теории. Так появилась квантовая хромодинамика (КХД). В 1973 году Д. Гросс, Ф. Вильчек и Х. Политцер показали, что неабелевы калибровочные теории асимптотически свободны, когда при перенормировке константа связи сильного взаимодействия уменьшается с увеличением энергии взаимодействия. Подобные открытия были сделаны несколько раз в прошлом, но они оказались незамеченными[69]. Таким образом, по крайней мере, при высоких энергиях, константа связи в КХД становится достаточно малой, чтобы гарантировать применимость разложения в ряд теории возмущений, что приводит к возможности получения количественных оценок для сильного взаимодействия[64]. Переносчиками взаимодействия между кварками служат восемь квантов калибровочного поля, которые были названы глюонами[70].

Эти теоретические открытия привели к возрождению интереса к КТП. Полная теория, включающая теорию электрослабого взаимодействия и хромодинамику, сегодня называется Стандартной моделью элементарных частиц[71]. Стандартная модель успешно описывает все фундаментальные взаимодействия, кроме гравитации, а её многочисленные предсказания получили точное экспериментальное подтверждение в последующие десятилетия[72]. Существование бозона Хиггса, который занимает центральное место в механизме спонтанного нарушения симметрии, было окончательно подтверждено в 2012 году экспериментами в ЦЕРНе, подводя итог полной проверке всех составляющих Стандартной модели[73].

Прочие разработки[править | править код]

В 1970-х годах появились разработки непертурбативных методов в неабелевых калибровочных теориях. Монополь 'т Хоофта — Полякова был открыт теоретически Г. 'т Хоофтом и А. Поляковым, трубки потока[en] — Х. Нильсеном[en] и П. Олесеном, инстантоны — Поляковым и соавторами. Исследование этих объектов недоступно с помощью теории возмущений[74].

Суперсимметрия также появилась в то же время. Первая суперсимметричная КТП в четырёх измерениях была построена Ю. Гольфандом и Е. Лихтманом в 1970 году, но их результат не вызвал широкого интереса из-за «железного занавеса». Суперсимметрия получила широкое распространение в теоретическом сообществе только после работы Ю. Весса и Б. Зумино[en] в 1973 году[75].

Среди четырёх фундаментальных взаимодействий гравитация остаётся единственным, которому не хватает последовательного описания в рамках КТП[76]. Хотя гравитон можно рассматривать как ещё одну элементарную частицу[77], но гравитация остаётся неперенормируемой теорией[76]. Различные попытки создания теории квантовой гравитации привели к развитию теории струн[78], которая сама относится к типу двумерной КТП с конформной симметрией[en][79]. Дж. Шерк[en] и Дж. Шварц впервые предложили в 1974 году, что теория струн может быть квантовой теорией гравитации[80].

Физика конденсированного состояния[править | править код]

Хотя КТП возникла в результате изучения взаимодействий между элементарными частицами, то есть используется для расстояний много меньших атомарных, она успешно применяется к другим физическим системам, особенно к многочастичным системам в физике конденсированного состояния. Исторически механизм спонтанного нарушения симметрии Хиггса был результатом применения Й. Намбу теории сверхпроводников к элементарным частицам, в то время как концепция перенормировки возникла благодаря исследованиям фазовых переходов второго рода в веществе[81].

Вскоре после введения фотонов А. Эйнштейн выполнил процедуру квантования колебаний в кристалле, что привело к появлению первой квазичастицы в твёрдом теле — фонона. Л. Ландау утверждал, что низкоэнергетические возбуждения во многих системах конденсированной материи можно описывать в терминах взаимодействий между набором квазичастиц. Диаграммный метод КТП Фейнмана естественным образом подошёл для анализа различных явлений в конденсированных средах[82]. Калибровочная теория используется для описания квантования магнитного потока в сверхпроводниках, удельного сопротивления в квантовом эффекте Холла, а также связи между частотой и напряжением при нестационарном эффекте Джозефсона для переменного тока[82].

Классический формализм теории поля[править | править код]

Лагранжев формализм[править | править код]

Классическое поле является функцией пространственных и временных координат[83]. Примеры включают гравитационное поле в ньютоновской гравитации g(x, t), электрическое поле E(x, t) и магнитное поле B(x, t) в классической электродинамике. Классическое поле можно рассматривать как числовую величину, приписываемую каждой точке пространства, которая изменяется во времени. Следовательно, оно имеет бесконечно много степеней свободы[К 4][83].

В лагранжевой механике функция Лагранжа L является функцией времени и динамических переменных системы и записывается в виде суммы по всем материальным точкам системы[84]. В случае непрерывной системы, каковым является поле — центральное понятие теории[85], сумма заменяется пространственным интегралом от плотности функции Лагранжа — лагранжевой плотности

где жирным шрифтом выделены пространственные компоненты 4-вектора координат, а нулевая компонента — время. Поэтому в теории поля лагранжианом называют обычно лагранжеву плотность[86][87]. Действие по определению есть интеграл по времени от лагранжиана[84]

то есть действие в теории поля есть четырёхмерный интеграл от лагранжевой плотности по четырёхмерному пространству-времени[84].

Поле описывается полевой функцией (выступает в качестве динамической переменной), которое может быть вещественной или комплексной скалярной (псевдоскалярной), векторной, спинорной или иной функцией. В теории поля предполагается, что лагранжиан зависит только от динамических переменных — от полевой функции и её производных, то есть отсутствует явная зависимость от координат, наличие которой нарушало бы релятивистскую инвариантность. Локальность теории требует, чтобы лагранжиан содержал конечное количество производных и не содержал, например, интегральных зависимостей. Более того, чтобы получить дифференциальные уравнения не выше второго порядка (в целях соответствия классической механике), предполагается, что лагранжиан зависит только от полевой функции и её первых производных ()[88],

Принцип наименьшего действия (принцип Гамильтона) означает, что реальное изменение состояния системы происходит таким образом, чтобы действие было стационарным (вариация действия равна нулю). Этот принцип позволяет получить полевые уравнения движения — уравнения Эйлера — Лагранжа[К 5][86][88]:

Поскольку физические свойства системы определяются действием, в котором лагранжиан является подынтегральным выражением, то данному лагранжиану соответствует единственное действие, но не наоборот. А именно, лагранжианы, отличающиеся друг от друга полной 4-дивергенцией некоторого 4-вектора , физически эквивалентны[88].

Лагранжиан системы полей[править | править код]

Лагранжиан системы невзаимодействующих (свободных) полей есть просто сумма лагранжианов отдельных полей. Уравнения движения для системы свободных полей — это совокупность уравнений движения отдельных полей. Взаимодействие полей учитывается в лагранжиане добавлением дополнительных нелинейных слагаемых. Таким образом, полный лагранжиан системы взаимодействующих полей является суммой свободного лагранжиана и лагранжиана взаимодействия [89]:

Введение лагранжиана взаимодействия приводит к неоднородности и нелинейности уравнений движения. Лагранжианы взаимодействия обычно являются полиномиальными функциями участвующих полей (степени не ниже третьей), умноженными на некоторую числовую константу — так называемую константу связи. Лагранжиан взаимодействия может быть пропорционален третьей или четвёртой степени самой полевой функции, или произведению различных полевых функций[90].

Гамильтонов формализм[править | править код]

От лагранжева формализма можно перейти к гамильтоновому по аналогии с лагранжевой и гамильтоновой механикой. Полевая функция здесь выступает в качестве обобщённой (канонической) координаты. Соответственно необходимо определить также и обобщённую (каноническую) плотность импульса , сопряжённую этой координате согласно стандартной формуле (точка над функцией обозначает частную производную по времени)[91][92][87]:

Тогда плотность гамильтониана поля равна по определению[91]

Уравнения движения в гамильтоновом подходе имеют вид[93]:

Динамика любых величин в рамках гамильтонова формализма подчиняется следующему уравнению:

где фигурными скобками обозначена скобка Пуассона[93]. При этом для самих функций и выполнено следующее[92][94]:

Соотношения с участием скобок Пуассона обычно и являются основой для квантования полей, когда полевые функции заменяются соответствующими операторами, а скобки Пуассона — на коммутатор операторов[95].

Симметрии в квантовой теории поля[править | править код]

Определение и виды симметрий[править | править код]

Симметриями в квантовой теории поля называются преобразования координат и (или) полевых функций, относительно которых инвариантны уравнения движения, а значит, инвариантно действие. Сами преобразования при этом образуют группу[96]. Симметрии называются глобальными, если соответствующие преобразования не зависят от 4-координат[97]. В противном случае говорят о локальных симметриях[98][99]. Симметрии могут быть дискретными или непрерывными[100]. В последнем случае группа преобразований является непрерывной (топологической), то есть в группе задана топология, относительно которой групповые операции непрерывны[101]. В квантовой теории поля однако обычно используется более узкий класс групп — группы Ли, в которых введена не только топология, но и структура дифференцируемого многообразия. Элементы таких групп можно представить как дифференцируемые (голоморфные или аналитические) функции конечного числа параметров. Группы преобразований обычно рассматриваются в некотором представлении — элементам групп соответствуют операторные (матричные) функции параметров[102].

Дискретные симметрии. CPT-теорема[править | править код]

Наиболее важное значение имеют следующие виды преобразований[103]:

  • C — зарядовое сопряжение — замена полевых функций на сопряжённые или замена частиц на античастицы.
  • P — чётность — изменение знаков пространственных компонент на противоположный.
  • T — обращение времени — изменение знака временной компоненты.

Доказано, что в локальной квантовой теории поля имеет место -симметрия, то есть инвариантность относительно одновременного применения этих трёх преобразований[104].

Непрерывные симметрии. Теорема Нётер[править | править код]

Согласно теореме Нётер инвариантность функционала действия относительно -параметрической группы преобразований приводит к динамическим инвариантам поля, то есть к законам сохранения. А именно, пусть преобразование координат осуществляется с помощью функций , а полевой функции — с помощью функции , где  — совокупность параметров. Обозначим значение производной функции по -му параметру при нулевом значении параметров, а через  — значения производных функций по -му параметру при нулевом значении параметров. Указанные величины по существу являются генераторами соответствующих групп преобразований[105].

Тогда нётеровские токи, определённые как[106]

обладают свойством . Сохраняющимися во времени величинами («нётеровскими зарядами») являются пространственные интегралы от нулевой компоненты токов[107]

Фундаментальной симметрией, присущей всем квантово-полевым теориям, является релятивистская инвариантность — инвариантность относительно неоднородной группы Лоренца (группы Пуанкаре), то есть относительно пространственно-временных трансляций и лоренцевых вращений[108]. Ещё одной глобальной симметрией для комплексных полей является глобальная калибровочная симметрия — симметрия относительно однопараметрической группы  — группы умножений на . Она связана с требованием вещественности лагранжиана и наблюдаемых физических величин, что приводит к зависимости от комплексных полей только через квадратичные формы, представляющие собой произведения взаимно комплексно-сопряжённых функций и их производных. Поэтому умножение на унитарный фазовый множитель не приводит к каким-либо изменениям[109].

Ниже в таблице приведены общие выражения для нётеровских токов и зарядов для основных глобальных симметрий и соответствующих законов сохранения.

Симметрия
Нётеровские токи
Нётеровские заряды и законы сохранения
Пространственно-временные трансляции[110][111]
Тензор энергии-импульса: . В частности  — гамильтониан (плотность) поля.
Закон сохранения 4-импульса: , в частности энергии (гамильтониана)
Лоренцевы вращения[112][113]
Тензор (полного) момента , где  — тензор орбитального момента,  — тензор спинового момента (спина), где  — параметры преобразования полевых функций при лоренцевых вращениях. Для скалярных полей
Закон сохранения полного момента  — пространственного интеграла от
Глобальная калибровочная симметрия [114]
4-вектор заряженного тока: . Для вещественных полей равен нулю.
Закон сохранения заряда (электрический заряд, барионный заряд, странность, очарование и т. д.): [115]. Для вещественных полей равен нулю.

Основные характеристики базовых полей[править | править код]

Ниже в таблице приведены описание и основные характеристики простейших полей, являющихся базовыми при построении реальных квантово-полевых теорий — скалярные, векторные и спинорные поля.

Характеристика
Скалярное поле
[116]
Векторное поле
[117][118]
Спинорное поле
[119]
Полевая функция
 — в общем случае комплексная функция.  — комплексно-сопряжённая функция. Если (то есть ), то имеем вещественное скалярное поле (переобозначив её просто как )
 — векторная функция (4-вектор), в общем случае с комплексными компонентами (заряженное векторное поле). Вещественное (нейтральное) векторное поле получается из условия равенства (комплексное поле приравнивается тогда к вещественному, делённому на )
 — четырёхкомпонентная функция (биспинор)-столбец,  — дираковски сопряжённая четырёхкомпонентная функция-строка,  — матрицы Дирака
Характер описываемых частиц
Частица со спином 0. Для вещественного поля — нейтральная, для комплексного — заряженная.
Частицы со спином 1 (проекции ), заряженные или нейтральные
Заряженные частицы со спином 1/2 ()
Лагранжиан
, где  — лагранжиан для вещественного поля
, где
Для вещественного поля
Уравнения движения Эйлера — Лагранжа
(уравнение Клейна — Гордона — верно и для сопряжённой функции)
(Уравнение Прока)
Дифференцирование по приводит (если ) к
С этим условием (Лоренца)
 — уравнение Дирака
Тензор энергии-импульса
[120]
Гамильтониан
где для вещественного поля —
4-вектор тока и заряд
, для вещественного поля равны нулю[121]
Спин-тензор
0
где

Локальные симметрии и калибровочные поля[править | править код]

Локальные преобразования можно определить как умножение полевой функции на некоторую функцию, зависящую от 4-координат. Например, локальные преобразования группы  — фазовое преобразование, зависящее от конкретной пространственно-временной точки, то есть умножение на . Как отмечалось выше, все комплексные поля симметричны относительно аналогичных глобальных преобразований[122]. Однако они часто неинвариантны относительно локальных преобразований. В частности, описанные выше скалярные и спинорные поля неинвариантны относительно локальных калибровочных преобразований. Причина этого — неинвариантность относительно такого преобразования обычной производной. Если ввести дополнительное поле и заменить производную в лагранжиане на так называемую калибровочно-ковариантную производную (e — калибровочный параметр, который равен электрическому заряду в КЭД)

то полученный лагранжиан будет инвариантен относительно локальных калибровочных преобразований[123]. Однако полученный таким образом лагранжиан будет по сути содержать взаимодействие двух полей — исходного и калибровочного . По общему правилу в таком случае необходимо ввести в общий лагранжиан также слагаемое, отвечающее за лагранжиан свободного калибровочного поля. Этот лагранжиан тоже должен быть калибровочно инвариантен и выбирается как лагранжиан свободного безмассового векторного поля . В итоге, например, для спинорного поля получаем лагранжиан квантовой электродинамики (КЭД)[124]:

то есть данный лагранжиан включает в себя лагранжианы свободного спинорного поля Дирака и калибровочного (электромагнитного) поля, а также лагранжиан взаимодействия этих полей. Если следующее преобразование полей выполняется в каждой точке пространства-времени x (локальное преобразование), то лагранжиан КЭД остаётся неизменным или инвариантным:

где α(x) — любая функция координат пространства-времени. Если лагранжиан теории (или, точнее, действие) инвариантен относительно некоторого локального преобразования, то это преобразование называется калибровочной симметрией теории[125]. Калибровочные симметрии образуют группу в каждой точке пространства — времени. В случае КЭД последовательное применение двух различных преобразований локальной симметрии и  — это ещё одно преобразование симметрии . Для любого α(x),  — элемент группы U(1), поэтому говорят, что КЭД обладает калибровочной симметрией U(1)[126].

Аналогичным образом можно написать калибровочно инвариантный лагранжиан комплексного скалярного поля — лагранжиан скалярной КЭД[127]:

U(1) — абелева группа. КТП можно построить для неабелевых групп, которые называют неабелевыми калибровочными теориями[128]. Квантовая хромодинамика — неабелева калибровочная теория с SU(3) группой симметрии. Она описывает дираковкие поля ψi, i = 1,2,3, которые представляют кварковые поля, и векторные поля Aa,μ, a = 1,...,8 — глюонные поля, которые являются SU(3) калибровочными бозонами[129]. Лагранжиан КХД имеет вид[130][131]:

где Dμ — калибровочная ковариантная производная (в случае с U(1) был один генератор, равный единице)[131]:

где g — константа связи, ta — восемь генераторов группы SU(3) в фундаментальном представлении (матриц 3×3)[131],

fabc — структурные константы SU(3)[132]. По повторяющимся индексам происходит неявное суммирование согласно обозначениям Эйнштейна. Этот лагранжиан инвариантен относительно преобразования[133][132]:

где U(x) — элемент SU(3) в каждой точке пространства-времени x:

Указанный подход можно обобщить на случай других локальных групп симметрии[124].

Предыдущее обсуждение симметрий происходит на языке лагранжиана. Другими словами, это «классические» симметрии. После квантования некоторые теории больше не будут демонстрировать свою классическую симметрию — явление, называемое аномалией[en]. Например, в формулировке интеграла по траекториям, несмотря на инвариантность плотности лагранжиана , при некотором локальном преобразовании полей мера интеграла по траекториям может измениться[134]. Для теории, описывающей природу, чтобы быть последовательным, она не должна содержать каких либо аномалий в калибровочной симметрии. Стандартная модель элементарных частиц — это калибровочная теория, основанная на группе SU(3) × SU(2) × U(1), в которой все аномалии точно сокращаются[135].

Теоретический фундамент общей теории относительности, принцип эквивалентности, также можно понимать как форму калибровочной симметрии, преобразуя общую теорию относительности в калибровочную теорию, основанную на группе Лоренца[136].

Теорема Нётер утверждает, что каждая непрерывная симметрия, то есть параметр в преобразовании симметрии, являющийся непрерывным, а не дискретным, приводит к соответствующему закону сохранения[137][138]. Например, U(1) симметрия КЭД означает сохранение заряда[139].

Калибровочные преобразования не связывают отдельные квантовые состояния. Скорее, они связывают два эквивалентных математических описания одного и того же квантового состояния. Например, поле фотона Aμ, будучи четырёхвекторным, имеет четыре кажущихся степени свободы, но фактическое состояние фотона описывается его двумя степенями свободы, соответствующими поляризации[en]. Остальные две степени свободы называются «избыточными», а разные способы записи Aμ можно связать друг с другом калибровочным преобразованием и, фактически, они описывают одно и то же состояние фотонного поля. В этом смысле калибровочная инвариантность — это не «настоящая» симметрия, а отражение «избыточности» выбранного математического описания[140].

Чтобы учесть избыточность калибровки в формулировке интеграла по траекториям, необходимо выполнить так называемую процедуру фиксации калибровки Фаддеева — Попова. В неабелевых калибровочных теориях такая процедура приводит к возникновению новых полей, называемых «ду́хами». Частицы, соответствующие полям духов, называются частицами-духами, которые не могут быть обнаружены извне[141]. Более строгое обобщение процедуры Фаддеева — Попова задаётся процедурой БРСТ квантования[142].

Спонтанное нарушение симметрии[править | править код]

Спонтанное нарушение симметрии — это механизм, при котором симметрия лагранжиана описываемой им системы нарушается[143].

Чтобы проиллюстрировать механизм, рассмотрим линейную сигма-модель[en], содержащую N вещественных скалярных полей (за номер поля отвечает индекс i), описываемых плотностью лагранжиана вида[144]:

где μ и λ — действительные параметры. Теория допускает глобальную симметрию O(N)[144]:

Состояние с наименьшей энергией (основное состояние или вакуумное состояние) классической теории представляется любым однородным полем ϕ0, которое удовлетворяет условию

Без ограничения общности, пусть основное состояние находится в N-м направлении[144]:

Исходные N полей можно переписать в виде:

и исходная плотность лагранжиана записывается как

где k = 1,...,N-1. Исходная O(N) больше не появляется, а остаётся только подгруппа O(N-1). Большая симметрия до спонтанного нарушения симметрии называется «скрытой» или спонтанно нарушенной[145].

Теорема Голдстоуна утверждает, что при спонтанном нарушении симметрии каждая нарушенная непрерывная глобальная симметрия приводит к появлению безмассового поля, называемому бозоном Голдстоуна. В приведённом выше примере O(N) имеет N(N-1)/2 непрерывных симметрий (равной размерности его алгебры Ли), а O(N-1) имеет (N-1)(N-2)/2. Число нарушенных симметрий — это разность этих величин N-1, что также соответствует N-1 безмассовым полям πk[145].

С другой стороны, когда калибровочная (в отличие от глобальной) симметрия спонтанно нарушается, образующийся бозон Голдстоуна «съедается» соответствующим калибровочным бозоном, становясь дополнительной степенью свободы для калибровочного бозона[146]. Теорема об эквивалентности бозонов Голдстоуна гласит, что при высокой энергии амплитуда излучения или поглощения продольно поляризованного массивного калибровочного бозона становится равной амплитуде излучения или поглощения бозона Голдстоуна, который был «съеден» калибровочным бозоном[147].

В КТП ферромагнетизма спонтанное нарушение симметрии может объяснить выравнивание магнитных диполей при низких температурах[148][149]. В Стандартной модели элементарных частиц W и Z бозоны, которые иначе были бы безмассовыми в результате калибровочной симметрии, приобретают массы через спонтанное нарушение симметрии благодаря бозону Хиггса. Этот процесс называется механизмом Хиггса[150].

Импульсное представление[править | править код]

Для решения уравнений движения можно перейти к так называемому импульсному представлению с помощью преобразования Фурье[151][К 6]:

с учётом свойств Фурье-образа , в частности Фурье-образ производных равен .

Нахождение решения уравнений движения можно показать на примере уравнения Клейна — Гордона[151].

Используя импульсное представление полевых функций, можно получить и остальные характеристики поля в импульсном представлении. Покажем это на примере 4-импульса для того же вещественного скалярного поля Клейна — Гордона[154].

Характеристика
Скалярное поле
[158]
Векторное поле
[159]
Спинорное поле
[160]
Импульсное представление полевой функции: в выражении
отвечает за частицу,  — за античастицу.
для вещественного поля
Плотность частиц с импульсом Общее число частиц
4-импульс поля
Заряд
для вещественного поля равен нулю
Проекция спина на направление импульса
0
индексы 1 и 2 отвечают частицам с проекциями спина а третий индекс — частицам с нулевой проекцией спина

Квантование полей[править | править код]

Квантование означает переход от полей (полевых функций) к соответствующим операторам (операторнозначным функциям), действующим на вектор (амплитуду) состояния Φ. По аналогии с обычной квантовой механикой вектор состояния полностью характеризует физическое состояние системы квантованных волновых полей[161][162]. Вектор состояния — это вектор в некотором линейном пространстве, которое называется пространством Фока[163].

Основной постулат квантования волновых полей заключается в том, что операторы динамических переменных выражаются через операторы полей таким же образом, как и классическое выражение этих величин через полевые функции (с учётом порядка перемножения, поскольку умножение операторов в общем случае некоммутативно, в отличие от произведения обычных функций). Скобка Пуассона (см. гамильтонов формализм) заменяется на коммутатор соответствующих операторов[164]. В частности, классический гамильтонов формализм трансформируется в квантовый следующим образом:

Это так называемые коммутационные соотношения Бозе — Эйнштейна, основанные на обычном коммутаторе — разности «прямого» и «обратного» произведения операторов[165]

Коммутационные соотношения Ферми — Дирака основаны на антикоммутаторе — сумме «прямого» и «обратного» произведения операторов[165]:

Кванты первых полей подчиняются статистике Бозе — Эйнштейна и называются бозонами, а кванты вторых подчиняются статистике Ферми — Дирака и называются фермионами. Квантование полей по Бозе — Эйнштейну оказывается непротиворечивым для частиц с целым спином, а для частиц с полуцелым спином непротиворечивым оказывается квантование по Ферми — Дираку. Таким образом, фермионы являются частицами с полуцелым спином, а бозоны — с целым[165].

Из коммутационных соотношений для полевой функции, играющей здесь роль обобщённой координаты, и соответствующего обобщённого импульса можно получить коммутационные соотношения для операторов рождения и уничтожения квантов в импульсном представлении (для скалярного действительного поля)[166][167]

Поле как набор гармонических осцилляторов[править | править код]

Поле можно представить в виде бесконечного множества гармонических осцилляторов. Это можно показать на примере поля Клейна — Гордона. Трёхмерный (по трём пространственным координатам) Фурье-образ полевой функции удовлетворяет следующему уравнению (Фурье-образ уравнения Клейна — Гордона)

что является дифференциальным уравнением для гармонического осциллятора с частотой каждой фиксированной моды Фурье-разложения. Для каждого такого квантового гармонического осциллятора, как известно из квантовой механики, стационарные состояния можно связать между собой повышающим и понижающим операторами следующим образом[168]

а гамильтониан равен , где . Соответственно энергия осциллятора квантуется как , где квантовое число соответствует собственным значениям оператора [169].

Таким образом, применение повышающего или понижающего оператора изменяет квантовое число на единицу и приводит к одинаковому изменению энергии осциллятора (эквидистантность спектра), что можно интерпретировать как рождение или уничтожение кванта поля с энергией . Именно такая интерпретация позволяет использовать вышеприведённые операторы, как операторы рождения и уничтожения. Любое состояние с индексом может быть представлено как действие операторов рождения на «нулевое» состояние[169]:

В случае осцилляторов гамильтониан системы равен сумме гамильтонианов отдельных осцилляторов. Для каждого такого осциллятора можно определить свои операторы рождения . Следовательно, произвольное квантовое состояние такой системы может быть описано с помощью чисел заполнения  — количества операторов данного сорта k, действующих на вакуум:

Такое представление называют представлением чисел заполнения. Суть данного представления заключается в том, чтобы вместо задания вектора состояния как функции от координат (координатное представление) или как функции от импульсов (импульсное представление), состояние системы характеризуется номером возбуждённого состояния — числом заполнения[170].

Фоковские пространство и представление[править | править код]

В квантовой теории поля гамильтониан, первоначально выраженный как функция и , в конечном итоге также выражается через соответствующие операторы рождения и уничтожения квантов полей. Главный принцип сохраняется — любые операторы выражаются через эти операторы рождения и уничтожения так же, как соответствующие функции до квантования. Единственное различие — порядок записи операторов имеет значение, так как операторы, в отличие от обычных функций, в общем случае некоммутативны и удовлетворяют соответствующим коммутационным соотношениям[162].

Все операторы рождения и уничтожения и их комбинации, операторы самих полей и их производных — все они действуют в бесконечномерном пространстве Фока. В пространстве Фока в первую очередь определяется вакуум (вакуумное состояние) или , по аналогии с нулевым состоянием квантового осциллятора. Вакуум определяется как[171]

Произвольные состояния задаются как возбуждения вакуума следующего вида[163]:

Это и есть фоковское представление для k-частичного состояния. Функции f являются обычными квантово-механическими волновыми функциями. Обычно они предполагаются квадратично-интегрируемыми, чтобы нормы векторов состояний были конечными величинами. Однако состояния с бесконечной нормой тоже имеют смысл. Например, состояние имеет бесконечную норму , однако это состояние соответствует одночастичному состоянию с определённым импульсом и, если рассматривать пространственную плотность таких частиц, то она оказывается конечной[163].

Нормальное и хронологическое произведение. Теорема Вика[править | править код]

Из определения вакуума следует, что вакуумное среднее произведения любого количества операторов рождения и уничтожения, в котором все операторы рождения находятся левее всех операторов уничтожения, равно нулю. Соответствующий порядок написания операторов рождения и уничтожения называется нормальной формой или нормальным упорядочением[172]. Чтобы подчеркнуть, что операторы нормально упорядочены, соответствующие произведения заключаются между двоеточиями, например, , или используются обозначения с введением некоторого условного оператора [173].

Нормальная форма связана с обычной через коммутатор операторов, а именно «обычная» форма равна нормальной форме плюс (анти)коммутатор соответствующих операторов («неправильно» упорядоченных). Например ( содержит оператор уничтожения, содержит оператор рождения),

В этой записи лишь одно слагаемое записано не в нормальной форме, соответственно можно записать

Тем самым вакуумное среднее от исходного произведения операторов по существу будет определяться только последним коммутатором[173].

Хронологическое произведение определяется как упорядоченное по временной переменной (нулевой компоненте 4-координат) произведение[174]:

, где

где  — число перестановок фермионных полей между собой в ходе упорядочения по (перестановка бозонных полей не влияет на знак)[175].

Произведения пары полевых функций в разных точках пространства-времени можно выразить через нормальную форму плюс коммутатор. Под знаком хронологического упорядочения здесь нужно сделать модификацию — вместо коммутатора нужно использовать так называемую свёртку , равную коммутатору , если и коммутатору , если . Таким образом, хронологическое произведение двух полевых функций равно сумме их произведения в нормальной форме и свёртки[176]:

Теорема Вика обобщает данное представление на случай произвольного количества множителей:

где сумма берётся по всем возможным попарным свёрткам функций ( — неотрицательные чётные числа, не превышающие )[177].

Основные коммутационные соотношения[править | править код]

Выражение для вакуумного среднего, обозначенное как , от произведения полевых операторов скалярного поля Клейна — Гордона с учётом сказанного выше имеет вид[178]


Это амплитуда распространения частицы из точки в точку . Можно показать, что эта функция лоренц-инвариантна. Коммутатор полевых функций выражается через эту функцию следующим образом:

Для любого пространственноподобного интервала можно выбрать систему отчёта так, чтобы сменил знак, а в силу лоренц-инвариантности это означает, что соответствующий коммутатор равен нулю. Это означает, что в точках, разделённых пространственноподобным интервалом, возможны измерения, и они не влияют друг на друга. То есть никакое измерение не может повлиять на другое измерение вне светового конуса. Это означает соблюдение принципа причинности в квантовой теории поля. Для комплексных полей принцип причинности требует наличия пары частица-античастица с одинаковыми массами и противоположными «зарядами»[179].

Пропагаторы[править | править код]

Пропагатор определяется через вакуумное среднее от хронологического произведения двух полевых операторов скалярного поля[180]:

где — это функция Хевисайда. Чётная функция — это функция Грина для оператора Клейна — Гордона, в частности[180]

Следовательно, 4-мерный фурье-образ этой функции должен быть пропорционален . Однако, в силу неопределённости в точках на массовой поверхности , её импульсное представление записывают следующим образом[180]:

где  — бесконечно малая величина, которая задаёт обходы полюсов при интегрировании по .

Пропагаторы базовых полей (ненулевыми являются только свёртки одинаковых полей противоположных зарядов)[181][182][183]:

Поле
Величина
Формула
Вещественное или комплексное скалярное поле[184]
Спинорное поле[185]
Массивное векторное поле
Вещественное безмассовое векторное (электромагнитное) поле[185]

S-матрица[править | править код]

Пусть задано начальное состояние полей в «далёком» прошлом и конечное состояние в «далёком» будущем . Предполагается, что в «далёком» прошлом и будущем взаимодействие отсутствует, а «включается» оно в некоторой конечной пространственно-временной области. Оператор , переводящий начальное состояние в конечное, называется оператором рассеяния[186][187]:

Соответственно, амплитуда перехода из начального состояния в конечное состояние равна[188]:

Оператор рассеяния можно выразить через матричные элементы в некотором базисе. Соответствующая бесконечномерная матрица называется матрицей рассеяния или -матрицей. Квадраты модулей матричных элементов определяют вероятности переходов между базисными векторами начального и конечного состояний[187].

Исходя из общих требований релятивистской ковариантности, причинности, унитарности[189], а также принципа соответствия[190][191] можно показать, что -матрица (оператор) выражается через лагранжиан взаимодействия следующим образом (эту формулу иногда также получают с помощью теории возмущений)[192][193]:

 — хронологическая экспонента, то есть -экспонента, понимаемая как разложение в указанный выше бесконечный ряд по -произведениям (хронологическим произведениям) [194][195].

Пусть начальное состояние имеет вид , а конечное состояние . Тогда вклад -го порядка теории возмущений будет равен вакуумному среднему следующего вида (константа связи выведена из лагранжиана взаимодействия)[192]:

С учётом теоремы Вика такого рода вакуумные средние будут разложены на слагаемые, в которых за знак вакуумного среднего будут выведены все свёртки в этих слагаемых, а оставшиеся полевые операторы в нормальной форме будут участвовать только в (анти)коммутаторах с операторами начального и конечного состояния, порождая стандартные вклады от таких коммутаторов. Ненулевой вклад могут дать только те слагаемые, в которых количество и тип полей под знаком нормального произведения будет соответствовать типу и общему числу частиц в начальном и конечном состояниях. Эти ненулевые вклады также выводятся за знак вакуумного среднего (ибо они тоже не являются операторами) и в этих слагаемых остаются множители с вакуумными обкладками без операторов , что равно единице по определению. В конечных выражениях, таким образом, не остаётся операторов и вакуумных обкладок, а остаются свёртки и выражения для коммутаторов полевых операторов с операторами начальных и конечных состояний. Свёртки заменяются их импульсными представлениями — пропагаторами, а интегрирование по пространственно-временным координатам устраняет все экспоненты, заменяя их на дельта-функции от сумм 4-импульсов. Интегралы по импульсам также уничтожают большую часть этих дельта-функций. Какие именно конечные выражения получаются, можно формализовать с помощью правил и соответствующих диаграмм Фейнмана[196].

Правила и диаграммы Фейнмана[править | править код]

Интегралы по траекториям[править | править код]

Формулировка КТП через интегралы по траекториям связана с прямым вычислением амплитуды рассеяния определённого процесса взаимодействия, а не с определением операторов и пространств состояний. Чтобы вычислить амплитуду вероятности эволюции системы из некоторого начального состояния в момент времени t = 0 до некоторого конечного состояния при t = T общее время T делится на N небольших интервалов. Общая амплитуда — это произведение амплитуды эволюции в каждом интервале времени, интегрированное по всем промежуточным состояниям. Пусть Hгамильтониан (то есть генератор эволюции во времени), тогда[197]

В пределе N → ∞ указанное произведение интегралов становится функциональным интегралом[198]:

где L — лагранжиан, содержащий ϕ и его производные по пространственным и временным координатам, полученным из гамильтониана H с помощью преобразования Лежандра. Начальные и конечные условия для интеграла по траекториям соответственно равны[199]

Другими словами, полная амплитуда — это сумма по амплитуде всех возможных траекторий между начальным и конечным состояниями, где амплитуда пути задаётся экспонентой в подынтегральном выражении[199].

Двухточечная корреляционная функция[править | править код]

В расчётах часто встречаются выражения типа

в свободной теории или теории с взаимодействием соответственно. Здесь, и  — координатные 4-векторы,  — оператор временного упорядочивания, который переставляет операторы таким образом, чтобы время компонент и увеличивалось от правых к левым компонентам, и  — основное состояние (вакуумное состояние) взаимодействующей теории, отличное от свободного основного состояния . Это выражение представляет собой амплитуду вероятности распространения поля от y до x и имеет несколько названий, например, двухточечный пропагатор, двухточечная корреляционная функция, двухточечная функция Грина или, для краткости, просто двухточечная функция[200].

Свободная двухточечная функция, также известная как фейнмановский пропагатор, находится для вещественного скалярного поля либо с помощью канонического квантования, либо с помощью интегралов по траекториям[201][202]:

Этот пропагатор входит в феймановские диаграммы и описывает распространение виртуальных частиц[203]. В теории с взаимодействием, где лагранжиан или гамильтониан содержат слагаемые или , описывающие взаимодействия, двухточечную функцию определить сложнее. Однако, используя формулировку канонического квантования или формулировку интеграла по путям, её можно выразить через бесконечный ряд возмущений «свободной» двухточечной функции[204][205].

В терминах канонического квантовании двухточечная корреляционная функция записывается как[204]:

где  — бесконечно малая, а ϕI — полевой оператор в рамках свободной теории. Здесь экспоненту следует понимать как её степенной ряд. Например, в ϕ4-теории взаимодействующий член гамильтониана равен [200], и разложение двухточечного коррелятора по становится

Это разложение возмущения выражает взаимодействующую двухточечную функцию в терминах величин , которые оцениваются в свободной теории[206].

В формулировке интеграла по путям двухточечная корреляционная функция записывается как

где  — плотность лагранжиана. Как и в предыдущем абзаце, экспонента может быть разложена в ряд по λ, сводя взаимодействующую двухточечную функцию к величинам в свободной теории[205].

Все произведения с нечётным количеством полей в числителе исчезают из-за антисимметрии, поэтому остаются только члены ряда с чётным количеством полей[207]. Теорема Вика дополнительно сводит любую n-точечную корреляционную функцию в свободной теории к сумме произведений двухточечных корреляционных функций. Например, четырёхтечечная корреляционная функция

Поскольку взаимодействующие корреляционные функции могут быть выражены через свободные корреляционные функции, для расчёта всех физических величин во взаимодействующей теории необходимо оценивать только последние[176][207].

Диаграмма Фейнмана[править | править код]

Корреляционные функции в теории взаимодействий можно записать в виде ряда возмущений. Каждый член в этой серии является произведением пропагаторов Фейнмана для свободных частиц и может быть визуально представлен диаграммой Фейнмана. ϕ4-теория является простейшей теорией с взаимодействием, и её часто рассматривают в педагогических целях. Такая нелинейность может появляться в статистической физике и в стандартной электрослабой теории. Лагранжиан этой теории записывается в виде[208]

где λ — безразмерная константа связи, играющая роль малого параметра, по которому строится ряд теории возмущений[200]. Например, вклад порядка λ1 в двухточечной корреляционной функции (функция Грина) в теории ϕ4 имеет следующий вид:

После применения теоремы Вика появляются слагаемые вида[209]

где  — фейнмановский пропагатор. Альтернативно то же слагаемое можно получить из диаграммы Фейнмана

Диаграмма состоит из[210]

  • внешних точек, соединённых одной линией (здесь обозначены и ).
  • внутренних вершин, соединённых линиями (здесь обозначена ).
  • линий, соединяющих вершины.

Каждой вершине соответствует один полевой множитель в соответствующей точке пространства-времени, а края соответствуют пропагаторам между точками пространства-времени. Член в ряду возмущений, соответствующий диаграмме, получается записью выражения, которое следует из правил Фейнмана[211]:

  1. Для каждой внутренней вершины , записывается коэффициент ;
  2. Для каждой линии, соединяющего две вершины и , записывается коэффициент ;
  3. Разделить на коэффициент симметрии диаграммы.

С коэффициентом симметрии , следование этим правилам даёт в точности указанное выше выражение. Используя преобразование Фурье, правила Фейнмана можно переформулировать из координатного пространства в пространство импульсов[211].

Чтобы вычислить n-точечную корреляционную функцию до k-го порядка, перечисляют все допустимые диаграммы Фейнмана с n-внешними точками и k или меньшим количеством вершин, а затем используют правила Фейнмана, чтобы получить выражение для каждого члена. Точнее[212],

равно сумме (соответствующих выражений) всех связанных диаграмм с n внешними точками. (Связанные диаграммы — это такие, в которых каждая вершина соединена с внешней точкой линиями. Компоненты, которые полностью отсоединены от внешних линий, иногда называют «вакуумными пузырями».) В ϕ4 каждая вершина должна иметь четыре ножки[213].

В реальных приложениях амплитуду рассеяния определённого взаимодействия или скорость распада частицы можно вычислить из S-матрицы, которую находят с помощью метода диаграмм Фейнмана[214].

Диаграммы Фейнмана, лишённые петель, называются древесными диаграммами, которые описывают процессы взаимодействия низшего порядка; диаграммы, содержащие n петель, называются n-петлевыми диаграммами, которые описывают вклады более высокого порядка или радиационные поправки к взаимодействию[215]. Линии, конечные точки которых являются вершинами, можно рассматривать как распространение виртуальных частиц[209].

Ренормализация[править | править код]

Правила Фейнмана можно использовать для прямой оценки древовидных диаграмм. Однако наивное вычисление петлевых диаграмм, подобных показанной выше, приведёт к расходящимся интегралам по импульсам, то есть почти все члены в пертурбативном разложении бесконечны. Процедура перенормировки — это систематический процесс удаления таких бесконечностей[216].

Параметры[К 7], входящие в лагранжиан, такие как масса m и константа связи λ, не имеют физического смысла — m, λ и напряжённость поля ϕ не являются экспериментально измеряемыми величинами и упоминаются здесь как голая масса, голая константа связи, и голое поле. Физические масса и константа связи измеряются в некотором процессе взаимодействия и обычно отличаются от голых величин[217]. При вычислении физических величин в этом процессе взаимодействия ограничивают область интегрирования расходящихся интегралов по импульсам до значения ниже некоторого порогового значения импульса Λ, чтобы получить выражения для физических величин, а затем перейти к пределу Λ → ∞. Это пример регуляризации — класса методов для устранения особенностей в КТП, где Λ — параметр регуляризации[218].

Подход, проиллюстрированный выше, называется голой теорией возмущений, поскольку в расчётах используются только голые величины, такие как масса и константа связи. Другой подход, называемый перенормированной теорией возмущений, заключается в использовании физически значимых величин с самого начала. В случае теории ϕ4 сначала переопределяется напряжённость поля[218]:

где ϕ — голое поле, ϕr — перенормированное поле, а Z — постоянная, которую необходимо определить. Плотность лагранжиана имеет вид[219]:

где mr и λr — экспериментально измеряемые перенормированная масса и константа связи, соответственно, а

— константы, которые предстоит определить. Первые три члена представляют собой ϕ4, записанную в терминах перенормированных величин, в то время как последние три члена называются «контрчленами». Поскольку лагранжиан теперь содержит больше слагаемых, диаграммы Фейнмана должны включать дополнительные элементы, каждый со своими собственными правилами Фейнмана. Процедура описывается следующим образом. Сначала выбирается метод регуляризации — например, введённая выше регуляризация обрезанием (с помощью параметра Λ) или размерная регуляризация[en]. Вычисляются диаграммы Фейнмана, в которых расходящиеся члены будут зависеть от параметра регуляризации, например, Λ. Затем определяют δZ, δm и δλ так, чтобы диаграммы Фейнмана для контрчленов в точности сокращали расходящиеся члены в нормальных диаграммах Фейнмана, когда берётся предел Λ → ∞. Таким образом получаются конечные величины[220].

Исключить все бесконечности для получения конечного результата можно только в перенормируемых теориях, тогда как в неперенормируемых теориях бесконечности нельзя удалить путём переопределения конечного числа параметров. Стандартная модель элементарных частиц является ренормализуемой КТП[221], в то время как квантовая гравитация не является ренормализуемой[222].

В квантовой электродинамике при расчёте поправок к кулоновскому взаимодействию при учёте древесной (беспетлевой) и однопетлевой диаграмм[223] возникает модифицированный кулоновский потенциал вида

где  — голый заряд,  — расстояние до заряда,  — масса электрона,  — параметр, отвечающий за ультрафиолетовое обрезание, который ограничивает импульсы частиц при расчёте амплитуды рассеяния. Несмотря на то, что математически это выражение расходится, но для того, чтобы эта поправка сравнялась по величине с главным членом, нужна масса ~ 10250 г, что по величине превышает массу Вселенной[224]. Голый (или затравочный) заряд не наблюдаем сам по себе, поскольку окружён заряженными виртуальными частицами, которые экранируют этот заряд[224]. В реальности на больших расстояниях наблюдается другой физический заряд , который можно посчитать более точно с учётом многопетлевых диаграмм[225]:

Это выражение оказывается конечным при любом значении Если его переписать в виде

то можно заметить, что при некотором значении (полюс Ландау) голый заряд становится бесконечным[226].

Ренормализационная группа[править | править код]

Ренормализационная группа, разработанная Кеннетом Уилсоном, представляет собой математический аппарат, используемый для изучения изменений физических параметров (коэффициентов в лагранжиане), когда система рассматривается на различных масштабах[227]. Способ, в котором каждый параметр изменяется в зависимости от масштаба, описывается её β-функцией[228]. Корреляционные функции, которые лежат в основе количественных предсказаний, изменяются в зависимости от масштаба в соответствии с уравнением ренормгруппы[229].

Например, константа связи в КЭД, а именно элементарный заряд e, имеет следующую β-функцию:

где Λ — масштаб энергии, в котором выполняется измерение e. Это дифференциальное уравнение означает, что наблюдаемый элементарный заряд увеличивается с увеличением масштаба[230]. Перенормированная константа связи, которая изменяется в зависимости от масштаба энергии, также называется бегущей константой связи[231].

Константа связи g в квантовой хромодинамике, неабелевой калибровочной теории, основанной на группе симметрии SU(3), обладает следующей β-функцией:

где Nf — количество ароматов кварка. В случае, когда Nf ≤ 16 (для Стандартной модели Nf = 6), константа связи g уменьшается с увеличением масштаба энергии. Следовательно, в то время как сильное взаимодействие является сильным при низких энергиях, оно становится очень слабым при высоких энергиях — явление, известное как асимптотическая свобода[232].

Конформные теории поля (КТП) — это специальные КТП, допускающие конформную симметрию[en]. Они нечувствительны к изменениям масштаба, так как все их константы связи имеют исчезающе малую β-функцию. Однако обратное неверно — исчезновение всех β-функций не означает конформной симметрии теории[233]. Примеры включают теорию струн[79] и N = 4 суперсимметричную теорию Янга — Миллса[234].

Согласно представлению Уилсона, каждая КТП в основе ограничена по энергии Λ, то есть теория не справедлива при энергиях выше, чем Λ, и все степени свободы выше шкалы Λ не должны учитываться. Например, граница может быть обратной величиной к атомному расстоянию в конденсированной среде, а в физике элементарных частиц она может быть связана с фундаментальной «зернистостью» пространства-времени, вызванной квантовыми флуктуациями гравитации. Масштаб границы в теориях взаимодействия частиц лежит далеко за пределами текущих экспериментов. Даже если теория была бы очень сложной на этом масштабе, до тех пор, пока её связи достаточно слабы, она должна описываться при низких энергиях с помощью перенормируемой эффективной теории поля[235]. Разница между перенормируемыми и неперенормируемыми теориями состоит в том, что первые нечувствительны к деталям взаимодействий при высоких энергиях, в то время как последние не зависят от них[57]. Согласно этой точки зрения, неперенормируемые теории следует рассматривать как низкоэнергетические эффективные теории какой-то более фундаментальной теории. Неспособность избежать ограничения Λ из расчётов в такой теории просто указывает на то, что новые физические явления появляются на масштабах, больших Λ, где необходима новая теория[236].

Другие теории[править | править код]

Диаграмма рассеяния электрона и позитрона[237]. Пример трёхуровневой диаграммы Фейнмана в КЭД. Время бежит слева направо. Она описывает кулоновское взаимодействие через обмен фотоном между электроном и позитроном. Стрелки, указывающие вперёд во времени, представляют распространение электронов, а стрелки, указывающие назад во времени, представляют распространение позитронов. Волнистая линия, не имеющая направления, представляет распространение фотона. Каждая вершина в диаграммах КЭД Фейнмана должна иметь входящую и исходящую фермионную (позитронную/электронную) линию, а также фотонную линию.

Процедуры квантования и перенормировки, описанные в предыдущих разделах, выполняются для свободной теории поля и ϕ4 теории действительного скалярного поля. Аналогичный процесс можно рассмотреть для других типов полей, включая комплексное скалярное поле, векторное поле и поле Дирака, а также для других типов членов взаимодействия, включая электромагнитное взаимодействие и взаимодействие Юкавы[238].

Например, квантовая электродинамика содержит поле Дирака ψ, представляющее электронное поле, и векторное поле Aμ, представляющее электромагнитное (фотонное) поле. Несмотря на свое название, квантовое электромагнитное «поле» на самом деле соответствует классическому электромагнитному 4-потенциалу, а не классическим электрическим и магнитным полям. Полная плотность лагранжиана КЭД равна

где γμ — матрицы Дирака, , а  — тензор электромагнитного поля. Параметрами в этой теории являются масса (голого) электрона m и (голый) элементарный заряд