변분 원리 — 작용을 정류시키는 경로
변분 원리 — 작용을 정류시키는 경로
경로 에 수를 대응시키는 범함수 — 그 정류점이 운동방정식이라는 한 줄이, 좌표를 잊고 장과 양자까지 가는 다리 전체를 떠받친다.
들어가며
7장에서 라그랑지안 라는 함수 하나에 오일러–라그랑주(Euler–Lagrange) 방정식이라는 한 줄짜리 미분 절차를 돌려 운동방정식을 끌어냈다. 단진자에서 그 절차가 실제로 돌아가는 것을 손으로 봤다. 그러나 그 오일러–라그랑주 방정식이 어디서 왔는가 는 미뤄 뒀다. 이번 장은 그 식의 출처를 밝힌다.
답은 작용(action) 이라는 단 하나의 수다. 운동의 후보가 되는 경로 하나를 통째로 집어넣으면 수 하나가 나오는 양 — 그것이 작용이고, 자연이 실제로 고르는 경로는 이 수를 정류(stationary) 시키는 경로다. 이 한 문장이 해밀턴 원리(Hamilton’s principle) 다.
7장의 오일러–라그랑주 방정식은 국소적 이다 — 매 순간의 위치·속도·가속도를 한 점에서 묶는 미분방정식. 변분 원리는 전역적 이다 — 출발점에서 도착점까지의 경로 전체를 한꺼번에 보고 그중 하나를 골라낸다.
본론 1은 작용이 어떤 종류의 양인지 — 범함수 — 를 잡고, 본론 2는 에서 오일러–라그랑주를 손으로 유도하고, 본론 3은 이 형식이 점 입자에서 장·게이지·일반상대성·양자 경로적분까지 하나의 언어로 이어지는 보편성을 다룬다.
본론 1 — 범함수로서의 작용
범함수(functional) 는 함수 한 개를 통째로 먹고 수 하나를 뱉는 기계다. 보통의 함수 가 수 하나(시각 )를 받아 수 하나()를 돌려준다면, 범함수는 시각 하나가 아니라 곡선 전체 — 부터 까지의 라는 곡선 한 줄 — 를 입력으로 받아 수 하나를 대응시킨다.
예가 여럿 있다. 평면 위 곡선 의 곡선의 길이 는 곡선 전체를 보고 나서야 정해지는 수다 — 한 점만 봐서는 알 수 없다. 비눗물에 철사 고리를 담갔다 빼면 생기는 비누막의 넓이 도 마찬가지다. 영역 위에 정의된 함수 의 적분 도 그렇다. 모두 “함수가 들어가면 수가 나온다”는 같은 구조다.
이 예들에는 공통점이 하나 더 있다 — “어떤 함수가 그 수를 가장 작게 만드는가”라는 질문이 따라온다. 두 점을 잇는 곡선 중 길이를 최소로 만드는 것은 직선이고, 철사 고리에 걸린 비누막이 실제로 취하는 모양은 넓이를 최소로 만드는 곡면이다. 비누막은 표면장력 때문에 넓이를 줄이려 하고, 그 줄이려는 경향의 평형점이 우리가 보는 막의 모양이다. 변분 원리는 이 관찰을 역학 전체로 밀어붙인 것이다 — 입자의 운동도 어떤 범함수를 정류시키는 곡선을 찾는 문제라는 주장이다. 그 범함수가 작용 이다.
헷갈리기 쉬운 곳 — 범함수는 함수가 아니라 함수의 함수다. 라는 표기를 보면 처럼 읽고 싶어진다. 함수 의 입력 는 수 이고, 범함수 의 입력 는 함수 다. 그래서 표기도 둥근 괄호 가 아니라 각진 괄호 를 쓴다. 입력 슬롯에 숫자 한 개가 아니라 그래프 한 장이 통째로 들어간다. 를 조금 바꾼다는 말은 ” 라는 그래프의 모양을 살짝 비튼다”는 뜻이지, ” 라는 숫자를 조금 키운다”는 뜻이 아니다.
시각 와 그 사이의 매끄러운 경로 가 주어지면, 작용은
으로 정의된다. 후보 경로 하나에 대해 매 순간의 값을 부터 까지 적분한 수 — 그것이 그 경로의 작용이다. 경로를 다르게 고르면 작용도 다른 수다.
작용의 단위 는 에너지() 곱하기 시간() — SI 로는 (줄·초). 양자역학에서 플랑크 상수 (에이치바)가 정확히 같은 단위 를 갖는다. 작용과 가 같은 단위라는 것은 가 순수한 수 — 단위 없는 무차원 양 — 라는 뜻이고, 양자역학에서 모든 경로가 라는 위상을 들고 더해질 때 그 지수가 단위 없는 수라야 말이 된다.
해밀턴 원리(principle of stationary action). 두 끝점을 고정한다 — , . 이 끝점을 잇는 모든 매끄러운 경로 — 직선처럼 가는 것, 크게 휘어 가는 것, 출렁이며 가는 것 — 중 자연이 실제로 실현하는 경로는 작용 의 정류점(stationary point) 이다.
정류점이란, 어떤 경로 에서 출발해 그것을 살짝 비틀어 로 바꿨을 때, 작용 의 일차 변화가 0 이라는 뜻이다. 산에서 한 걸음 어느 방향으로 떼어도 높이가 (일차적으로) 변하지 않는 지점 — 봉우리, 분지 바닥, 안장의 한가운데가 모두 그런 지점이다.
보통 함수 의 극값 조건이 — 일차 변화율이 0 — 인 것과 같은 논리다. 는 “경로를 만큼 비틀었을 때 작용이 변한 양 중 에 비례하는 부분”, 곧 일차항이다. 의 제곱 이상 고차항은 가 작으면 무시할 수 있다. 변수가 수 가 아니라 함수 라는 것뿐이다.
헷갈리기 쉬운 곳 — 정류 ≠ 최소 — 안장점일 수 있다. “최소 작용 원리”라는 이름 탓에 자연이 작용을 가장 작게 만드는 경로를 고른다고 오해하기 쉽다. 자연이 고르는 것은 작용을 정류 시키는 경로이지, 반드시 최소화하는 경로가 아니다. 정류점에는 세 종류 — 분지 바닥(최소), 봉우리(최대), 그리고 한 방향으로는 올라가고 다른 방향으로는 내려가는 안장점 — 가 있고, 실제 물리 문제에서 안장점인 경우는 드물지 않다. 정확한 이름은 “정류 작용 원리”다.
변분 는 경로 에 더하는 작은 비틂이고, 끝점에서 사라져야 한다 — , . 해밀턴 원리가 끝점이 고정된 경로들끼리만 비교하기 때문이다. 모든 후보 경로가 같은 에서 출발해 같은 에 도착한다. 비틀 수 있는 것은 중간 부분 뿐이다.
헷갈리기 쉬운 곳 — 끝점은 변수가 아니라 고정된 경계조건이다. 은 문제 설정 자체의 일부지 계산 편의를 위한 가정이 아니다. 우리가 묻는 질문은 ” 에서 로 가는 주어진 여행에서 어떤 중간 경로가 실현되는가”이다. 출발점과 도착점은 질문에 박혀 있는 상수이지 답이 정해 주는 변수가 아니다. 본론 2의 부분적분 경계항이 깨끗하게 사라지는 것도 이 경계조건의 결과다.
본론 2 — 에서 오일러–라그랑주
표기는 7장과 같이 아인슈타인 합 규약을 쓰고, 자유도 인덱스는 .
물리적 경로 를 살짝 비튼 경로 의 작용 차이 를 의 일차까지만 전개한다. 작용은 의 적분이므로 연쇄법칙으로
가 된다. 첫째 항은 ” 슬롯을 만큼 흔든 의 변화”, 둘째 항은 ” 슬롯을 만큼 흔든 의 변화”다.
둘째 항의 는 비틀어진 경로의 속도 에서 원래 속도 를 뺀 것이므로
이다. 속도의 변분은 변분의 속도와 같다 — 변분 와 시간 미분 가 가환 이다.
헷갈리기 쉬운 곳 — 와 는 가환이다. 는 “경로를 다른 경로로 옮기는” 연산, 는 “한 경로 위에서 시간으로 미분하는” 연산이다. 둘은 서로 다른 방향의 작용이라 간섭하지 않는다 — 비틂 자체가 의 매끄러운 함수이고, 그것을 시간으로 미분한 것이 곧 속도의 변분이다. “먼저 경로를 비틀고 그 속도를 본다”와 “먼저 속도를 보고 그것을 비튼다”는 같은 결과를 준다. 이 가환성이 없으면 다음 단계의 부분적분이 성립하지 않는다.
의 둘째 항이 가 된다. 여기에 부분적분 을 걸어 에 걸린 를 쪽으로 옮기면
우변 앞의 대괄호는 경계항, 뒤의 적분은 미분이 옮겨 간 남은 적분 이다.
헷갈리기 쉬운 곳 — 부분적분이 핵심 트릭이다. 부분적분 전 에는 둘째 항에서 가 아니라 — 변분의 미분 — 가 곱해져 있다. 이 상태로는 곧 쓸 기본 보조정리를 적용할 수 없다. 부분적분이 하는 일은 미분을 에서 떼어내 계수() 쪽으로 옮기는 것이다. 그러면 모든 항이 가 아니라 맨 에 곱해진 모양으로 통일되고, 비로소 ” 의 계수 전체가 0”이라는 결론으로 갈 수 있다.
경계항 는 본론 1의 경계조건 에 의해 통째로 사라진다.
남은 적분을 첫째 항과 합치면
가 된다. 작용의 일차 변화가 “어떤 양”과 ""의 곱을 적분한 모양이다.
해밀턴 원리는 물리적 경로에서 을 요구한다. 이것은 어떤 특정한 에 대해서가 아니라 임의의 허용 가능한 — 끝점에서만 0이면 중간은 무엇이든 — 에 대해 성립해야 한다.
변분법의 기본 보조정리(fundamental lemma). 어떤 연속함수 가 끝점에서 0인 모든 매끄러운 에 대해 을 만족하면 .
헷갈리기 쉬운 곳 — 기본 보조정리: ‘모든 시험함수에 대해 0’이 ‘함수 자체가 0’을 강제한다. 귀류법. 가 한 점 에서 이라 하자. 가 연속이니 근방 작은 구간에서 계속 양수다. 그 구간에서만 봉긋 솟고 나머지에서 0인 매끄러운 종모양 함수를 로 고르면 — 가정과 모순. 시험함수를 자유롭게 고를 수 있다는 자유가 ” 를 한 점씩 콕콕 찔러 볼 수 있는” 권능이다.
부분적분 후 손에 있는 것은 이라는 적분이 0 이라는 정보뿐이다. 적분이 0이라고 해서 피적분 함수가 0인 것은 일반적으로 아니다 — 양수 구간과 음수 구간이 상쇄될 수 있다. 이 간극을 메우는 것이 기본 보조정리다. 모든 에 대해 적분이 0이라는 강한 정보가 있어야 피적분 함수가 0이라는 결론으로 건너간다. 해밀턴 원리의 “임의의 허용 가능한 “가 이 다리를 놓는다.
보조정리로 괄호 안의 양이 모든 에 대해 0:
이것이 오일러–라그랑주 방정식 이다. 7장에서 받아 적었던 그 식이 단 하나의 범함수 의 정류 조건으로부터 유도되었다. 7장에서 단진자의 두 편미분 — 일반화 운동량 , 일반화 힘 — 이 여기서는 작용을 변분할 때 자연스럽게 갈라져 나오는 두 항으로 등장한다.
유도의 다섯 단계: (1) 작용의 일차 변화 를 연쇄법칙으로 전개해 항과 항을 얻는다. (2) 를 둘째 항에 넣는다. (3) 부분적분으로 그 항의 미분을 에서 떼어내 계수 쪽으로 옮긴다 — 경계항이 떨어져 나온다. (4) 끝점 조건으로 경계항을 죽인다. (5) 모든 항이 에 곱해진 모양으로 통일되면 기본 보조정리로 계수 전체를 0으로 만든다. 이 다섯 단계는 이 무엇이든, 자유도가 몇이든 그대로 돌아간다.
본론 3 — 왜 이것이 그저 대수가 아닌가
오일러–라그랑주 방정식은 변분 원리를 거치지 않고도 유도된다. 뉴턴 법칙을 일반화 좌표로 변환해도, 다양체 위의 측지선 방정식으로 봐도 나온다. 변분 원리가 “역학의 진짜 출발점”으로 모셔지는 이유는 결과가 아니라 형식 자체 에서 오는 세 가지에 있다.
첫째, 좌표 자유성(coordinate-freedom). 작용 는 스칼라다 — 경로 하나에 대응하는 수 하나. 좌표를 데카르트로 잡든 극좌표로 잡든 구면좌표로 잡든, 같은 물리적 경로의 작용은 같은 수 다. 정류점은 ” 가 어떻게 변하는가”에만 의존하므로 가 좌표와 무관하면 정류점도 좌표와 무관하다. 7장에서 라그랑주 역학의 큰 보상으로 꼽았던 좌표 무관성이 변분 원리의 시점에서는 증명할 필요조차 없는 자명한 결과가 된다.
헷갈리기 쉬운 곳 — 의 좌표 무관성이 곧 EL의 좌표 무관성이다. 7장에서는 곡선 좌표의 크리스토펠 기호 가 라그랑지안 안에 어떻게 흡수되는지를 따져 좌표 무관성을 설명했다. 변분 원리에서는 두 줄이다 — (1) 는 좌표와 무관한 수다. (2) 정류점은 만으로 정의된다. 따라서 오일러–라그랑주 방정식의 해는 좌표와 무관하다. 작용을 스칼라로 정의한 순간 이미 손에 쥐고 있었던 것이다.
둘째, 가산성(additivity). 두 부분계 1, 2 와 그 사이 상호작용이 있을 때 전체 라그랑지안은 다. 적분은 선형이니 , 변분도 선형이라 . 부분계를 하나 더 붙이는 일이 항을 하나 더하는 일 로 끝난다. 뉴턴 법칙으로는 자유도가 늘 때마다 자유물체도를 새로 그리고 미지의 구속력을 다시 세야 하지만, 변분 원리에서는 덧셈이 전부다. 후속 권에서 장(field)을 다룰 때 라그랑지안이 라그랑지안 밀도 로 바뀌어도 “부분의 작용을 더한다”는 구조는 그대로 살아남는다.
셋째, 확장성. 작용 원리는, 우리가 아는 한, 역학을 점 입자에서 시작해 장·게이지 이론·일반상대성·양자 경로적분까지 하나의 언어로 끌고 가는 유일한 형식이다. 뉴턴의 힘 균형은 장이론으로 가면 어색해지고 게이지 대칭을 자연스럽게 담지 못한다. 작용 원리는 ” 를 적고 을 건다”는 절차가 입자에서도, 전자기장에서도, 휘어진 시공간에서도 똑같이 작동한다. 새 물리는 새 절차가 아니라 새 를 적는 것으로 들어온다.
전자기학은 맥스웰 방정식을 따로 외우는 대신 전자기장의 작용 하나로 요약되고, 일반상대성은 시공간의 곡률로 만든 작용 하나에서 아인슈타인 방정식 전체가 으로 떨어진다. 입자물리학의 표준모형조차 결국 하나의 라그랑지안 — 한 줄의 작용 — 으로 적힌다. 이론을 세우는 일이 “올바른 를 찾는 일”이 되고, 만 정해지면 운동방정식은 본론 2의 다섯 단계로 기계적으로 떨어진다. 작용은 대칭을 담기에도 자연스럽다 — “이 작용이 어떤 변환 아래 불변인가”를 묻는 것만으로 이론의 대칭 구조가 드러나고, 그 대칭이 보존량을 낳는다는 것이 다음 장의 주제다.
그 확장의 끝에 양자역학의 경로적분이 있다. 양자역학에서는 입자가 단 하나의 경로를 따라가지 않는다 — 모든 경로가 동시에 기여한다. 각 경로는 라는 위상을 들고 오고, 모든 경로의 이 위상들을 더해서 입자가 한 점에서 다른 점으로 갈 확률 진폭을 얻는다. 는 허수단위 , (에이치바, )는 플랑크 상수로 단위 — 작용 와 같은 단위라 가 무차원이고, 의 지수가 말이 된다.
헷갈리기 쉬운 곳 — 경로적분: 모든 경로가 기여하지만 정류 경로 근방에서 위상이 보강간섭한다. 가 큰 — 정류점에서 멀리 떨어진 — 경로들은 이웃 경로와 작용 값이 크게 다르고, 의 위상이 경로마다 마구 달라져 더할 때 상쇄된다(소멸간섭). 정류 경로 근방에서는 작용의 일차 변화가 0이니 이웃 경로들의 작용이 거의 같다 — 위상이 거의 같은 채로 더해지니 보강된다(보강간섭). 인 고전 극한에서는 정류 경로 근방만 살아남는다. 자연은 정류 경로를 고르는 게 아니라, 모든 경로가 기여하되 정류 경로 근방만 간섭에서 살아남는 것이다. 고전역학의 “단 하나의 경로”는 양자역학의 간섭이 남긴 그림자다.
파이썬으로 확인
# 단진자의 이산 변분 적분(symplectic Verlet)으로 경로를 그리고
# 이산 에너지가 (소소한 진동은 있어도) 시간에 따라 표류하지 않음을 본다.
# 라그랑지언 L = (1/2) θ̇² + cos θ (g/ℓ = 1).
import numpy as np
import matplotlib.pyplot as plt
dt = 0.05
N = 200
theta = np.empty(N + 1)
theta[0] = 0.5 # 초기 각도 [rad]
theta[1] = theta[0] # 초기 속도 0 ⇒ q₁ ≈ q₀
# 이 라그랑지언에 대한 이산 EL = symplectic Verlet
for n in range(1, N):
theta[n + 1] = 2 * theta[n] - theta[n - 1] - dt**2 * np.sin(theta[n])
# 이산 운동에너지 (중심차분)와 위치에너지로 이산 에너지 정의
v = (theta[2:] - theta[:-2]) / (2 * dt)
E = 0.5 * v**2 - np.cos(theta[1:-1])
t = np.arange(N + 1) * dt
fig, ax = plt.subplots(2, 1, figsize=(6, 4), sharex=True)
ax[0].plot(t, theta); ax[0].set_ylabel("θ [rad]")
ax[1].plot(t[1:-1], E); ax[1].set_ylabel("이산 에너지")
ax[1].set_xlabel("t"); plt.tight_layout(); plt.show()
print(f"E_min = {E.min():.6f}, E_max = {E.max():.6f}")
이 코드는 작용 원리를 수치 적분기의 차원에서 다시 보여 준다. 보통의 적분기는 운동방정식 를 직접 시간으로 전진시키지만, 이 코드의 갱신식 theta[n+1] = 2*theta[n] - theta[n-1] - dt**2*np.sin(theta[n]) 은 그렇게 나온 게 아니다. 작용 적분 를 시간으로 잘게 쪼개 이산화한 뒤, 그 이산 작용을 각 시각의 에 대해 정류시켜 — 을 풀어 — 얻은 식이다. 본론 2에서 연속 작용을 변분해 오일러–라그랑주를 얻은 그 과정을, 적분 대신 합으로, 변분 대신 편미분으로 옮긴 것이다. 이 적분법을 변분 적분기(variational integrator) 또는 심플렉틱 베를레(symplectic Verlet) 라 부른다.
코드는 theta 궤적을 굴린 뒤 중심차분으로 속도 v 를 잡고 이산 운동에너지와 위치에너지로 이산 에너지 E 를 정의한 다음 그 시간 변화를 그린다. 단순 오일러법으로 같은 진자를 풀면 매 스텝 미세한 오차가 한 방향으로 쌓여 이산 에너지가 천천히 표류 한다 — 긴 시간이 지나면 진자가 점점 빨라지거나 느려진다.
변분 적분기에서는 각도가 진폭이 거의 일정한 진동을 그리고, 이산 에너지는 작은 폭(약 이하) 안에서 출렁이기만 한다 — 표류하지 않는다. print 가 찍는 E_min 과 E_max 의 차이가 그 출렁임의 폭이고, 그 폭이 시간이 아무리 길어져도 커지지 않는다. 이 적분기가 이산 작용의 정류 조건 에서 나왔기 때문에, 연속 작용 원리가 보존 법칙을 떠받치듯 이산 작용 원리도 이산판 보존 구조를 떠받친다. 그 “왜”의 정확한 답은 다음 장의 주제다.
다음 장으로
9장: 대칭과 보존량 — 뇌터 정리에서는 이 장에서 본 작용이 연속 대칭 — 시간 평행이동, 공간 평행이동, 회전 — 아래에서 불변일 때, 그 대칭 하나하나마다 정확히 하나의 보존량(에너지, 운동량, 각운동량)이 자동으로 따라 나옴을 본다. 파이썬 절에서 변분 적분기가 에너지를 표류시키지 않은 것이 그 첫 신호였다.