0장 — 이 책을 읽기 전에: 무대, 기호, 배경 수학

이 책이 무엇을 다루는지, 자주 등장하는 수학 기호를 어떻게 읽는지, 그리고 본문이 말없이 가정하는 무한급수·자연상수·테일러 급수의 배경 지식을 한 자리에 모아 둔다.

들어가며

해석역학 본문은 학부 1–2학년 수준의 미적분과 선형대수를 이미 손에 익었다고 가정한 채 출발한다. 그러나 같은 학부 1–2학년이라도 라이프니츠 표기 df/dxdf/dx 와 편미분 f/x\partial f/\partial x 의 차이가 즉시 떠오르지 않을 수 있고, ee 가 어떤 의미에서 자연상수인지, 테일러 급수가 왜 행렬에도 통하는지가 흐릿할 수 있다. 이 0장은 그런 흐릿함을 본격적인 1장 전에 한 번에 닦아 두는 자리다.

세 가지를 다룬다. 본론 1은 이 책이 무엇을 다루는 책인지 — 즉 어떤 물리적 상황을 어떤 좌표계로 적는 일을 하는 책인지 — 를 짧게 못 박는다. 본론 2는 본문에서 끊임없이 등장하는 수학 기호를 읽는 법을 사전처럼 모은다. 본론 3은 본문이 출발선부터 가정하는 무한급수·자연상수·테일러 급수의 배경 지식을 정리한다. 어떤 항목도 정밀한 정의를 노리지 않는다. 1장의 식을 읽을 때 손에 잡혀 있어야 할 어휘그림을 챙기는 것이 목적이다.

본론 1 — 이 책은 무엇을 다루는가

해석역학은 우주의 물체가 어떻게 움직이는가 를 적는 학문이다. 점입자, 막대, 줄에 매달린 추, 철사 위의 비드, 회전하는 강체, 행성·위성 — 이런 물체들의 시간에 따른 위치를 함수 몇 개로 묘사하는 일이 전부다.

뉴턴이 이미 답을 내놓았다 — F=mx¨\mathbf{F} = m \ddot{\mathbf{x}}. 입자 하나의 위치 벡터 x(t)\mathbf{x}(t) 가 시간에 대한 이차 상미분방정식을 만족한다는 진술이다. 자유 입자라면 이 한 줄로 끝난다.

문제가 시작되는 자리는 물체에 구속(constraint)이 걸려 있을 때다. 구속이란 물체의 위치 가능성을 좁히는 조건을 뜻한다. 몇 가지 예:

  • 단진자의 추는 길이가 일정한 막대에 매달려 있다 — 추의 위치는 원 위에 묶인다.
  • 비드는 굽은 철사를 따라서만 움직인다 — 위치는 그 곡선 위에 묶인다.
  • 강체는 모든 점 사이 거리가 보존된다 — 강체의 모든 점이 함께 움직이도록 묶인다.
  • 행성은 만유인력 중심에 묶여 궤도를 돈다 — 위치 자체는 자유롭지만 움직일 수 있는 방식이 중력에 의해 제한된다.

이런 구속이 있을 때, 위치를 (x,y,z)(x, y, z) 세 좌표로 적는 방식은 비효율적이다. 단진자라면 막대 각도 θ\theta 하나면 충분하다. 비드라면 철사를 따른 호 길이 ss 하나면 충분하다. 강체라면 무게중심 위치 셋과 자세 셋, 합쳐 여섯 개면 충분하다. 구속을 미리 반영해서 좌표를 잡으면, 운동을 적는 식의 길이가 짧아진다. 이 책의 전반부는 그 짧아진 식이 어떻게 자연스럽게 떨어지는가 — 다시 말해 라그랑지언 LL해밀턴 함수 HH 가 어디서 오는가 — 를 따라간다.

조금 더 구체적으로. 1장에서는 자유 좌표 q1,q2,,qnq^1, q^2, \dots, q^n — 구속을 다 반영하고 남은 최소한의 좌표들 — 의 함수로 운동을 적는 방식을 본다. 2장은 곡면 위의 운동, 3–6장은 그것을 정밀히 적을 수학(텐서·다양체·벡터장·미분형식), 7–9장은 라그랑주 형식, 10–12장은 해밀턴 형식이다.

이 책에서 중력은 가장 흔한 외력이라 거의 모든 예제에 끼어든다. 그러나 다루는 운동이 중력만에 한정된 것은 아니다. 스프링의 탄성력, 전자기력, 만유인력, 어떤 보존력이든 같은 틀로 다뤄진다. “우주의 물체”라는 표현은 그 모든 경우 — 책상 위 추부터 위성까지 — 를 포괄한다.

한 줄로 줄이면, 이 책의 작업은 다음과 같다.

구속이 있는 좌표계 위에서 시간에 따라 변하는 함수 qi(t)q^i(t) 가 어떤 방정식을 만족하는가 — 그 방정식을 가장 짧고 가장 좌표 자유롭게 적는 방법을 찾는 일.

이 한 문장이 1장부터 12장까지의 모든 작업의 뼈대다.

본론 2 — 자주 나오는 수학 기호를 읽는 법

본문에서 끊이지 않고 등장하는 기호를 한 자리에 모은다. 정확한 정의가 아니라 읽는 법이다.

변수와 함수

  • x,y,zx, y, z — 보통 실수 변수. 자주 직교좌표.
  • tt — 시간.
  • f(x)f(x) — 변수 xx 를 받아 값을 돌려주는 함수.
  • x\mathbf{x} 또는 x\vec{x} — 굵은 글씨/화살표는 벡터. x=(x,y,z)\mathbf{x} = (x, y, z) 처럼 성분 묶음을 나타낸다. 굵게 적지 않은 xx 는 보통 스칼라.
  • x|x| — 실수의 절댓값. x\|\mathbf{x}\| — 벡터의 길이(노름). x=x2+y2+z2\|\mathbf{x}\| = \sqrt{x^2 + y^2 + z^2}.

시간 미분 — 뉴턴 점 표기

  • x˙dxdt\dot{x} \equiv \dfrac{dx}{dt} — 시간에 대한 1차 미분. 입자의 속도.
  • x¨d2xdt2\ddot{x} \equiv \dfrac{d^2 x}{dt^2} — 시간에 대한 2차 미분. 입자의 가속도.
  • 점 표기는 항상 시간에 대한 미분을 가리킨다. 다른 변수에 대한 미분이면 점이 아니라 df/dxdf/dx, f/q\partial f/\partial q 처럼 적는다.

도함수와 편미분

  • dfdx\dfrac{df}{dx} — 한 변수 함수 f(x)f(x) 의 보통 미분.
  • fx\dfrac{\partial f}{\partial x}편미분. ff 가 여러 변수 (x,y,)(x, y, \dots) 의 함수일 때, 다른 변수는 고정하고 xx 만 변화시켜 얻는 미분.

왜 두 종류가 필요한가? f(x,y)=x2yf(x, y) = x^2 y 라면

fx=2xy,fy=x2.\frac{\partial f}{\partial x} = 2 x y, \qquad \frac{\partial f}{\partial y} = x^2.

같은 함수에 대해 변수마다 다른 미분이 나온다. 보통 미분 기호 d/dxd/dx 로는 어느 변수에 대한 미분인지가 모호하기에, 여러 변수 함수에서는 \partial 을 쓴다.

  • dfdfff작은 변화. 본문 6장에서는 이것이 “미분형식”이라는 정밀한 대상이 되지만, 그 전에는 ”ff 가 입력 변화에 따라 얼마만큼 변하는가”의 약식 표기로 읽으면 된다.

집합과 차원

  • R\mathbb{R} — 실수 전체 집합.
  • Rn\mathbb{R}^n — 실수 nn 개를 한 줄로 묶은 것. R3={(x,y,z):x,y,zR}\mathbb{R}^3 = \{(x, y, z) : x, y, z \in \mathbb{R}\} 은 3차원 공간.
  • C\mathbb{C} — 복소수 전체. Z\mathbb{Z} — 정수 전체. N\mathbb{N} — 자연수.
  • \in — “원소이다”. xRx \in \mathbb{R} 은 ”xx 는 실수다”.
  • \subset — “부분집합이다”.
  • {:}\{ \cdots : \cdots \} — “조건 뒤를 만족하는 원소들의 집합”. 콜론 ”:” 또는 ”|” 가 “such that”의 자리에 온다.

합·곱·인덱스

  • i=1nai=a1+a2++an\sum_{i=1}^n a_i = a_1 + a_2 + \cdots + a_n — 합.
  • i=1nai=a1a2an\prod_{i=1}^n a_i = a_1 \cdot a_2 \cdots a_n — 곱.
  • aia_i (아래 첨자) — ii 번째 원소. ii라벨이지 거듭제곱이 아니다.
  • aia^i (위 첨자) — 이 책에서는 거듭제곱이 아니라 인덱스로 쓰는 경우가 많다. v2v^2 는 “벡터 vv 의 두 번째 성분”이지 ”vv 의 제곱”이 아니다. 제곱이 필요할 때는 (v2)2(v^2)^2 처럼 괄호로 구분한다.

위와 아래 첨자를 둘 다 쓰는 이유는 기저성분을 한눈에 구별하기 위해서다. 더 자세한 규약(아인슈타인 합 규약)은 3장에서 다루므로 지금은 첨자 위치가 어딘가 의미를 담고 있다는 것만 알아 두면 된다.

그리스 문자

이 책에서 자주 마주치는 글자만:

소문자읽기자주 쓰이는 자리
α,β,γ\alpha, \beta, \gamma알파, 베타, 감마일반 매개변수, 곡선의 이름
δ\delta델타변분, 작은 변화
Δ\Delta델타 (대문자)유한한 차이
ϵ,ε\epsilon, \varepsilon엡실론작은 양수
θ,ϕ,φ\theta, \phi, \varphi세타, 파이각도
λ\lambda람다라그랑주 곱수, 고윳값
μ,ν\mu, \nu뮤, 누일반 인덱스
ξ\xi크사이보조 변수, 작은 변위
ρ\rho로우밀도
σ\sigma시그마표면, 응력
τ\tau타우시간 매개변수, 토크
ω\omega오메가각속도, 진동수, 미분형식
Σ\Sigma시그마 (대문자)
Π\Pi파이 (대문자)
Ω\Omega오메가 (대문자)위상공간, 영역

읽는 법은 한국·일본 관행과 영미 관행이 조금씩 다르지만, 머릿속에서 “그리스 글자 = 어떤 보조 변수”로 받아들이면 첫 통과는 충분하다.

비슷하게 생긴 기호, 다른 뜻

  • ee자연상수 2.71828\approx 2.71828. 보통 글꼴로 쓴다.
  • exe^x지수함수. 밑이 자연상수 ee.
  • eie_i기저 벡터. 아래 첨자가 붙으면 ”ii 번째 기저 방향”.
  • 같은 ‘e’ 모양이지만 셋은 완전히 다른 대상이다. 문맥으로 구분한다.

또 자주 헷갈리는 것:

  • dd in dxdx — 미분 기호.
  • dd in detA\det A — determinant 의 약자.
  • 굵은 d\mathbf{d} — 미분형식에서 외미분.

같음·근사·화살표

  • == — 같다.
  • \equiv — 정의에 의해 같다(“이렇게 정의한다”).
  • \approx — 근사적으로 같다. 예: sinxx\sin x \approx x (x|x| 가 작을 때).
  • \sim — 같은 차수다. 예: x0x \to 0 일 때 sinxx\sin x \sim x.
  • \propto — 비례한다.
  • \to — 극한의 화살표. x0x \to 0 은 ”xx 가 0 으로 간다”. 또는 함수의 출발–도착: f:RRf : \mathbb{R} \to \mathbb{R}.
  • \mapsto — 함수가 특정 입력을 어떤 출력으로 보내는지. xx2x \mapsto x^2 는 ”xx 를 받아 x2x^2 을 돌려주는 함수”.

기타 자주 등장하는 기호

  • \nabla — 나블라. 기울기/발산/회전 연산자. 본문에서는 주로 f\nabla f (스칼라 함수의 기울기).
  • i/xi\partial_i \equiv \partial/\partial x^iii 번째 좌표에 대한 편미분의 줄임.
  • δij\delta_{ij} — 크로네커 델타. i=ji = j 면 1, 아니면 0.
  • I\mathbf{I} 또는 II — 항등행렬.

이 사전을 한 번 훑어 둔 뒤 본문으로 들어가면, 처음 등장하는 기호 앞에서 멈추는 일이 적어진다.

본론 3 — 책이 가정하는 수학 배경

무한급수 — “무한히 많은 수를 더해 한 수가 된다”

수열 a1,a2,a3,a_1, a_2, a_3, \dots부분합 SN=a1+a2++aNS_N = a_1 + a_2 + \cdots + a_N 을 생각하자. NN 을 키우면 SNS_N 이 점점 어떤 수 SS 에 가까워질 수 있다. 그 SS무한급수의 값이고 다음처럼 적는다.

n=1anlimNn=1Nan.\sum_{n=1}^\infty a_n \equiv \lim_{N \to \infty} \sum_{n=1}^N a_n.

이 극한이 존재하면 급수가 수렴(converges), 존재하지 않거나 무한대로 가면 발산(diverges)이다.

수렴의 예. 등비급수 1+12+14+18+1 + \tfrac{1}{2} + \tfrac{1}{4} + \tfrac{1}{8} + \cdots 의 부분합은 1,1.5,1.75,1.875,1.9375,1, 1.5, 1.75, 1.875, 1.9375, \dots22 에 무한히 가까워진다. 그러므로

n=012n=2.\sum_{n=0}^\infty \frac{1}{2^n} = 2.

발산의 예. 조화급수 1+12+13+14+1 + \tfrac{1}{2} + \tfrac{1}{3} + \tfrac{1}{4} + \cdots 는 항이 점점 작아지지만 부분합은 천천히 무한대로 발산한다(증명은 미적분 교과서에 맡긴다).

직관 한 가지. 항이 0 으로 간다는 사실은 수렴의 필요조건일 뿐 충분조건이 아니다. 조화급수가 그 예다.

이 책에서 무한급수가 등장하는 자리는 둘이다. 첫째, 함수를 다항식의 무한합으로 적는 테일러 급수. 둘째, 행렬·연산자에 지수함수를 정의하는 자리 — 행렬 지수 etAe^{tA}, 그리고 후반의 일반 흐름의 생성. 어느 자리에서든 “무한히 많은 항의 합”이 등장할 때, 부분합이 한 곳에 가까워진다는 사실이 뒤에서 보장하고 있다고 받아들이면 된다.

자연상수 ee — “스스로의 미분이 자기 자신인 함수의 밑”

e2.71828e \approx 2.71828\dots. 어떤 무리수가 아니라 미분과 가장 짝이 잘 맞는 수다.

같은 수 ee 를 가리키는 세 가지 정의를 나란히 둔다.

1. 복리의 극한.

e=limn(1+1n)n.e = \lim_{n \to \infty} \left( 1 + \frac{1}{n} \right)^n.

1원을 연이율 100% 로 맡기는 상황을 떠올리자. 이자를 1년에 한 번 받으면 1(1+1)=21 \cdot (1 + 1) = 2 원. 반 년마다 받으면 (1+1/2)2=2.25(1 + 1/2)^2 = 2.25 원. 매월 받으면 (1+1/12)122.613(1 + 1/12)^{12} \approx 2.613 원. 매일 받으면 (1+1/365)3652.7146(1 + 1/365)^{365} \approx 2.7146 원. 이자 지급 주기를 무한히 짧게 만들면 한 점에 멈추는데, 그 점이 ee 다.

2. 무한급수.

e=1+11!+12!+13!+14!+e = 1 + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \frac{1}{4!} + \cdots

이 급수가 수렴하는지는 부분합이 빠르게 안정되는 것에서 보인다: 1,2,2.5,2.667,2.708,2.717,2.718,1, 2, 2.5, 2.667, 2.708, 2.717, 2.718, \dots.

3. 미분방정식의 해.

dfdx=f(x),f(0)=1\frac{df}{dx} = f(x), \qquad f(0) = 1

의 유일한 해 f(x)=exf(x) = e^x.

세 번째 성질이 결정적이다. exe^x 는 미분해도 자기 자신이다. 그래서 미분이 자기 자신을 다시 부르는 양 — 시간에 따라 일정 비율로 변하는 양, 상미분방정식의 해, 행렬의 지수 — 어느 자리에서든 ee 가 자연스럽게 나타난다.

이 책에서 ee 가 가장 두드러지는 자리는 행렬 지수 etAe^{tA} 이다. AAn×nn \times n 행렬일 때

etAI+tA+(tA)22!+(tA)33!+e^{tA} \equiv I + tA + \frac{(tA)^2}{2!} + \frac{(tA)^3}{3!} + \cdots

으로 정의한다. 이 정의가 가능한 이유는 위의 두 번째 정의 — exe^x 가 다항식의 무한합이라는 사실 — 에 있다. 변수 xx 자리에 행렬 tAtA 를 넣어도 합이 잘 수렴하기 때문이다.

테일러 급수 — “함수를 한 점 근방에서 다항식으로 풀어 쓴 것”

매끄러운 함수 f(x)f(x) 를 한 점 x=ax = a 근방에서 다항식으로 근사할 수 있다.

f(x)=f(a)+f(a)(xa)+f(a)2!(xa)2+f(a)3!(xa)3+f(x) = f(a) + f'(a)(x - a) + \frac{f''(a)}{2!}(x - a)^2 + \frac{f'''(a)}{3!}(x - a)^3 + \cdots

여기서 f,f,f', f'', \dotsff 의 1차, 2차 미분이다. a=0a = 0 인 경우(매클로린 급수)가 자주 쓰인다. 본문에서 자주 등장하는 셋:

ex=1+x+x22!+x33!+x44!+e^x = 1 + x + \frac{x^2}{2!} + \frac{x^3}{3!} + \frac{x^4}{4!} + \cdots sinx=xx33!+x55!x77!+\sin x = x - \frac{x^3}{3!} + \frac{x^5}{5!} - \frac{x^7}{7!} + \cdots cosx=1x22!+x44!x66!+\cos x = 1 - \frac{x^2}{2!} + \frac{x^4}{4!} - \frac{x^6}{6!} + \cdots

직관. 함수의 0차 정보는 한 점에서의 함숫값, 1차 정보는 기울기, 2차 정보는 곡률, … — 미분을 더 많이 챙길수록 함수의 그 점 근방에서의 모양을 더 정확히 흉내 낼 수 있다는 뜻이다. 1차까지만 쓰면 접선, 2차까지 쓰면 접하는 포물선, 그 이상은 더 정교한 곡선.

작은 진동의 근사. 작은 xx 에서는 첫 몇 항만 더해도 꽤 정확하다. 단진자의 운동방정식에서 흔히 보는 sinθθ\sin\theta \approx \theta (θ\theta 가 작을 때)는 사인의 테일러 급수에서 첫째 항만 남긴 결과다. 본문에서 작은 진동 또는 선형화 근사가 등장하면, 거의 모두 테일러 급수의 첫 한두 항만 살린 식이다.

테일러 급수가 변수만의 것이 아니다. 위 식에서 xx 자리에 행렬을 대입해도 표기가 살아남는다. 그 결과가

etA=I+tA+(tA)22!+(tA)33!+e^{tA} = I + tA + \frac{(tA)^2}{2!} + \frac{(tA)^3}{3!} + \cdots

이라는 행렬 지수다. 스칼라 지수의 테일러 급수를 형식적으로 행렬에 옮긴 것 — 이것이 본문 후반에서 등장하는 모든 “연산자 지수”의 출발점이다.

수렴 조건은 따로 챙겨 두자. 스칼라 테일러 급수는 함수와 점에 따라 수렴 반경이 있다 — ex,sinx,cosxe^x, \sin x, \cos x 처럼 모든 xx 에서 수렴하는 경우도, log(1+x)\log(1 + x) 처럼 x<1|x| < 1 에서만 수렴하는 경우도 있다. 행렬 지수 etAe^{tA} 는 모든 행렬 AA 와 모든 tt 에서 수렴한다는 좋은 성질을 갖는다 — 이 사실은 본문에서 따로 증명 없이 받아들인다.

다음 장으로

1장에서는 뉴턴의 F=mx¨\mathbf{F} = m \ddot{\mathbf{x}}일반 좌표 q1,,qnq^1, \dots, q^n 의 언어로 다시 쓰면서 라그랑지언이 자연스럽게 떠오르는 과정을 본다. 그때 이 0장의 세 가지 — 본론 1의 무대(구속이 있는 좌표계), 본론 2의 기호(qi,q˙i,/qiq^i, \dot q^i, \partial/\partial q^i), 본론 3의 테일러 급수 — 가 동시에 작동한다.

이 0장에서 다룬 어떤 기호든 아직 어색하게 느껴진다면 1장으로 넘어가기 전에 본론 2의 표를 한 번 더 훑어 두는 것을 권한다. 어휘가 머리에서 손으로 옮겨 가야 다음 장의 식이 비로소 읽힌다.

다음 장 — 1장: 운동 방정식