편미분방정식 풀이의 280년 — 달랑베르에서 FNO까지

PDE 풀이의 기본 전략에서 시작해 — 적분변환, 그린 함수, 수치해석, PINN, 그리고 Fourier Neural Operator(FNO) 까지 — 280년에 걸친 수리물리학과 계산과학의 흐름. 모든 도구는 결국 “다루기 어려운 미분 연산을 다루기 쉬운 무언가로 바꿔치기한다” 는 한 사상에 수렴한다.

이 노트는 Crowdy ↔ Claude 의 2026년 5월 대화록을 LaTeX 로 정리한 학습 노트의 Markdown 판이다. typeset PDF 와 LaTeX 소스는 아래에서 받을 수 있다:

초록

1747년 달랑베르의 파동방정식 풀이에서 출발하여, 라플라스·푸리에의 적분변환, 그린의 점원천 응답 이론, 수치해석의 차분 근사, 그리고 신경연산자에 의한 함수 공간 학습까지 — 모든 도구는 결국 “다루기 어려운 미분 연산을 다루기 쉬운 무언가로 바꿔치기한다” 는 단 하나의 사상에 수렴한다.


서론 — 왜 편미분방정식인가

자연계의 거의 모든 동역학은 편미분방정식으로 기술된다. 파동의 전파, 열의 확산, 유체의 흐름, 전자기장의 변화, 양자역학의 슈뢰딩거 방정식, 일반상대성이론의 아인슈타인 방정식, 금융수학의 블랙-숄즈 방정식 — 모두 PDE 다. 따라서 “PDE 를 푼다” 는 것은 곧 “자연을 예측한다” 는 것과 거의 동의어이다.

이 노트는 PDE 풀이의 기본 개념에서 출발하여 시간 순서로 도구의 발전사를 따라간다. 각 장은 독립적으로 읽힐 수 있지만, 전체를 순서대로 따라가면 “미분이라는 까다로운 연산을 다루기 쉬운 형태로 변환하는 기술” 이 어떻게 발전해 왔는지가 한 줄기로 이어진다.


편미분방정식 풀이의 개요

ODE 와 PDE 의 결정적 차이

상미분방정식(ODE) 과 편미분방정식(PDE) 의 가장 중요한 차이는 해의 자유도 에 있다.

  • ODE: dudx=0u=C\dfrac{du}{dx} = 0 \Rightarrow u = C (상수 하나가 자유)
  • PDE: ux=0u=f(y)\dfrac{\partial u}{\partial x} = 0 \Rightarrow u = f(y) (함수 하나가 통째로 자유)

PDE 의 해 공간이 무한히 더 크기 때문에, 특정 해를 결정하려면 경계조건 또는 초기조건 이 반드시 필요하다. 이것이 PDE 풀이를 ODE 보다 본질적으로 까다롭게 만드는 첫 번째 요인이다.

대표적 풀이 기법

  • 변수분리법(Separation of Variables): u(x,t)=X(x)T(t)u(x,t) = X(x)T(t) 로 가정하여 PDE 를 여러 ODE 로 분해. 열방정식, 라플라스 방정식에서 자주 사용.
  • 특성곡선법(Method of Characteristics): 해가 일정하게 유지되는 특별한 곡선을 따라가며 PDE 를 ODE 로 환원. 1차 PDE 와 쌍곡형 PDE 에 효과적.
  • 좌표변환: 새로운 변수를 도입해 방정식을 단순화. 달랑베르의 파동방정식 풀이가 대표적.
  • 적분변환: 푸리에·라플라스 변환으로 미분을 곱셈으로 변환.
  • 그린 함수: 점원천의 응답을 미리 구하고 적분으로 일반 해를 얻음.
  • 수치해석: 컴퓨터로 근사해를 얻음 (FDM, FVM, FEM 등).

PDE 의 분류

2계 선형 PDE 는 판별식 B2ACB^2 - AC 의 부호로 세 종류로 분류된다.

유형조건대표 예
타원형(elliptic)B2AC<0B^2 - AC < 0라플라스 방정식 2u=0\nabla^2 u = 0
포물형(parabolic)B2AC=0B^2 - AC = 0열방정식 ut=αuxxu_t = \alpha u_{xx}
쌍곡형(hyperbolic)B2AC>0B^2 - AC > 0파동방정식 utt=c2uxxu_{tt} = c^2 u_{xx}

달랑베르의 파동방정식과 연쇄법칙

역사적 배경

1747년, 장 르 롱 달랑베르(Jean le Rond d’Alembert) 는 양 끝이 고정된 진동하는 줄(예: 바이올린 현) 의 운동을 분석하면서 다음 편미분방정식에 도달했다.

2ut2=c22ux2\frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2}

여기서 u(x,t)u(x,t) 는 위치 xx, 시간 tt 에서 줄의 변위, cc 는 파동의 전파 속도이다. 이것이 1차원 파동방정식이며, 수리물리학에서 편미분방정식을 본격적으로 사용한 거의 최초의 사례로 꼽힌다.

달랑베르의 풀이

달랑베르는 다음과 같은 새 좌표를 도입했다.

ξ=xct,η=x+ct\xi = x - ct, \qquad \eta = x + ct

1단계 — 연쇄법칙으로 미분 변환

다변수 연쇄법칙은 다음과 같다. u=u(ξ,η)u = u(\xi, \eta), ξ=ξ(x,t)\xi = \xi(x,t), η=η(x,t)\eta = \eta(x,t) 일 때,

ux=uξξx+uηηx\frac{\partial u}{\partial x} = \frac{\partial u}{\partial \xi}\frac{\partial \xi}{\partial x} + \frac{\partial u}{\partial \eta}\frac{\partial \eta}{\partial x}

직관적으로 “모든 의존 경로의 합” 으로 이해할 수 있다. xx 가 살짝 움직이면 ξ\xi 도 움직이고, η\eta 도 움직이며, 이 둘이 각각 uu 를 움직인다.

새 좌표의 편도함수는 다음과 같이 계산된다.

ξx=1,ξt=c,ηx=1,ηt=c\frac{\partial \xi}{\partial x} = 1, \quad \frac{\partial \xi}{\partial t} = -c, \quad \frac{\partial \eta}{\partial x} = 1, \quad \frac{\partial \eta}{\partial t} = c

따라서 미분 연산자는 다음과 같이 변환된다.

x=ξ+η,t=cξ+cη\frac{\partial}{\partial x} = \frac{\partial}{\partial \xi} + \frac{\partial}{\partial \eta}, \qquad \frac{\partial}{\partial t} = -c\frac{\partial}{\partial \xi} + c\frac{\partial}{\partial \eta}

2단계 — 2계 미분 계산

연산자를 두 번 적용하면, 마치 (a+b)2(a+b)^2, (a+b)2(-a+b)^2 를 전개하듯 다뤄진다.

2ux2=uξξ+2uξη+uηη2ut2=c2(uξξ2uξη+uηη)\begin{aligned} \frac{\partial^2 u}{\partial x^2} &= u_{\xi\xi} + 2u_{\xi\eta} + u_{\eta\eta} \\ \frac{\partial^2 u}{\partial t^2} &= c^2\bigl(u_{\xi\xi} - 2u_{\xi\eta} + u_{\eta\eta}\bigr) \end{aligned}

여기서 혼합편미분의 순서 무관성(클레로 정리): uξη=uηξu_{\xi\eta} = u_{\eta\xi} 를 사용했다.

3단계 — 원래 식에 대입

파동방정식에 대입하면

c2(uξξ2uξη+uηη)=c2(uξξ+2uξη+uηη)c^2(u_{\xi\xi} - 2u_{\xi\eta} + u_{\eta\eta}) = c^2(u_{\xi\xi} + 2u_{\xi\eta} + u_{\eta\eta})

같은 항을 소거하면

2uξη=0\frac{\partial^2 u}{\partial \xi \partial \eta} = 0

4단계 — 적분과 일반해

η\eta 에 대해 적분하면 u/ξ\partial u/\partial \xiξ\xi 만의 함수, 즉 F(ξ)F(\xi). 다시 ξ\xi 로 적분하면 적분상수는 η\eta 만의 함수가 되므로

u(ξ,η)=f(ξ)+g(η)u(\xi, \eta) = f(\xi) + g(\eta)

원래 변수로 복귀하면 달랑베르의 일반해:

u(x,t)=f(xct)+g(x+ct)\boxed{u(x, t) = f(x - ct) + g(x + ct)}

물리적 해석

  • f(xct)f(x - ct): 모양을 그대로 유지한 채 속도 cc오른쪽으로 진행 하는 파동
  • g(x+ct)g(x + ct): 같은 속도로 왼쪽으로 진행 하는 파동

시간이 Δt\Delta t 흐르면 ff 의 그래프 전체가 cΔtc\Delta t 만큼 오른쪽으로 평행이동할 뿐 형태는 변하지 않는다.

달랑베르 공식

초기조건 u(x,0)=φ(x)u(x, 0) = \varphi(x), ut(x,0)=ψ(x)u_t(x, 0) = \psi(x) 가 주어지면 f,gf, g 를 명시적으로 풀 수 있다.

u(x,t)=φ(xct)+φ(x+ct)2+12cxctx+ctψ(s)dsu(x, t) = \frac{\varphi(x-ct) + \varphi(x+ct)}{2} + \frac{1}{2c}\int_{x-ct}^{x+ct} \psi(s)\,ds

수치해석도 푸리에 급수도 없이, 단지 좌표를 잘 잡아서 방정식의 본래 구조(특성곡선 x±ct=constx \pm ct = \text{const}) 를 드러낸 것만으로 일반해가 곧장 나왔다.


적분변환 — 라플라스와 푸리에

핵심 아이디어 — 어려운 세계에서 쉬운 세계로

적분변환의 전체 전략은 다음과 같다.

미분방정식변환대수방정식풀이해(변환된 형태)역변환진짜 해\text{미분방정식} \xrightarrow{\text{변환}} \text{대수방정식} \xrightarrow{\text{풀이}} \text{해(변환된 형태)} \xrightarrow{\text{역변환}} \text{진짜 해}

큰 수의 곱셈이 어려우니 로그를 취해 덧셈으로 바꿔 계산하고 다시 지수를 취해 돌아오는 것과 같은 발상이다.

라플라스 변환의 정의

함수 f(t)f(t) 를 받아 새로운 함수 F(s)F(s) 를 만드는 변환:

F(s)=L[f](s)=0estf(t)dtF(s) = \mathcal{L}[f](s) = \int_0^\infty e^{-st} f(t)\, dt

핵심 성질 — 미분이 곱셈으로

L ⁣[dfdt]=sF(s)f(0)\mathcal{L}\!\left[\frac{df}{dt}\right] = sF(s) - f(0)

증명은 부분적분 한 줄이다.

0estf(t)dt=[estf(t)]0=f(0)+s0estf(t)dt=sF(s)f(0)\int_0^\infty e^{-st} f'(t)\, dt = \underbrace{[e^{-st}f(t)]_0^\infty}_{= -f(0)} + s\int_0^\infty e^{-st} f(t)\, dt = sF(s) - f(0)

간단한 ODE 시연

다음을 풀어보자.

dydt+2y=0,y(0)=3\frac{dy}{dt} + 2y = 0, \qquad y(0) = 3

1단계: 양변에 라플라스 변환

(sY(s)3)+2Y(s)=0(sY(s) - 3) + 2Y(s) = 0

2단계: 대수적 풀이

Y(s)=3s+2Y(s) = \frac{3}{s+2}

3단계: 역변환 (변환표: 1/(s+a)eat1/(s+a) \to e^{-at})

y(t)=3e2ty(t) = 3e^{-2t}

미분방정식이 변환 → 대수 → 역변환의 세 단계로 풀렸다.

파동방정식에 적용

파동방정식에 tt 에 대해서만 라플라스 변환을 적용한다.

U(x,s)=0estu(x,t)dtU(x, s) = \int_0^\infty e^{-st} u(x, t)\, dt

tt 미분은 ss 곱셈이 되고, xx 미분은 그대로 살아남는다.

L ⁣[2ut2]=s2U(x,s)sφ(x)ψ(x)L ⁣[2ux2]=2Ux2\begin{aligned} \mathcal{L}\!\left[\frac{\partial^2 u}{\partial t^2}\right] &= s^2 U(x, s) - s\varphi(x) - \psi(x) \\ \mathcal{L}\!\left[\frac{\partial^2 u}{\partial x^2}\right] &= \frac{\partial^2 U}{\partial x^2} \end{aligned}

원래 방정식은 xx 만의 ODE 로 변환된다.

c2d2Udx2s2U=sφ(x)ψ(x)c^2 \frac{d^2 U}{dx^2} - s^2 U = -s\varphi(x) - \psi(x)

PDE 가 차원이 하나 줄어 ODE 가 됐다. 이를 풀고 역변환하면 결국 달랑베르 공식과 같은 답이 나온다. 길은 달라도 종착지는 같다.


라플라스의 생애와 변환의 역사

라플라스 변환은 라플라스가 만들었나

이름은 라플라스의 것이지만 실제 역사는 더 복잡하다.

📜 역사의 흐름

  • 1744: 오일러가 이런 형태의 적분을 미분방정식의 해로서 처음 연구
  • 1782: 라플라스가 오일러의 정신을 이어받아 확률론 연구에 사용
  • 1809: 라플라스가 변환을 확장하여 무한 확산 해를 다룸
  • 1821: 코시가 라플라스 변환의 연산자 미적분을 개발
  • 1880년대: 영국의 자가학습자 올리버 헤비사이드가 독자적으로 같은 도구에 도달, 전기회로에 응용
  • 1910: 베이트먼이 현대적 형태의 라플라스 변환 사용
  • 1920년대: 도이치가 체계화
  • 1937: 처음으로 교과서 주제가 됨
  • 1950년경: 헤비사이드의 연산자 미적분을 완전히 대체

라플라스가 변환을 발명 한 것은 아닐지 몰라도, 선배들의 산발적 아이디어를 훨씬 뛰어넘는 체계적 이론으로 만들어낸 공로는 분명히 그의 것이다. 우리가 아는 모습이 된 것은 사실상 제2차 세계대전 후 이다.

왜 이런 변환을 만들었는가

  • 확률론의 모함수(generating function): 라플라스는 동전 던지기, 도박 같은 확률 문제에서 이산 수열 ana_nanxn\sum a_n x^n 같은 생성함수로 묶어 미적분으로 처리했다. 적분 형태의 변환은 이걸 연속 분포로 확장한 자연스러운 산물이었다.
  • 천체역학과 확산 문제: 라플라스의 평생 과업은 태양계의 안정성 증명이었다. 뉴턴이 “신의 주기적 개입이 필요하다” 고까지 말한 문제를 순수 수학으로 반박하려 했다. 1809년에 자신의 변환을 확장하여 공간 전체로 무한히 확산되는 해를 찾았다.

라플라스의 생애 요약

  • 1749년 3월 23일: 노르망디 보몽-앙-오주 출생. 농부의 아들.
  • 1766: 캉 대학 입학, 사제가 되기 위한 신학 공부
  • 1768: 학위 없이 파리로. 달랑베르의 인정을 받아 에콜 밀리테르 수학 교수
  • 1773: 24세에 프랑스 과학원 회원
  • 1780: 라부아지에와 함께 호흡이 연소의 일종임을 증명
  • 1785: 16세의 나폴레옹 보나파르트를 시험관 자격으로 만남 — 운명적 인연
  • 1793: 공포정치 시기 파리 밖으로 피신, 처형 모면 (라부아지에는 1794년 단두대)
  • 1799: 나폴레옹에 의해 내무장관 임명 — 6주 만에 해임
  • 1799–1825: 천체역학(Mécanique céleste) 5권 출간
  • 1812: 확률에 관한 해석적 이론 출간
  • 1814: 부르봉 왕가에 충성을 갈아탐, 후작 작위 받음
  • 1827년 3월 5일: 파리에서 사망. 과학 아카데미가 그날의 회의를 취소하여 경의 표함.

유명한 일화 — “신은 필요 없는 가설입니다”

라플라스가 천체역학 을 나폴레옹에게 헌정했을 때, 황제는 “책에 신의 이름이 한 번도 나오지 않는다” 고 지적했다. 라플라스의 답:

“폐하, 그 가설은 필요하지 않았습니다 (Je n’ai pas eu besoin de cette hypothèse).”

이 대화의 정확한 정황은 후대에 윤색되었다는 설이 강하지만, 발언의 정신은 라플라스의 결정론적 세계관을 잘 보여준다. 뉴턴이 신의 주기적 개입을 필요로 봤던 곳에서, 라플라스는 순수한 수학으로 태양계의 안정성을 증명해 보였다.

나폴레옹은 라플라스의 행정관 자격을 평하며 “라플라스는 미적분의 정신을 행정에 들고 왔다” 라고 했다 — 모든 사안에 무한소 분석을 적용하려 했다는 비꼼이었다.


지수함수의 본질 — 왜 ee 의 적분인가

핵심 한 줄 — eaxe^{ax} 는 미분의 고유함수

ddxeax=aeax\frac{d}{dx}e^{ax} = a \cdot e^{ax}

eaxe^{ax} 를 미분하면 형태가 변하지 않고 상수 aa 가 곱해질 뿐이다. 미분이 곱셈이 된다.

선형대수의 언어로, 미분 연산자 d/dxd/dx 를 행렬로 보면 eaxe^{ax} 는 그 행렬의 고유벡터(eigenvector) 이고 aa고유값(eigenvalue) 이다. 행렬을 대각화하면 모든 계산이 쉬워지듯, 미분을 다룰 때 eaxe^{ax} 를 기저로 삼으면 모든 게 쉬워진다.

이게 모든 적분변환에서 ee 가 등장하는 근본 이유 이다. 다른 함수로는 이게 안 된다.

  • ddxsinx=cosx\frac{d}{dx}\sin x = \cos x — 모양이 바뀐다
  • ddxxn=nxn1\frac{d}{dx}x^n = nx^{n-1} — 모양과 차수가 바뀐다
  • ddxeax=aeax\frac{d}{dx}e^{ax} = a\,e^{ax}모양 그대로, 상수만 곱해진다

왜 곱해서 적분하는가 — 내적의 개념

함수의 내적은 벡터 내적의 자연스러운 확장이다.

f,g=f(t)g(t)dt\langle f, g \rangle = \int f(t)\, g(t)\, dt

이산적인 합(\sum) 이 연속적인 합(\int) 으로 바뀐 것뿐, 본질은 같다. 함수도 무한차원 공간의 벡터로 볼 수 있다 는 게 20세기 수학의 핵심 관점이다.

  • 푸리에 변환: f^(ω)=f(t)eiωtdt\hat{f}(\omega) = \int f(t)\, e^{-i\omega t}\, dt — ”ff 가 주파수 ω\omega 의 진동 방향에 얼마나 들어있는가”
  • 라플라스 변환: F(s)=0f(t)estdtF(s) = \int_0^\infty f(t)\, e^{-st}\, dt — ”ff 가 감쇠율 ss 의 지수 방향에 얼마나 들어있는가”

적분변환은 함수를 지수함수라는 기저로 분해 하는 작업이다. 빛을 프리즘에 통과시켜 무지개로 분해하듯, 함수를 무수히 많은 esomethinge^{\text{something}} 성분으로 펼치는 것.

푸리에와 라플라스의 통합 관점

오일러 공식 eiθ=cosθ+isinθe^{i\theta} = \cos\theta + i\sin\theta 가 의미하는 바: 사인·코사인은 사실 eiθe^{i\theta} 의 변형 이다.

cosθ=eiθ+eiθ2,sinθ=eiθeiθ2i\cos\theta = \frac{e^{i\theta} + e^{-i\theta}}{2}, \qquad \sin\theta = \frac{e^{i\theta} - e^{-i\theta}}{2i}

따라서 통합된 관점:

💡 푸리에와 라플라스의 통합

푸리에든 라플라스든, 결국 함수를 eaxe^{ax} 형태의 지수함수들로 분해한다. 다만 어떤 aa 를 허용하느냐가 다르다.

변환"aa" 의 범위의미
푸리에순허수 (a=iωa = i\omega)순수 진동 (감쇠 없음)
라플라스복소수 (a=sa = -s, s=σ+iωs = \sigma + i\omega)진동 + 감쇠

라플라스 변환은 푸리에 변환의 확장이다.

한 개의 지수함수 vs 무한합

y=x2y = x^2 = 한 개의 eaxe^{ax}? — 불가능하다. 그래프 모양이 완전히 다르다.

y=x2y = x^2 = 무한히 많은 eaxe^{ax} 의 가중합? — 적절한 조건 하에서 가능하다.

예: [π,π][-\pi, \pi] 구간에서

x2=π23+4n=1(1)nn2cos(nx)x^2 = \frac{\pi^2}{3} + 4\sum_{n=1}^{\infty} \frac{(-1)^n}{n^2}\cos(nx)

이 공식은 실제로 오일러가 유명한 1/n2=π2/6\sum 1/n^2 = \pi^2/6 을 증명할 때 쓴 도구이기도 하다.

분해 가능성의 경계

함수의 종류와 적절한 변환 도구의 대응:

함수의 종류적절한 변환
적당히 부드럽고 무한대에서 0 으로 가는 함수푸리에 변환
한쪽 방향으로만 정의되고 este^{-st} 가 감쇠시킬 정도로 발산라플라스 변환
구간 위에서 정의된 함수푸리에 급수
상수, 다항식, 디랙 델타 등 일반 함수가 아닌 것분포(distribution) 이론

푸리에가 “모든 함수가 사인파의 합” 이라고 외쳤을 때 라그랑주가 격분한 것은 부분적으로 옳았다. 진짜 모든 함수는 아니다. 하지만 물리적으로 의미 있는 함수들의 매우 넓은 집합은 정말로 분해된다.


부분적분과 통찰력 있는 질문들

L[t2]\mathcal{L}[t^2] 의 계산

목표:

L[t2]=0t2estdt=2s3\mathcal{L}[t^2] = \int_0^{\infty} t^2 e^{-st}\, dt = \frac{2}{s^3}

부분적분 공식 udv=uvvdu\int u\, dv = uv - \int v\, du 를 적용한다. 다항식은 미분하면 단순해지므로 u=t2u = t^2 로 잡는다.

1단계 부분적분

u=t2, du=2tdt, dv=estdt, v=1sestu = t^2,\ du = 2t\,dt,\ dv = e^{-st}\,dt,\ v = -\frac{1}{s}e^{-st}

0t2estdt=[t2sest]0=0+2s0testdt\int_0^\infty t^2 e^{-st}\, dt = \underbrace{\left[-\frac{t^2}{s}e^{-st}\right]_0^\infty}_{= 0} + \frac{2}{s}\int_0^\infty t\, e^{-st}\, dt

경계항이 0인 이유: tt \to \infty 일 때 este^{-st} 가 다항식 t2t^2 보다 훨씬 빠르게 0으로 가기 때문 (s>0s > 0 가정).

2단계 부분적분

u=t, du=dt, dv=estdt, v=1sestu = t,\ du = dt,\ dv = e^{-st}\,dt,\ v = -\frac{1}{s}e^{-st}

0testdt=1s0estdt=1s2\int_0^\infty t\, e^{-st}\, dt = \frac{1}{s}\int_0^\infty e^{-st}\, dt = \frac{1}{s^2}

종합

L[t2]=2s1s2=2s3\mathcal{L}[t^2] = \frac{2}{s} \cdot \frac{1}{s^2} = \frac{2}{s^3}

일반 공식

같은 패턴으로 일반화하면:

L[tn]=n!sn+1\boxed{\mathcal{L}[t^n] = \frac{n!}{s^{n+1}}}

여기서 던질 만한 다섯 가지 통찰력 있는 질문

질문 1 — 왜 n!n! 이 등장하는가

n!n! 은 사실 적분의 자연스러운 산물 이다. 다음 식은 감마 함수 의 정의이다.

n!=Γ(n+1)=0tnetdtn! = \Gamma(n+1) = \int_0^\infty t^n e^{-t}\, dt

L[tn]\mathcal{L}[t^n] 계산은 사실상 s=1s=1 일 때 팩토리얼의 정의 자체 이다.

더 놀라운 것은 감마 함수 덕분에 분수 차수도 계산된다.

L[t1/2]=Γ(3/2)s3/2=π2s3/2\mathcal{L}[t^{1/2}] = \frac{\Gamma(3/2)}{s^{3/2}} = \frac{\sqrt{\pi}}{2s^{3/2}}

조합론(팩토리얼) 과 미적분(감마 함수) 과 원주율(π\pi) 이 한 식에서 만나는 수학의 아름다운 다리 중 하나이다.

질문 2 — ss 미분과의 대칭성

dds(1s)=1s2,d2ds2(1s)=2s3,\frac{d}{ds}\left(\frac{1}{s}\right) = -\frac{1}{s^2}, \quad \frac{d^2}{ds^2}\left(\frac{1}{s}\right) = \frac{2}{s^3}, \quad \ldots

이 패턴은 일반적인 쌍대성으로 정리된다.

L[tf(t)]=ddsF(s)\mathcal{L}[t \cdot f(t)] = -\frac{d}{ds}F(s)

원래 세계에서 tt 를 곱하는 것 = 변환된 세계에서 ss 로 미분하는 것

원래 세계변환된 세계
미분 f(t)f'(t)곱셈 sF(s)sF(s)
곱셈 tf(t)tf(t)미분 F(s)-F'(s)

완벽한 대칭. 이는 푸리에 변환의 하이젠베르크 불확정성 원리 와도 연결되는 깊은 구조이다.

질문 3 — 역변환은 어떻게

엄밀한 역변환 공식은 브롬위치 적분 이다.

f(t)=12πiγiγ+iF(s)estdsf(t) = \frac{1}{2\pi i}\int_{\gamma - i\infty}^{\gamma + i\infty} F(s)\, e^{st}\, ds

복소평면의 수직선 위를 지나가는 적분이다. 라플라스 변환의 진정한 무대는 실수가 아니라 복소수 임을 보여준다.

실용적으로는 거의 모든 경우에 부분분수 분해F(s)F(s) 를 변환표의 조각들로 쪼개서 처리한다. 예:

1s21=1/2s11/2s+1L112et12et=sinht\frac{1}{s^2 - 1} = \frac{1/2}{s-1} - \frac{1/2}{s+1} \xrightarrow{\mathcal{L}^{-1}} \frac{1}{2}e^t - \frac{1}{2}e^{-t} = \sinh t

질문 4 — 수렴영역(ROC)

L[et]\mathcal{L}[e^t] 를 테일러 급수로 항별 변환하면 등비급수가 나오고, 수렴하려면 s>1s > 1 이어야 한다.

L[eat]=1sa(ROC: s>a)\mathcal{L}[e^{at}] = \frac{1}{s-a} \quad (\text{ROC: } s > a)

라플라스 변환은 모든 ss 에서 정의되지 않는다 — 특정 영역에서만 정의된다.

  • L[1]=1/s\mathcal{L}[1] = 1/s (ROC: s>0s > 0)
  • L[eat]=1/(sa)\mathcal{L}[e^{at}] = 1/(s-a) (ROC: s>as > a)
  • L[et2]\mathcal{L}[e^{t^2}]: 어디서도 정의되지 않음 (et2e^{t^2}este^{-st} 보다 빠르게 발산)

이 관점은 신호처리와 제어이론에서 시스템의 안정성 판별에 직접 쓰인다 — 폴(pole) 이 어디에 있느냐가 시스템이 안정한가를 결정한다.

질문 5 — 디랙 델타의 변환

δ\delta 의 체질(sifting property): f(t)δ(t)dt=f(0)\int f(t)\delta(t)\,dt = f(0).

L[δ(t)]=0δ(t)estdt=e0=1\mathcal{L}[\delta(t)] = \int_0^\infty \delta(t)\, e^{-st}\, dt = e^{0} = 1

모든 ss 에서 동일한 값 — 즉 모든 지수함수 성분을 똑같이 포함한다는 의미. 시간 영역에서 한 점에 무한히 집중된 신호가, 변환 영역에서는 완벽하게 펴진 평탄한 분포가 된다. 시간-주파수 쌍대성의 가장 극단적 표현.

이는 제어공학에서 시스템의 임펄스 응답 개념의 수학적 토대이다. 시스템에 순간적인 충격(δ\delta) 을 가했을 때 어떻게 반응하는가 — 그 응답이 시스템의 모든 것을 알려준다.

좋은 질문의 공통 구조

  • 패턴 인식: “왜 하필 이 모양이지?” (질문 1, 4)
  • 대칭성: “한 방향이 됐는데, 반대 방향은?” (질문 2, 3)
  • 경계 사례: “이 도구의 한계는 어디?” (질문 5)

수학에서 가장 좋은 질문은 보통 이 세 갈래에서 나온다.


PDE 풀이의 세 갈래

해석적 vs 수치적 vs ML 기반

방법특성
해석적 (적분변환, 좌표변환 등)답이 수식, 정확함. 단순한 PDE 만 가능.
수치적 (FDM, FVM, FEM)거의 모든 PDE 가능. 답이 격자 위 숫자. 차원의 저주 → 슈퍼컴퓨터 필요.
ML 기반 (PINN, FNO 등)신경망 가중치 학습으로 해 함수 근사. 고차원·역문제에 강함.

수치적 방법의 종류

  • FDM (Finite Difference Method): uxui+1uiΔx\frac{\partial u}{\partial x} \approx \frac{u_{i+1} - u_i}{\Delta x} — 미분을 차분으로 근사
  • FVM (Finite Volume Method): 영역을 작은 체적으로 쪼개고, 각 체적의 경계를 통과하는 흐름의 보존 법칙을 적용
  • FEM (Finite Element Method): 영역을 작은 조각(element) 으로 쪼개고, 각 조각 안에서 간단한 함수(보통 다항식) 로 해를 근사

차원의 저주

3차원 공간 + 시간의 PDE 에서 공간을 NN 개씩 쪼개면:

  • 격자점 수: N3N^3
  • 시간 스텝 포함: 최소 N4N^4
  • N=1000N = 1000 일 때: 101210^{12} 번의 기본 계산 (그것도 한 스텝당)
  • 비선형이면 매 스텝마다 거대한 행렬 풀이 추가

이것이 슈퍼컴퓨터(일본 후가쿠, 미국 프론티어, El Capitan) 가 필요한 본질이다.

PINN — Physics-Informed Neural Networks

2017–2019년경 라이시(Maziar Raissi), 카르니아다키스(George Karniadakis) 등이 제안.

핵심 아이디어

해 함수 u(x,t)u(x, t) 자체를 신경망으로 모델링한다.

u(x,t)uθ(x,t)(θ:신경망 가중치)u(x, t) \approx u_\theta(x, t) \quad (\theta: \text{신경망 가중치})

손실함수:

L(θ)=LPDE+LBC+LIC\mathcal{L}(\theta) = \mathcal{L}_{\text{PDE}} + \mathcal{L}_{\text{BC}} + \mathcal{L}_{\text{IC}}

열방정식 ut=uxxu_t = u_{xx} 의 경우:

LPDE=1Ni=1Nuθt(xi,ti)2uθx2(xi,ti)2\mathcal{L}_{\text{PDE}} = \frac{1}{N}\sum_{i=1}^N \left|\frac{\partial u_\theta}{\partial t}(x_i, t_i) - \frac{\partial^2 u_\theta}{\partial x^2}(x_i, t_i)\right|^2

핵심 기술 — 자동미분(Automatic Differentiation)

신경망의 미분을 수치미분이 아닌 정확한 미분 으로 계산할 수 있다. 신경망은 합성함수 덩어리라서 연쇄법칙을 자동으로 적용하여 미분을 정확히 계산한다. PyTorch, TensorFlow 의 핵심 기능.

PINN vs 전통 수치해석

전통 FVM/FEMPINN
미지수격자점의 값신경망 가중치
해의 표현격자 위 숫자들연속 함수
격자 필요필수불필요
차원의 저주심각완화
역문제어려움자연스러움
정확도 보장격자 정밀화로 가능이론적 보장 부족

PINN 의 강점과 한계

강점:

  • 고차원 PDE 가능 (10차원, 100차원도). 금융수학의 옵션 가격 결정 등.
  • 역문제: “관측 데이터로 PDE 의 계수를 찾아라” 같은 문제에 자연스러움.

한계:

  • 학습 불안정. 다중 손실항의 균형 어려움.
  • 정확도 보장 부족.
  • 복잡한 형상·다물리 문제에는 전통 방법이 우세.
  • 매번 새 PDE 마다 처음부터 재학습.

미분과 차분, 특성곡선법, 그린 함수

미분과 차분의 차이

차분 (Difference)

ΔfΔx=f(x+h)f(x)h\frac{\Delta f}{\Delta x} = \frac{f(x + h) - f(x)}{h}

hh 가 유한한 값. 두 점에서의 함숫값 차이를 거리로 나눈 것. 평균변화율.

미분 (Differentiation)

dfdx=limh0f(x+h)f(x)h\frac{df}{dx} = \lim_{h \to 0} \frac{f(x + h) - f(x)}{h}

차분에서 hh0으로 보낸 극한. 순간변화율, 접선 기울기.

비유

  • 차분(평균 속도): “10초 동안 200m 를 달렸으니 평균 시속 72km”
  • 미분(순간 속도): 자동차 계기판이 보여주는 값

물리적으로 순간 속도는 측정 불가능하다. 모든 측정은 짧은 시간 간격을 필요로 한다.

컴퓨터의 한계

컴퓨터는 극한을 직접 다룰 수 없다. PDE 의 연속적인 미분을 이산적인 차분으로 바꿔치기 해서 푸는 것이 수치해석의 출발이다.

uxxiui+1uiΔx\frac{\partial u}{\partial x}\bigg|_{x_i} \approx \frac{u_{i+1} - u_i}{\Delta x}

이때 발생하는 오차가 이산화 오차(discretization error).

📜 역사적 사실

미분보다 차분이 먼저였다. 17세기 수학자들(윌리스, 페르마) 이 유한차분으로 곡선의 기울기와 면적을 다루고 있었다. 뉴턴/라이프니츠의 혁명은 이 유한차분에 극한 을 도입하여 순간적 양을 정의한 것이다. 21세기 컴퓨터가 다시 차분으로 돌아간 것은 수학사의 원점 회귀이기도 하다.

특성곡선법 (Method of Characteristics)

핵심 아이디어

PDE 의 특별한 곡선들 을 찾아, 그 곡선을 따라가면 PDE 가 단순한 ODE 로 변하는 방법. 이 곡선을 특성곡선(characteristics) 이라 한다.

비유: 험한 산에서 길을 찾을 때 물이 흐르는 길을 따라가면 자연스럽게 아래로 내려간다. 특성곡선은 PDE 의 “물길” 이다.

가장 단순한 예 — 이송방정식

ut+cux=0\frac{\partial u}{\partial t} + c \frac{\partial u}{\partial x} = 0

특성곡선 x=ct+x0x = ct + x_0 위에서:

dudt특성선 위=ut+uxc=0\frac{du}{dt}\bigg|_{\text{특성선 위}} = \frac{\partial u}{\partial t} + \frac{\partial u}{\partial x}\cdot c = 0

즉 특성선 위에서 uu 는 상수. 따라서 초기 모양이 속도 cc 로 평행이동:

u(x,t)=u0(xct)u(x, t) = u_0(x - ct)

파동방정식과의 연결

(tcx)(t+cx)u=0\left(\frac{\partial}{\partial t} - c\frac{\partial}{\partial x}\right)\left(\frac{\partial}{\partial t} + c\frac{\partial}{\partial x}\right)u = 0

두 개의 1차 이송 연산자로 인수분해되며, 두 개의 특성족 x±ct=constx \pm ct = \text{const} 에 해당한다. 해는 두 방향으로 흘러가는 신호의 합 u(x,t)=f(xct)+g(x+ct)u(x, t) = f(x - ct) + g(x + ct)달랑베르 해의 진짜 정체 이다.

비선형 확장 — 충격파

비선형 이송방정식:

ut+uux=0\frac{\partial u}{\partial t} + u\frac{\partial u}{\partial x} = 0

특성선의 속도가 uu 자신에 의존하므로, 값이 큰 곳의 특성선이 빠르게 움직여 서로 교차 할 수 있다. 자연은 이를 충격파(shock wave) 로 해결한다 — 소닉붐, 교통체증의 정체파가 모두 같은 수학적 메커니즘.

그린 함수 (Green’s Function)

역사

📜 조지 그린 (George Green, 1793–1841)

영국 노팅엄의 제분소 주인의 아들. 초등학교만 1년 다녔고 나머지는 모두 독학. 30대 후반에 자비로 출판한 전기와 자기의 수학적 분석에 관한 에세이(1828) 에서 그린 함수 개념을 처음 제시. 당시에는 거의 무시당했고, 켈빈 경(William Thomson) 이 1840년대에 재발견하여 세상에 알렸다. 그린은 자신의 도구의 위력을 알아보지 못한 채 48세에 세상을 떴다.

핵심 아이디어 — 점원천의 응답

복잡한 입력을 점입력들로 분해할 수 있다면, 각 점입력의 응답을 알아두고 합치면 전체 응답을 얻는다.

푸아송 방정식 예시:

2ϕ=ρ-\nabla^2 \phi = \rho

먼저 가장 단순한 원천(점원천) 에 대한 응답 GG 를 구한다.

2G(x,x)=δ(xx)-\nabla^2 G(x, x') = \delta(x - x')

G(x,x)G(x, x')그린 함수 이다. 3차원에서:

G(x,x)=14πxx(쿨롱 전위)G(x, x') = \frac{1}{4\pi|x - x'|} \quad (\text{쿨롱 전위})

중첩 원리의 마법

임의의 전하 분포는 점전하들의 합으로 분해된다.

ρ(x)=ρ(x)δ(xx)dx\rho(x) = \int \rho(x')\delta(x - x')\, dx'

방정식이 선형이므로 응답을 중첩할 수 있다.

ϕ(x)=G(x,x)ρ(x)dx\boxed{\phi(x) = \int G(x, x')\,\rho(x')\, dx'}

한 번 GG 를 구해두면, 어떤 원천이 와도 적분 한 번으로 끝.

비유 — 콘서트홀의 음향

콘서트홀의 어느 자리에서 한 번 박수를 친다. 청중석에서 어떻게 들리는지 측정한 것이 임펄스 응답 = 그린 함수의 물리적 형제. 이걸 알아두면 그 자리에서 어떤 음악을 연주해도 청중석의 소리를 계산할 수 있다.

이것이 신호처리에서 시스템의 임펄스 응답 = 시스템의 완전한 정체성 이라는 원리이며, L[δ]=1\mathcal{L}[\delta] = 1 과 직접 연결된다.

그린 함수의 응용

  • 전자기학: 점전하의 쿨롱 포텐셜
  • 양자장론: 입자의 전파인자(propagator). 파인만 다이어그램의 각 선이 그린 함수.
  • 열전달: 한 점의 순간 열 펄스의 응답
  • 확률론과 금융수학: 전이확률, 옵션 가격 결정
  • 의료영상: CT, MRI 재구성

세 도구의 통합 관점

도구철학시대 정신
특성곡선법PDE 의 물리적 흐름을 따라가자18–19세기, 물리적 직관
그린 함수점원천 응답을 알면 모두 안다19세기, 선형성과 중첩
차분 (수치해석)극한을 포기하고 격자에서 풀자20세기, 컴퓨터

FNO — 푸리에 신경연산자

가장 큰 도약 — 함수가 아니라 연산자를 학습하라

PINN vs FNO

  • PINN: 특정 PDE 의 특정 해 함수 u(x,t)u(x, t) 를 신경망으로 표현. 초기조건이 바뀌면 처음부터 재학습.
  • FNO: PDE 의 연산자(operator) 자체 를 학습. 임의의 입력 함수에 대한 해 함수를 출력하는 규칙 을 배운다.
G:a(x)입력 함수u(x)해 함수\mathcal{G}: \underbrace{a(x)}_{\text{입력 함수}} \mapsto \underbrace{u(x)}_{\text{해 함수}}

비유: PINN 은 “피아노 한 곡을 외워 치는 학생”, FNO 는 “악보 읽는 법을 배운 피아니스트”. 한 번 학습되면 새 입력에도 즉시 “연주” 할 수 있다.

연산자 학습의 역사

  • 2019: DeepONet (Lu et al.) — 첫 신경연산자
  • 2020: FNO (Li et al.) — 푸리에 공간에서 적분 커널을 매개변수화

이론적 토대 — 그린 함수의 부활

선형 PDE 의 해는 그린 함수와 입력의 합성곱:

u(x)=G(x,x)a(x)dxu(x) = \int G(x, x')\, a(x')\, dx'

일반화하면 임의의 연산자를 적분 커널로 표현 가능.

(Ga)(x)=κ(x,x)a(x)dx(\mathcal{G}a)(x) = \int \kappa(x, x')\, a(x')\, dx'

💡 FNO 의 핵심 발상

이 커널 κ\kappa 를 신경망으로 학습하자.

즉 FNO 는 “학습 가능한 그린 함수” 이다. 어떤 PDE 인지 명시적으로 모르더라도, 데이터를 통해 그 PDE 의 그린 함수에 해당하는 커널을 신경망이 찾아낸다. 19세기 그린 함수의 21세기 부활.

왜 푸리에인가 — 합성곱 정리

직접 적분 κ(x,x)a(x)dx\int \kappa(x, x')a(x')dx' 를 계산하면 격자점 NN 개에 대해 O(N2)O(N^2). 3차원이면 O(N6)O(N^6) — 차원의 저주 부활.

합성곱 정리:

fg^=f^g^\widehat{f * g} = \hat{f} \cdot \hat{g}

실공간에서의 합성곱 = 푸리에 공간에서의 단순 곱셈. FFT 는 O(NlogN)O(N\log N).

O(N2)실공간 합성곱    O(NlogN)푸리에 경유 합성곱\boxed{\underbrace{O(N^2)}_{\text{실공간 합성곱}} \;\Longrightarrow\; \underbrace{O(N\log N)}_{\text{푸리에 경유 합성곱}}}

그린 함수와의 적분을 푸리에 공간에서의 단순 곱셈으로 바꿔치기.

FNO 아키텍처

FNO 는 크게 세 부분으로 구성된다.

  1. 리프팅(Lifting) PP: 입력 함수를 고차원 채널 공간으로 끌어올림.
  2. 푸리에 층 (Fourier Layer) (반복, 보통 4–8회): 핵심부.
  3. 투영(Projection) QQ: 다시 출력 차원으로 압축.

각 푸리에 층의 네 단계:

  1. FFT: 푸리에 공간으로 변환
  2. 저차 모드 곱셈: 낮은 주파수 모드에만 학습 가능한 복소수 가중치 RR 곱셈 (학습의 핵심)
  3. 역 FFT: 실공간으로 복귀
  4. 잔차 결합: 선형 변환 WW 를 옆길로 더함 (ResNet 스타일 skip connection)

저차 모드 절단의 의미

학습 가능한 푸리에 필터를 차원당 가장 낮은 mm 개 모드로 제한. 자연 현상이 대체로 부드럽기 때문에(저주파 성분이 지배적이기 때문에) 잘 작동한다. 부드러움 정규화 역할도 한다.

진짜 마법 — 해상도 무관성

💡 Discretization Invariance

64×6464 \times 64 격자로 학습한 신경망이 즉시 1024×10241024 \times 1024 격자에서 잘 작동한다.

푸리에 모드는 격자 크기와 무관한 함수 이기 때문이다. 모드 5번은 격자가 64개든 1024개든 같은 사인파다. 따라서 저차 모드 위의 가중치 RR 은 격자 해상도와 분리되어 있다.

전통 시뮬레이션은 해상도가 두 배 되면 계산이 16배 폭증하는 반면, FNO 는 학습 비용에 거의 변화가 없다.

실전 — FourCastNet 과 NVIDIA Earth-2

FourCastNet (2022)

NVIDIA, 로렌스 버클리 국립연구소, 미시간 대학, 라이스 대학 공동 개발.

  • 해상도: 0.250.25^\circ (적도 부근 30km×30km30\text{km} \times 30\text{km}, 720×1440720 \times 1440 픽셀)
  • 속도: 전통 NWP 대비 45,000배 빠름
  • 정확도: ECMWF IFS 시스템과 비견될 수준 (IFS 와 직접 비교 가능한 최초의 AI 모델)
  • 일주일치 예보 생성: 2초

FourCastNet 3 (2025–2026)

  • 단일 NVIDIA H100 GPU 에서 60일치 0.25도, 6시간 해상도 예보 = 4분
  • GenCast 대비 8배, IFS-ENS 대비 60배 빠름
  • 60일 확장 리드 타임에서도 스펙트럼 특성 보존
  • 운영 환경 투입: DTN 의 사이클론 추적 모델 (2025년 6월), Eni 의 가스 수요 예측, GCL 의 광전지 예측 시스템 등

한계

  • 주기적 경계 가정: 푸리에 변환은 본질적으로 주기 함수 가정. 복잡한 형상에는 어려움. (해결책: Spherical FNO, Geo-FNO, Domain Decomposition FNO)
  • 저주파 편향: 전역 푸리에 필터와 절단 때문에 고주파 현상(날카로운 경계, 충격파) 을 놓치기 쉬움.
  • 모드 절단의 트레이드오프: 편향-분산. 적절한 모드 수 선택 자체가 학습 작업.

그래도 2025–2026년 현재 신경연산자 분야의 표준 아키텍처 이다.


결론 — 280년의 흐름

한 줄로 꿴 여정

연도사건
1747달랑베르 — 좌표변환으로 파동방정식 풀이. 특성곡선의 첫 등장.
1782–1809라플라스 — 함수를 지수함수들의 합으로 분해. 미분을 곱셈으로.
1807–1822푸리에 — 함수를 사인파의 합으로 분해.
1828그린 — 점원천 응답으로 모든 응답을 안다. 적분 커널의 발견.
1880년대헤비사이드 — 연산자 미적분, 전기회로 응용.
20세기 중반컴퓨터 등장 — 미분을 차분으로. FDM, FVM, FEM. 슈퍼컴퓨터의 시대.
2017PINN — 자동미분으로 PDE 를 손실함수의 제약으로. 신경망이 해 함수가 된다.
2020FNO — 연산자 자체를 학습. 푸리에 공간에서 그린 함수에 해당하는 적분 커널을 데이터로부터 발견.
2025–2026FourCastNet 3 — 운영 환경 투입. 일기예보가 단일 GPU 에서 분 단위로.

불변의 사상

도구는 바뀌었어도 바꿔치기의 정신 은 변하지 않았다.

  • 미분을 차분 으로 바꾸고 (수치해석)
  • 미분을 곱셈 으로 바꾸고 (적분변환)
  • PDE 를 특성곡선 위의 ODE 로 바꾸고 (특성곡선법)
  • PDE 를 그린 함수와의 합성곱 으로 바꾸고 (그린 함수)
  • PDE 를 신경망의 자동미분과 손실함수 로 바꾸고 (PINN)
  • PDE 를 학습된 푸리에 공간의 곱셈 으로 바꾼다 (FNO)

280년의 수리물리학과 계산과학의 흐름은 결국 단 하나의 사상으로 수렴한다:

“다루기 어려운 미분 연산을 다루기 쉬운 무언가로 바꿔치기하는 기술의 발전사”

그리고 그 마지막 정거장에서, 푸리에가 처음 던진 “함수를 진동의 합으로 분해한다” 는 발상은 21세기 일기예보의 심장부에서 다시 살아 움직이고 있다. 200년 전의 수학이 살아남기는커녕 더 깊이 작동하고 있다 — 이것이 수학의 진짜 아름다움이다.


부록 — 더 깊이 들어가고 싶다면

이 노트에서 다룬 주제를 더 파고들 수 있는 방향들:

  • DeepONet: FNO 의 사촌. 다른 접근(branch + trunk 네트워크) 으로 연산자 학습.
  • Diffusion 기반 PDE 풀이: 2024–2025년 가장 활발한 흐름. 확산 모델을 PDE 해결에 응용.
  • 신경연산자의 이론적 보장: Operator Universal Approximation Theorem.
  • Spherical FNO, Geo-FNO: 구면 또는 불규칙 도메인에서의 FNO.
  • Differentiable Physics: 시뮬레이션 전체를 미분 가능하게 만들어 역설계.
  • NVIDIA PhysicsNeMo, Earth-2: Physics-ML 의 산업적 구현.
  • 함수해석학과 분포 이론: 슈바르츠, 힐베르트 공간, 소볼레프 공간.
  • 복소해석학과 라플라스 변환의 역변환: 브롬위치 적분의 본격 다루기.