걸어가는 수학 — ee 를 둘러싼 여러 얼굴

π\pi 가 “원이라는 모양”에서 나오는 상수라면, ee 는 “스스로에 비례해서 변한다”는 규칙에서 나오는 상수다. 걷기, 콩나무, 식어가는 커피, 노화, 홍수, 동전 던지기 — 일상의 비유로 ee 가 입는 여러 옷을 본다.


걸어가는 수학: dd, 2d2d, d-d

집에서 학교까지 걸어가는 거리를 dd 라 하자. 같은 방향으로 간 만큼 다시 가면 집을 기준으로 2d2d 의 거리에 있고, 학교 반대 방향으로 가면 집을 기준으로 d-d 가 된다.

길 가운데에 사나운 개가 있어서 그 주위를 피해가려고 반호처럼 돌아가면, 돌아서 걸어간 거리는 개와 떨어진 거리 rrπ\pi 배 — 즉 πr\pi r 이다. 이게 원주의 절반 이라는 사실에서 π\pi 가 처음 자기 모습을 드러낸다.

여기에 반지름 rr 을 한 번 더 곱하면 πrr=πr2\pi r \cdot r = \pi r^2 — 원의 넓이 다. 직관: 원을 얇은 부채꼴 여러 개로 잘라 펴서 직사각형처럼 다시 짜면 가로가 πr\pi r (반호의 길이), 세로가 rr (반지름) 인 도형이 된다. 그래서 원주 절반 × 반지름 = 원의 넓이 다. π\pi 라는 같은 한 수가 둘레의 절반넓이 두 군데에 똑같이 나타난다.

이번에는 반호 위 어디까지 걸었느냐를 묻는다. 반호 한 가닥 (πr\pi r) 위에서 각도 θ\theta 만큼, 즉 거리 rθr\theta 만큼 걸었다고 하자. 개로부터의 방사 방향 을 종단(縱)이라 하고 그에 수직인 방향을 횡단(橫)이라 하면, 그 자리에서 횡단·종단 거리는 각각

횡단 거리=rsinθ,종단 거리=rcosθ\text{횡단 거리} = r \sin\theta, \qquad \text{종단 거리} = r \cos\theta

이다. 즉 sinθ\sin\thetacosθ\cos\theta반호 위 한 점이 출발 방향에서 얼마나 비켜섰는지rr 의 배수로 적은 양이다.

  • 출발점 (θ=0\theta = 0): sin0=0\sin 0 = 0, cos0=1\cos 0 = 1 — 횡단으로 비킨 게 없고, 종단으로는 rr 만큼 떨어진 자리.
  • 반호의 정중간 (θ=π/2\theta = \pi/2): sin(π/2)=1\sin(\pi/2) = 1, cos(π/2)=0\cos(\pi/2) = 0 — 횡단으로 rr 만큼 비켜섰고, 종단으로는 출발점과 같은 자리(개와 일직선상).
  • 반호 끝 (θ=π\theta = \pi): sinπ=0\sin\pi = 0, cosπ=1\cos\pi = -1 — 횡단은 0 이고 종단으로는 출발점의 정반대 쪽에 rr 만큼.

한 가지 더 — 반호 어디에 있든 개와의 거리는 변하지 않고 항상 rr 이다. 좌표로 적으면 위치는 (rcosθ,rsinθ)(r\cos\theta, r\sin\theta) 이므로 개(=원점)까지 거리의 제곱은

(rcosθ)2+(rsinθ)2=r2(cos2θ+sin2θ)=r2(r\cos\theta)^2 + (r\sin\theta)^2 = r^2(\cos^2\theta + \sin^2\theta) = r^2

— 양변을 r2r^2 로 나누면 피타고라스 항등식 sin2θ+cos2θ=1\sin^2\theta + \cos^2\theta = 1 이 떨어진다. 원 위를 움직인다는 사실이 곧 횡단·종단의 제곱 합이 일정하다는 사실이다. π\pi모양 의 상수라 부르는 이유 — 그 모양에서 둘레, 넓이, 사인·코사인, 피타고라스 항등식이 한꺼번에 따라 나오기 때문이다.

이렇게 일상의 걷기 속에 부호, 거리, 그리고 π\pi — 그 옆에 따라 나오는 sin,cos\sin, \cos 까지 — 자연스럽게 등장한다. 이 노트에서 다룰 주인공은 다음 상수, 자연상수 ee 이다.


ee 의 본래 정체: 멀어질수록 빨라진다

먼저 작은 정정: ee 는 흔히 “오일러 상수(Euler’s number)“라 부른다. “테일러 상수”라는 표현은 잘못된 것으로, 테일러는 테일러 급수의 그분이다.

걷는 사람의 비유

집에서 1 m 떨어진 지점에서 출발한다고 하자. 걷는 규칙은 특이하다 — 걷는 속도(m/s)는 항상 집으로부터의 거리(m)와 같다.

  • 1 m 지점에서는 1 m/s 로 걷는다
  • 1.5 m 지점에서는 1.5 m/s
  • 2 m 지점에서는 2 m/s

이 규칙대로 정확히 1초 동안 걸으면 어디에 도착할까?

정확히 ee 미터 (2.718\approx 2.718 m) 지점이다.

이게 ee 의 본래 정체다. “지금 위치가 곧 속도”인 운동에서 단위 시간이 지나면 도달하는 거리. 이자 이야기는 이 운동을 돈으로 번역한 것일 뿐이고, 원형은 “스스로의 크기에 비례해서 변하는 것”이라는 더 보편적인 현상이다.

  • 2초 동안 걸으면 e27.39e^2 \approx 7.39 m 지점
  • 3초면 e320.1e^3 \approx 20.1 m
  • 거꾸로, 위치가 두 배(2 m)가 되는 데 걸리는 시간은 ln20.693\ln 2 \approx 0.693

흥미로운 점은, 이 규칙을 정하는 순간 ee 가 단위와 무관하게 튀어나온다는 것. 미터로 재든 광년으로 재든, 1초 후 위치는 출발점의 정확히 ee 배. 단위로부터 자유로운 이 비율이 ee 를 밑으로 하는 로그를 “자연(natural)로그”라 부르는 이유이기도 하다.

잭과 콩나무

같은 그림을 세로축으로 펼치면 콩나무가 된다.

콩나무가 자라는 속도(m/s)는 지금 콩나무의 키(m)와 같다.

  • 키가 1 m 일 때는 1 m/s 로 자란다
  • 키가 1.5 m 가 되면 그 순간 1.5 m/s 로 자라고
  • 키가 2 m 가 되면 2 m/s

잭은 콩나무 꼭대기를 붙잡고 있다. 처음 키는 1 m. 그 자리에서 정확히 1초를 버티면 잭은 ee 미터 (2.718\approx 2.718 m) 높이에 있다.

키가 커질수록 자라는 속도도 같이 빨라지니까 1초 안에 일어나는 일이 균일하지 않다. 첫 0.5초 동안에는 약 0.65 m 올라가지만, 나머지 0.5초 동안에는 약 1.07 m 올라간다. 뒤로 갈수록 가속이 붙는다.

  • 2초 뒤: e27.39e^2 \approx 7.39 m
  • 3초 뒤: e320.1e^3 \approx 20.1 m
  • 10초 뒤: 약 22 km — 잭은 이미 구름 위, 거인의 집 문턱

수식으로 쓰면 콩나무의 키 h(t)h(t) 는 미분방정식

dhdt=h,h(0)=1\frac{dh}{dt} = h, \qquad h(0) = 1

의 해이며, 그 해가 정확히 h(t)=eth(t) = e^t 이다.

관찰. 걷는 사람과 콩나무는 수학적으로 똑같은 그림이다. “현재의 크기가 변화의 속도를 정한다”는 규칙은 어떤 옷을 입혀도 항상 ee 를 불러낸다. 돈이든, 사람이든, 콩나무든, 세균이든, 식어가는 커피든, 방사성 동위원소든.

π\pi 가 “원이라는 모양”에서 나오는 상수라면, ee 는 “스스로에 비례해서 변한다는 규칙”에서 나오는 상수다.


같은 규칙의 다른 옷들

“스스로에 비례해서 변한다”는 규칙은 자연 곳곳에 숨어 있다. 크게 두 종류로 나뉜다 — 늘어나는 쪽과 줄어드는 쪽.

늘어나는 쪽 (지수적 증가)

세균 분열. 분열하는 “전체 양”은 지금 있는 세균 수에 비례한다. 1마리 있을 때는 다음 순간 1마리가 더 생기는 속도지만, 1000마리가 있으면 1000마리가 더 생기는 속도.

산불. 타고 있는 면적이 클수록 가장자리(불의 최전선)도 길어지고, 그만큼 단위 시간에 새로 타는 면적도 커진다. 작은 불씨가 무서운 이유.

입소문, SNS 바이럴. 아는 사람이 많을수록 새로 전파되는 속도가 빨라진다.

줄어드는 쪽 (지수적 감소)

뜨거운 커피. 주변 온도와의 차이가 클수록 빨리 식는다(뉴턴의 냉각법칙). 90도 커피는 빨리 식지만, 30도쯤 되면 잘 안 식는다 — 차이가 줄어든 만큼 식는 속도도 줄어드니까. 커피가 미지근해질 때까지의 곡선이 정확히 ee 의 곡선이다.

방사성 붕괴. 1 kg 의 우라늄이 있을 때 1초 동안 붕괴하는 양과, 100 g 남았을 때 1초 동안 붕괴하는 양은 다르다 — 남은 양에 비례. “반감기”라는 개념이 깔끔하게 정의되는 것도 이 규칙 덕분이다.

욕조의 물. 마개를 뽑았을 때 수압(=물의 깊이)이 클수록 빨리 빠지고, 얕아질수록 느려진다.

기타. 약물의 혈중 농도, 콘덴서의 방전, 어두운 방에서 눈이 적응하는 속도, 새 직장에서의 긴장감이 풀리는 속도.

두 종류를 가르는 것

두 종류를 가르는 건 단 하나, 부호다.

\frac{dy}{dt} &= +y &&\Rightarrow\quad y(t) = e^{+t} \quad (\text{증가}) \\ \frac{dy}{dt} &= -y &&\Rightarrow\quad y(t) = e^{-t} \quad (\text{감소}) \end{aligned}$$ 같은 $e$ 가 한쪽에서는 폭발적인 성장으로, 다른 쪽에서는 점점 잦아드는 평온함으로 나타난다. 콩나무와 식어가는 커피는 같은 방정식의 양면이다. **진동에 대한 떡밥.** 변화 속도가 자기 자신이 아니라 "자기 자신을 90도 돌린 것"에 비례하면 사인·코사인이 나오는데, 이게 오일러 공식 $e^{i\pi} + 1 = 0$ 이 말하는 풍경이다. --- ## $e$ 의 거리적 얼굴 지금까지 우리는 $e$ 를 *시간* 의 상수처럼 다뤘다. "1초 동안 자라면 $e$ 배가 된다", "8년마다 두 배가 된다" — 모두 시간이 흐르면서 양이 어떻게 변하는가의 이야기였다. 그런데 $e$ 는 시간뿐 아니라 *공간* 위에서도 곳곳에 얼굴을 드러낸다. $\pi$ 가 원이라는 *모양* 에서 나왔듯이, $e$ 도 자기만의 *모양* 과 *자(尺)* 를 가지고 있다. 이 챕터에서 셋을 본다. ### 등각 나선: $e$ 의 모양 종이 위에 컴퍼스로 원을 그리면 어디서나 중심까지 거리가 같다. 이게 $\pi$ 가 다스리는 도형이다. 그런데 만약 *중심에서 멀어질수록 일정한 비율로 커지면서* 도는 곡선을 그리면 어떻게 될까? 극좌표(원점에서의 거리 $r$ 과 각도 $\theta$) 로 쓰면 $$r(\theta) = e^{a\theta}$$ 이 곡선을 **등각 나선(logarithmic spiral)** 이라 부른다. 한 바퀴($\theta = 0 \to 2\pi$) 돌고 나면 반지름은 $e^{2\pi a}$ 배가 된다. 예를 들어 $a = 0.1$ 이면 한 바퀴 돌 때마다 약 1.87 배씩 커진다. 이름에 "등각" 이 붙은 이유는 *어디서 잘라 봐도 곡선과 동경(중심에서 그 점까지의 직선) 이 이루는 각도가 항상 같기* 때문이다. 안쪽의 빽빽한 부분이든 바깥쪽의 헐거운 부분이든, 곡선의 *기울어진 느낌* 이 똑같다. 원이 "어디서나 *거리* 가 같다" 였다면, 등각 나선은 "어디서나 *비율* 이 같다" 인 곡선이다 — 확대해도 똑같이 생긴, 자기 자신을 닮은 곡선 (이걸 자기 닮음, self-similarity 라 부른다). 자연이 이 모양을 좋아한다. 앵무조개 껍데기, 해바라기 씨앗의 배열, 태풍의 위성사진, 은하의 나선팔. 공통점은 *작게 시작해서 일정한 비율로 자라난다* 는 것 — 즉 자라는 속도가 현재 크기에 비례한다. 콩나무 챕터에서 나왔던 그 규칙이다. 콩나무 비유로 다시 풀어 보자. 콩나무는 *위로만* 자랐다. 그 콩나무에 추가로 *동시에 시계 방향으로 일정한 속도로 회전한다* 는 규칙을 얹으면 어떻게 될까? 매 순간 키가 자라는 동시에 끝이 옆으로도 움직인다. 그 끝이 그리는 자취가 정확히 등각 나선이다. 즉 **등각 나선 = 콩나무 × 회전**. 글 마지막에 나올 오일러 공식 $e^{i\theta}$ 가 이미 이 그림을 깔아 두고 있다. ### 현수선: 매달린 줄이 그리는 $e$ 양 끝을 손으로 잡고 목걸이를 늘어뜨리면 가운데가 처진 곡선이 생긴다. 이 모양을 **현수선(catenary)** 이라 부른다. 라틴어 *catena*(사슬) 에서 왔다. 직관적으로는 포물선($y = x^2$) 처럼 생겼다. 17세기 갈릴레오도 그렇게 추측했다. 그러나 답은 다르다 — 17살의 호이겐스가 *포물선이 아니다* 라고 증명했고, 그 후 베르누이 형제와 라이프니츠가 정확한 식을 풀어 냈다: $$y = a \cosh(x/a) = \frac{a}{2}\big(e^{x/a} + e^{-x/a}\big)$$ 여기서 $a$ 는 줄의 무게와 장력으로 정해지는 상수다. **늘어나는 지수 $e^{x/a}$ 와 줄어드는 지수 $e^{-x/a}$ 둘이 평균을 내며 매달려 있는** 셈이다. 이 평균을 모아 놓은 함수를 *쌍곡코사인* $\cosh$ 라 부른다. 왜 하필 $e$ 일까? 직관적으로 풀면 이렇다. 사슬의 한 작은 토막을 떼어 내 보자. 그 토막을 잡아당기는 힘은 *현재 그 자리에 매달려 있는 사슬의 무게* 에 비례한다. 그리고 그 무게가 토막의 *기울기* 를 정한다. 즉: $$(\text{기울기의 변화율}) \propto (\text{현재까지의 무게})$$ "현재 있는 것의 양 만큼 다음 변화가 정해진다" — 콩나무에서 봤던 바로 그 규칙이 *시간이 아니라 옆 방향 거리 $x$* 위에서 일어난다. 그래서 답에 $e$ 가 등장한다. 이 모양은 일상 곳곳에 있다. 두 전봇대 사이의 전선 처짐, 빨랫줄, 거미줄 한 가닥, 금문교(Golden Gate Bridge) 의 메인 케이블. 심지어 가우디는 사그라다 파밀리아 성당을 설계할 때 *현수선을 거꾸로 뒤집은 모양* 으로 아치를 세웠다 — 매달린 줄이 가장 안정적인 모양이라면, 그것을 뒤집어 세운 아치도 자기 무게를 가장 잘 떠받친다는 발상이다. 콩나무가 *시간을 따라 위로 자라는* $e$ 라면, 현수선은 *거리를 따라 옆으로 매달린* $e$ 다. 같은 미분방정식에 시간 자리에 거리를 끼워 넣은 것에 가깝다. ### 특성거리: $e$ 가 자(尺) 가 될 때 해변에 서서 바닷속을 내려다본다. 햇빛은 수면에서 가장 강하고, 깊이 들어갈수록 약해진다. 1 m 들어가면 얼마나 약해지고, 10 m 들어가면 얼마나 약해질까? 답은 *지수적 감쇠* 다. 깊이 $x$ 에서 빛의 세기는 $$I(x) = I_0 \cdot e^{-x/\lambda}$$ 식 안의 $\lambda$(람다) 라는 거리가 핵심이다. **$x = \lambda$ 만큼 들어가면 빛이 정확히 $1/e \approx 36.8\%$ 로 줄어든다.** $2\lambda$ 만큼 들어가면 다시 그 $1/e$, 즉 $1/e^2 \approx 13.5\%$. $\lambda$ 만큼 더 들어갈 때마다 같은 비율로 깎인다. 이 $\lambda$ 가 그 현상의 **특성거리(characteristic length)** 다. *각 현상마다 자기만의 자(尺) 를 갖고 있다* 고 이해하면 된다. 그리고 그 자의 한 눈금은 언제나 $1/e$ 배 줄어드는 거리다. 자연 곳곳에 이 자가 숨어 있다: - **대기의 자.** 해수면에서 위로 올라갈수록 공기가 희박해진다. 특성거리는 약 8.4 km — 그만큼 올라가면 기압이 $1/e$ 로 줄어든다. 에베레스트 정상(8.8 km) 에서 산소통이 필요한 이유다. - **바닷물 속 빛의 자.** 맑은 바닷물에서는 약 75 m 정도. 그 너머는 사람 눈으로는 캄캄하다. - **전자기파가 도체를 뚫는 자 (skin depth).** 라디오 주파수에서 구리는 마이크로미터 단위. 그래서 송전선이나 동축 케이블은 *겉면만 두꺼우면 충분하다.* 전류가 안쪽까지 들어가지 못한다. - **방사성 동위원소의 자.** 시간 버전으로 친숙한 *반감기* (절반으로 줄어드는 시간) 와 사촌이다. 반감기와 특성시간은 $\ln 2 \approx 0.693$ 배 차이가 난다. 왜 $1/e$ 가 특별한 단위일까? 바로 콩나무 방정식 $\frac{dy}{dt} = -y$ 의 해가 $e^{-t}$ 이기 때문이다. *자기 자신에 비례해서 줄어드는* 모든 현상은 같은 함수 모양($e^{-x/\lambda}$) 을 갖게 되고, 그 모양에는 자연스럽게 $1/e$ 라는 한 눈금이 새겨진다. 단위를 바꾸든(미터든 광년이든) 현상이 바뀌든(빛이든 기압이든), 그 한 눈금은 변하지 않는다. $\pi$ 가 *둘레를 재는 자* (반지름이 1 이면 둘레가 $2\pi$) 라면, $e$ 는 *감쇠를 재는 자* 다. ### 정리 세 그림을 한자리에 모으면: - **등각 나선** — $e$ 의 *모양*. 자기 닮음을 갖는 평면 곡선. - **현수선** — $e$ 의 *자세*. 자기 무게가 자기 모양을 결정하는 매달린 줄. - **특성거리** — $e$ 의 *자(尺)*. 감쇠 현상에 새겨지는 자연의 눈금. 콩나무 챕터에서는 시간이 흘렀고, 여기서는 공간이 펼쳐졌다. 그런데 둘이 같은 식의 두 얼굴이라는 게 핵심이다 — *지금 있는 것에 비례해서 변한다* 라는 한 줄짜리 규칙이 시간 축 위에서는 콩나무를, 공간 축 위에서는 등각 나선·현수선·특성거리를 그린다. $e$ 는 시간과 공간을 동시에 다스리는 상수다. --- ## 노화와 이중 지수: $e^{e^t}$ 의 세계 **질문.** 인간이 노화로 건강이 나빠지는 것도 $e$ 에 비례할까? **답.** 아니다. 인간 사망률은 $e^t$ 가 아니라 $e^{e^t}$ 비슷한 모양으로 늘어난다. 노화는 "스스로에 비례"보다 더 무서운 규칙을 따른다. ### Gompertz 법칙 1825년 영국 보험계리사 벤자민 곰페르츠(Benjamin Gompertz)가 발견한 사실: 인간의 **연간 사망 확률**은 성인기 이후 대략 **8년마다 두 배**가 된다. 30세에 0.1% 였다면 38세에 0.2%, 46세에 0.4%, … 수식으로 쓰면 대략: $$\text{연간 사망확률} \approx A \cdot e^{bt}$$ 콩나무는 *키 자체*가 $e^t$ 였지만, 곰페르츠 법칙에서 $e$ 의 곡선을 그리는 건 *"매년 죽을 확률"*이다. 실제 생존곡선은 이 확률을 다시 적분한 모양이라 $\exp(-e^t)$ 꼴 — 이중 지수다. ### 왜 이중 지수인가 콩나무가 깔끔한 $e^t$ 를 그리는 이유는 규칙이 단순해서다: "현재 크기가 변화 속도를 정한다." 변수 하나. 몸은 단순하지 않다. 손상이 쌓이면 손상을 *고치는 시스템* 자체도 손상된다. DNA 를 수선하는 효소도 늙고, 면역세포도 늙고, 늙은 세포를 청소하는 시스템도 늙는다. **고치는 능력이 떨어지는 속도**가 다시 가속된다. 한 층이 아니라 여러 층의 $e$ 가 겹친 결과가 곰페르츠 곡선이다. 비유하자면, 콩나무는 혼자 자라지만, 노화는 "콩나무를 베어내는 사람"이 점점 늙고 지쳐서 베는 속도가 느려지는 것과 비슷하다. 손상은 일정하게 들어와도, 막아내는 쪽이 무너지면 결과는 폭발적으로 나빠진다. **관찰.** 자연이 단순한 $e$ 의 법칙만 따르는 게 아니다. 콩나무·커피·방사성 붕괴는 "한 가지 양이 자기 자신에 비례"하는 단순한 세계. 노화는 "여러 시스템이 서로의 쇠퇴를 가속시키는" 얽힌 세계. 19세기부터 21세기까지, 위생·의학이 극적으로 발전했는데도 8년 두 배 법칙의 기울기는 거의 변하지 않았다. 의학은 시작점 $A$ 를 낮췄을 뿐, 가속도 $b$ 는 못 건드렸다. ### 이중 지수가 등장하는 다른 곳들 #### 기계 부품의 노쇠 부품이 닳으면 다른 부품에 부담이 가고, 그 부품도 빨리 닳고… 자동차 엔진, 항공기 부품의 "수명 끝자락" 통계가 곰페르츠 분포로 잘 맞는다. #### 신기술 보급과 종양 성장 곰페르츠 함수는 성장 쪽에서도 자주 쓴다. 새 제품·기술이 시장에 퍼질 때, 초반에는 거의 안 움직이다가 어느 순간 폭발하고, 또 어느 순간 포화된다. 스마트폰, 전기차, 신약 처방률 같은 데이터가 비대칭 S자 곡선(곰페르츠)을 그린다. 종양 성장도 같다. 암세포는 처음엔 폭발적으로 늘다가 영양·공간 제약 때문에 점점 둔화되는데, 이 둔화 패턴이 단순한 로지스틱보다 곰페르츠에 더 잘 맞는다. #### 극단값 통계 — Gumbel 분포 "100년에 한 번 오는 홍수의 수위는 얼마인가?" 이런 **극단값(extreme value)** 문제의 답이 정확히 $$F(x) = \exp\!\big(-e^{-x}\big)$$ **굼벨(Gumbel) 분포**라 부른다. 홍수 제방 설계, 보험 대재해 보험료, 풍력 발전기 견딤 사양 산정에 쓰인다. 일본 기상청의 100년 빈도 강우량 추정에도 사용한다. #### 랜덤 트리의 최장 가지 무작위로 자라는 어떤 이진 탐색 트리에서 가장 긴 가지의 길이가 $\log n$ 에 $\log \log n$ 보정이 붙는 형태로 나타난다. $\log \log n$ 은 "이중 지수의 역함수"이며, 어떤 양이 이 스케일로 움직인다는 것은 본체가 이중 지수 메커니즘으로 자란다는 신호다. #### 기술 변화율 (가설) 무어의 법칙(2년마다 두 배)이 단일 지수라면, "무어의 법칙 주기 자체가 짧아진다"는 주장이 이중 지수다. 다만 이건 자연법칙이라기보다 추세에 대한 가설에 가깝다. **관찰: 이중 지수의 두 출처.** - **다층 시스템의 동시 붕괴/성장** — 노화, 종양, 부품 고장. 변화의 *결과*가 변화의 *속도*에 되먹임되는 층이 둘 이상. - **"최대값" 또는 "극단"의 통계** — 굼벨 분포, 트리의 최장 가지. $n$ 개 사건의 가장 극단적인 값을 묻는 순간 지수 위에 지수가 한 층 더 올라온다. --- ## 굼벨 분포: 왜 "극단"에는 이중 지수가 나오는가 ### 상황 설정 매년 한강의 최고 수위를 잰다. 어떤 해는 3 m, 어떤 해는 5 m, 가뭄 해는 1 m. 이 수치들이 어떤 확률분포를 따른다고 하자 — 평균 근처가 가장 흔하고, 아주 높은 수위는 드물다. 질문: **"100년 동안의 최고 수위"** 의 분포는 어떻게 생겼을까? ### 핵심: 꼬리의 모양이 결정한다 $n$ 개 중 최대값이 $x$ 이하라는 건, $n$ 개 *전부*가 $x$ 이하라는 뜻: $$P(\max \leq x) = P(\text{한 표본} \leq x)^n$$ 원래 분포에서 "$x$ 를 넘을 확률"이 얼마나 빨리 0으로 줄어드느냐 — 이것이 꼬리의 두께다. 꼬리의 모양에 따라 최대값의 분포가 셋 중 하나로 수렴한다 (**Fisher–Tippett–Gnedenko 정리**): - 꼬리가 **지수적으로 얇아지는 경우** (정규, 지수, 감마 등): 최대값 → **굼벨 분포** $\exp(-e^{-x})$ - 꼬리가 **거듭제곱처럼 두꺼운 경우** (파레토 — 부의 분포, 지진 규모): **프레셰(Fréchet) 분포** - 분포에 **상한이 있는 경우** (시험 점수, 0–100): **베이불(Weibull) 분포** 중심극한정리가 "평균"의 보편 분포(정규)를 말한다면, 극단값 정리는 "최대값"의 보편 분포 세 종류를 말한다. ### 굼벨이 나오는 직관 꼬리가 $e^{-x}$ 정도로 얇아진다고 하자. "$x$ 를 넘을 확률"은 대략 $e^{-x}$. $n$ 개 중 *아무것도* $x$ 를 안 넘을 확률은: $$\left(1 - e^{-x}\right)^n \;\approx\; \exp\!\big(-n \cdot e^{-x}\big)$$ 지수 안에 지수가 등장한다. $n$ 을 적절히 흡수시키면 정확히 $\exp(-e^{-x})$ 꼴 — 굼벨 분포. **"꼬리의 지수"가 "최대값 분포의 안쪽 지수"가 되고, "표본 개수"가 그 위에 한 층 더 지수를 만든다.** 이게 이중 지수의 정체다. ### 왜 이게 강력한가 원래 분포가 정확히 뭐였는지 몰라도, 꼬리가 지수적으로만 줄면 충분한 표본의 최대값은 굼벨로 수렴한다. 일년치 수위의 진짜 분포를 모르더라도 100년 최대값은 굼벨로 근사할 수 있다 — 이게 토목·보험·기상학에서 굼벨 분포를 쓰는 실용적 이유다. --- ## 랜덤 트리의 최장 가지: $\log\log n$ 의 정체 ### Random recursive tree 규칙은 단순하다. 노드를 하나씩 추가하는데, 새 노드는 **이미 있는 노드 중 무작위로 하나**를 골라 그 자식이 된다. - 1번 노드: 뿌리 - 2번 노드: 1번의 자식 (선택지가 1번뿐) - 3번 노드: 1번 또는 2번 중 무작위 → 자식이 됨 - … - $n$ 번 노드: 앞의 $n-1$ 개 중 무작위 선택 뿌리에서 가장 먼 노드까지의 거리가 트리의 **높이(height)**. ### 높이는 얼마나 큰가 노드 하나의 깊이는 "자기 부모의 깊이 $+1$"이다. 새 노드가 깊이 $k$ 인 부모를 고를 확률은 그 시점에 깊이 $k$ 노드가 몇 개 있느냐에 비례한다. 여기서 묘한 일이 벌어진다. 깊이 $k$ 노드의 *기댓값*은 대략 $$\frac{(\log n)^k}{k!}$$ 정도로 자란다. 깊은 노드일수록 수가 적지만, 그렇다고 아주 적지도 않다. 평균 깊이는 약 $\log n$. ### 최대 깊이 $n$ 개 노드 각각의 깊이가 평균 $\log n$ 근처에 푸아송 비슷하게 흩어져 있을 때, 그 중 **가장 깊은 노드**는 평균보다 얼마나 더 깊을 수 있는가? 이건 굼벨 분포 문제와 같은 구조다. "$n$ 개 표본의 최대값"을 묻는 거니까. 깊이 분포의 꼬리가 지수적으로 얇아서, 굼벨 류의 논리가 그대로 작동한다. Devroye, Pittel 등의 1990년대 결과: $$\text{높이} \approx e \cdot \log n + (\text{보정항})$$ 평균 깊이가 $\log n$ 인데, 최대 깊이는 그 $e$ 배(약 2.718배)다. 여기서도 $e$ 가 튀어나오는데, 콩나무의 $e$ 와 같은 $e$ — "내 자식 수가 내 깊이에 비례해서 자란다"는 분기 구조에서 나오는 $e$ 다. ### $\log \log n$ 은 어디에? 방금 건 random recursive tree 의 결과다. 다른 종류의 랜덤 트리 — 예를 들어 **랜덤 이진 탐색 트리(BST)** 등 — 에서 높이는 다음 모양이다: $$\text{높이} = \alpha \cdot \log n - \beta \cdot \log \log n + O(1)$$ ($\alpha \approx 4.311$, $\beta \approx 1.953$). 평균 동작은 $\log n$ 인데, 평균에서 흩어지는 "흔들림"이 $\log \log n$ 스케일이다. $\log \log n$ 은 **이중 지수의 역함수**다. $y = e^{e^x}$ 를 $x$ 에 대해 풀면 $x = \log \log y$. 어떤 양이 $\log \log n$ 스케일로 움직인다는 것은 ⇒ **본체가 이중 지수 메커니즘으로 자란다**는 신호. **공통 정체.** 굼벨도 랜덤 트리도 같은 그림이다. "많은 것들 중 가장 극단적인 것의 분포"를 묻는 순간 이중 지수가 등장한다. 노화도 결국 "여러 서브시스템 중 가장 빨리 무너지는 것이 전체를 결정한다"는 측면이 있어서 굼벨과 사촌이다 — 우리 몸은 가장 약한 시스템의 운명을 따른다. **평균은 정규분포가 다스리고, 극단은 굼벨이 다스린다.** --- ## 푸아송 분포: $e^{-\lambda}$ 는 어디서 오는가 ### 질문 푸아송 분포: $$P(k) = \frac{\lambda^k e^{-\lambda}}{k!}$$ 여기서 $e^{-\lambda}$ 가 떡하니 박혀 있다. 이게 왜 거기 있는가? 사실 콩나무 이야기와 완전히 같은 자리에서 나온다. 푸아송 분포가 답하는 질문: "*평균적으로* 1시간에 $\lambda$ 번 일어나는 사건이, 다음 1시간 동안 정확히 $k$ 번 일어날 확률은?" 예: 콜센터 전화, 가이거 계수기의 딸깍, 책 한 페이지의 오탈자. ### 핵심 가정 1. 사건들이 **서로 독립적으로** 일어난다 2. 어떤 짧은 순간이든 사건이 일어날 비율이 **일정하다** ### 유도 1: 이항분포의 극한 1시간을 $n$ 개의 아주 작은 조각으로 쪼갠다. 각 조각에서 사건이 일어날 확률 $\approx \lambda/n$. $n$ 이 충분히 크면 한 조각에 두 번 일어날 확률은 무시 가능. $n$ 개 조각 중 정확히 $k$ 개에서 사건이 일어날 확률은 이항분포: $$P(k) = \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k}$$ $n \to \infty$ 의 극한에서: $$\left(1 - \frac{\lambda}{n}\right)^{n-k} \;\to\; \left(1 - \frac{\lambda}{n}\right)^{n} \;\to\; e^{-\lambda}$$ **여기서 $e$ 가 나온다.** $e$ 의 가장 고전적인 정의 — $(1 + x/n)^n$ 의 $n \to \infty$ 극한 — 바로 그 자리. 나머지 정리: - $\binom{n}{k} \cdot (1/n)^k \to 1/k!$ - $\lambda^k$ 는 그대로 전부 합치면: $$P(k) = \frac{\lambda^k}{k!} \cdot e^{-\lambda}$$ ### 유도 2: 콩나무와 같은 길 시간이 $t$ 만큼 흘렀을 때 사건이 한 번도 안 일어났을 확률을 $f(t)$ 라 하자. "$t + \Delta t$ 동안 0번"이라는 것은 "$t$ 동안 0번 그리고 그 뒤 $\Delta t$ 동안 0번" — 독립이므로 곱: $$f(t + \Delta t) = f(t) \cdot (1 - \lambda \Delta t)$$ 정리: $$\frac{f(t + \Delta t) - f(t)}{\Delta t} = -\lambda f(t)$$ $\Delta t \to 0$: $$\frac{df}{dt} = -\lambda f$$ **이 방정식, 어디서 본 적 있죠?** 콩나무 방정식의 정확한 거울상이다. 콩나무는 "변화 속도 $= +$(현재 크기)" → $e^t$. 여기서는 "변화 속도 $= -\lambda \times$ (현재 크기)" → $e^{-\lambda t}$. $f(0) = 1$ 로 풀면: $$f(t) = e^{-\lambda t}$$ $t = 1$ 로 두면 1시간 동안 아무 일도 안 일어날 확률 $= e^{-\lambda}$. **푸아송 공식의 그 $e^{-\lambda}$ 가 바로 이것이다.** ### $e^{-\lambda}$ 의 정체 **독립적이고 균일한 사건의 흐름에서, 단위 시간 동안 아무 일도 일어나지 않을 확률.** 이게 $e^{-\lambda}$ 인 이유는 "사건이 안 일어남"이라는 상태가 시간이 흐르면서 자기 자신에 비례해서 줄어들기 때문이다. 콩나무의 정반대 방향. 콩나무가 "내 키만큼 빨리 자란다"면, 푸아송의 "무사한 상태"는 **"남은 만큼 빨리 소멸한다"**. **관찰.** 푸아송 분포 안에는 사실 두 개의 다른 수학이 들어 있다: - $\lambda^k / k!$ 부분: 조합론. "$k$ 번 일어나는 경우의 수". - $e^{-\lambda}$ 부분: 미적분. "흐르는 시간 동안 상태가 어떻게 변하나". 이산적인 셈($k$ 번)과 연속적인 흐름(시간 $t$)이 한 식 안에 동거하고 있고, 그 둘을 이어주는 접착제가 정확히 $e$ 다. **콩나무는 자라고, 커피는 식고, 사건은 안 일어난다. 셋 다 같은 미분방정식의 세 얼굴이다.** --- ## 이항분포의 그림자: $e$ 의 세 가지 입구 "많은 독립 사건이 모이는 곳"에는 거의 항상 $e$ 가 숨어 있다. 이항분포는 그 가장 깔끔한 입구다. 다만 "어떻게 등장하느냐"는 상황에 따라 세 갈래로 갈린다. ### 갈래 1: 드문 사건의 극한 → 푸아송 $n$ 이 크고 $p$ 가 작아서 평균 $np = \lambda$ 가 적당한 값일 때: $$\binom{n}{k} p^k (1-p)^{n-k} \;\xrightarrow{n \to \infty}\; \frac{\lambda^k e^{-\lambda}}{k!}$$ $(1 - \lambda/n)^n \to e^{-\lambda}$ 에서 $e$ 가 나온다. **"드문 일이 큰 무대에서 벌어질 때"** 등장하는 $e$. 예: 콜센터 전화, 방사성 붕괴, 한 페이지의 오탈자, 운석 낙하 빈도. ### 갈래 2: 평균이 큰 경우의 극한 → 정규분포 $n$ 이 크고 $p$ 가 너무 작지도 크지도 않을 때 — **드무아브르–라플라스 정리**: $$\binom{n}{k} p^k (1-p)^{n-k} \;\approx\; \frac{1}{\sqrt{2\pi np(1-p)}} \, \exp\!\left(-\frac{(k-np)^2}{2np(1-p)}\right)$$ 종 모양 곡선. 여기서도 $e$ 가 등장하는데, **푸아송의 $e$ 와는 다른 출처**다. 푸아송의 $e^{-\lambda}$ 는 $(1+x/n)^n$ 극한에서 나왔다면, 정규분포의 $e^{-x^2/2}$ 는 **스털링 근사** $$n! \approx \sqrt{2\pi n}\, \left(\frac{n}{e}\right)^n$$ 에서 나온다. 큰 팩토리얼을 다룰 때 $e$ 가 등장하는데, 그 $e$ 가 종 곡선의 지수 자리로 자연스럽게 흘러들어간다. 예: 동전 1000번 던지기, 시험 점수, 키·몸무게, 측정 오차. ### 갈래 3: 직접 등장하는 $1/e$ 극한을 안 가도, 이항 구조에서 $e$ 가 바로 튀어나오는 고전 문제들. #### Hat-check problem $n$ 명이 모자를 맡기고, 직원이 무작위로 돌려준다. 아무도 자기 모자를 못 받을 확률은? $$\approx \frac{1}{e} \approx 36.8\%$$ $n$ 이 커도 거의 변하지 않는다. 포함–배제 원리에서 나오는 합이 $e$ 의 테일러 급수와 정확히 일치한다. #### 생일 문제의 친척 $(1 - 1/365)^k \to e^{-k/365}$ 근사가 핵심. #### 쿠폰 수집가 문제 $n$ 종류의 카드를 전부 모으는 데 평균 $n \cdot \ln n$ 봉지 필요. $\ln$ 이 등장하는 순간 $e$ 가 뒤에 있다. #### Secretary problem (37% 법칙) $n$ 명의 지원자를 순서대로 보고, 그 자리에서 채용/탈락 결정. 최적 전략: **처음 $n/e$ 명은 무조건 떨어뜨리고, 그 뒤로 지금까지 본 누구보다 좋은 사람이 오면 그를 뽑는다.** 성공 확률 $\approx 1/e \approx 36.8\%$. 데이트 상대 고르기, 집 사기, 채용 의사결정에 응용된다. ### 왜 이항이 있는 곳마다 $e$ 가 따라오는가 이항분포의 본질은 **"독립 시행의 곱"**이다. $(1-p) \cdot (1-p) \cdots$ $n$ 번 곱하기. 그런데 "독립적인 작은 확률을 무한히 곱한다"는 작업의 극한이 정확히 $e$ 의 정의다: $$\lim_{n \to \infty} \left(1 + \frac{x}{n}\right)^n = e^x$$ 콩나무 방정식도 사실은 이것이었다. "아주 짧은 시간 동안 자기 크기에 비례해서 자란다"는 것은 "그 짧은 곱셈을 무한히 누적한다"이고, 이것이 $e^t$ 를 만든다. 푸아송도 같은 그림 — "짧은 시간 동안 사건이 안 일어날 확률을 무한히 곱한다" → $e^{-\lambda t}$. **이항은 곱셈이고, 작은 곱셈의 누적 극한이 $e$ 다.** --- ## 결: $e$ 의 여러 얼굴 이항분포는 **셀 수 있는 세계(이산)와 흐르는 세계(연속)를 잇는 다리**다. - 한쪽 극한 → 푸아송 (드문 사건의 세계, $e^{-\lambda}$) - 다른 극한 → 정규분포 (평균의 세계, $e^{-x^2/2}$) - 단순한 셈 → $1/e$ 상수 (자기 모자, 비서 문제) 같은 이항분포가 어디로 가느냐에 따라 $e$ 의 다른 얼굴을 보여준다. ### 블로그 시리즈의 큰 그림 1. **콩나무의 $e$** — 미분방정식에서 나오는 $e$ (연속·결정론적) 2. **거리의 $e$** — 등각 나선·현수선·특성거리, 공간 위의 $e$ 3. **푸아송의 $e$** — 시간 위 무작위 사건에서 나오는 $e$ 4. **이항의 $e$** — 셈에서 흘러나오는 $e$, $1/e$ 가 등장하는 일상의 문제들 5. **굼벨의 $e$** — 극단값에서 나오는 이중 지수 6. **오일러 공식의 $e$** — 회전과 진동의 $e$ (복소수 영역) $\pi$ 가 모양 하나의 상수라면, $e$ 는 여러 입구를 가진 상수다. 입구는 달라도 항상 같은 $e$ 가 기다리고 있다는 것 — 이게 수학에서 가장 아름다운 사실 중 하나다. 오일러가 $e^{i\pi} + 1 = 0$ 을 적었을 때, 그것이 "발견"이지 "발명"이 아니라고 느꼈을 이유이기도 하다.