\(e\)의 초월성 증명
흔히 자연상수라고도 하는 \( e\) 는
\[ e = \lim_{n \to \infty} \left( 1+ \frac{1}{n} \right)^n = \sum_{n=0}^{\infty} \frac{1}{n!} \]
의 극한으로 정의되는 상수이다.
ㅤ
어떤 수 \( a \)가 초월수라 함은 \( a \)를 해로 가지는 정수 계수 다항방정식이 존재하지 않다는 뜻이다. 즉 다음을 만족하는 \( n \in \mathbb{N} \) 이 존재하지 않다는 것을 의미한다.
\[ \exists \{ c_k \}_{k=0}^{n} \in \mathbb{Z}^{n+1} \,\,\, s.t. \,\,\, \exists c_j \neq 0 \,\,\,\,\, s.t. \,\,\,\,\, \sum_{k=0}^{n} c_k a^k = 0\]
그러니 \( e \)를 영점으로 가지는 다항식이 존재하지 않다는 증명이 곧 \( e \)의 초월성 증명이다. 즉
\[ \nexists n \in \mathbb{N} \,\,\,\, s.t. \,\,\,\, \exists \{ c_k \}_{k=0}^{n} \in \mathbb{Z}^{n+1} \,\,\, s.t. \,\,\, \exists c_j \neq 0 \,\,\,\,\, and \,\,\,\,\, \sum_{k=0}^{n} c_k e^k = 0\]
임을 보이면 되는 것이다.
본 글의 1873년 샤를 에르미트의 첫 증명을 다룬다.
ㅤ
ㅤ
ㅤ
먼저 아래 조건을 만족하는 최소의 자연수 \( n\) 이 존재한다는 귀류 가정을 세운다.
\[ \{ c_k \}_{k=0}^{n} \in \mathbb{Z}^{n+1} \,\,\, s.t. \,\,\, \exists c_j \neq 0 \,\,\,\,\, and \,\,\,\,\, \sum_{k=0}^{n} c_k e^k = 0 \]
를 놓고 어떤 적당히 큰 소수 \( p \)에 대하여 다음의 다항함수를 보조 함수로 설정한다. 이때 적당히 크다고 하는 조건은 구체적으로 말하자면 적어도 \( p > \max \{n, \, |c_0|\} \) 이다. 이렇게 설정한 이유는 후에 밝힌다.
\[ f(x) = \frac{1}{(p-1)!} x^{p-1} (x-1)^p (x-2)^p \cdots (x-n)^p \]
또 이를 통해 유도되는 자연수를 정의역으로 가지는 함수,
\[ I(k) = \int_{0}^{k} e^{-x} f(x) dx \]
를 놓는다.
ㅤ
본 증명에서 사용하는 \( e \) 의 근본적인 특징은 바로 지수함수가 미분, 적분을 거치고도 완전히 자기 자신이 되기 위해서는 그 밑이 \( e \) 여야 한다는 것이다.
그러니 주어진 \( I(k) \)에 부분적분을 연속으로 적용해 식을 다루기 편하게 변형한다.
부분 적분 과정에서는 다항함수인 \( f(x) \) 를 미분할 것인데 이대 \( f\)의 차수는 \( np + p-1 \) 이기 때문에 그 이후의 항은 \( 0 \)이 된다는 것을 알 수 있다. 그러니 \( np + p -1 = m\) 이라 둔다.
\begin{equation*}
\begin{split}
I(k) &= [ (-e^{-x}) f(x) |_{0}^{k} - \int_{0}^{k} (-e^{-x}) f^{(1)} (x) dx \\[2ex]
&= [ (-e^{-x}) f(x) |_{0}^{k} - [ e^x f^{(1)} (x) | _{0}^{k} + \int_{0}^{k} (e^{-x}) f^{(2)} (x) dx \\[2ex]
&= [ (-e^{-x}) f(x) |_{0}^{k} - [ e^{-x} f^{(1)} (x) | _{0}^{k} + [ (-e^{-x}) f^{(2)} (x) | _{0}^{k} - \int _{0}^{k} (e^{-x} ) f^{(3)} (x) dx \\[2ex]
&= \cdots ( m \text{번} ) \\
\end{split}
\end{equation*}
이런 식으로 모든 항에 마이너스가 붙은 형태로 나온다. 그리고 \( f \)를 \( m\) 번 미분하면 상수가 나오고 그 이후는 모두 \( 0 \) 이기 때문에
\[ I(k) = - \sum_{j=0}^{m} [ e^{-x} f^{(j)} (x) | _{0}^{k} = -\sum_{j=0}^{m} e^{-k} f^{(j)} (k) + \sum_{j=0}^{m} f^{(j)} (0) \]
이라 쓸 수 있다. 양변에 \( e^k \) 를 곱해 식을 변형해 보자. 이런식으로 얻어진 식에 \( k \)에 대한 \( \sum \)을 취하면 처음에 가정한
\[ c_0 + c _1 e + c _2 e^2 + \cdots c _n e^n = 0 \]
를 활용할 수 있기 때문이다.
\[ e^k I(k) = -\sum_{j=0}^{m} f^{(j)} (k) + e^k \sum_{j=0}^{m} f^{(j)} (0) \,\,\,\,\, \cdots \,\, (1) \]
ㅤ
ㅤ
이제 \( c_0 + c _1 e + c _2 e^2 + \cdots c _n e^n = 0 \) 에 \( \displaystyle \sum_{j=0}^{m} f^{(j)} (0) \) 를 곱한다.
\[ \sum_{k=0}^{n} c_k e^k \sum_{j=0}^{m} f^{(j)} (0) = 0 \]
ㅤ
그리고 \( (1) \)에서 얻은
\[ e^k \sum_{j=0}^{m} f^{(j)} (0) = e^k I(k) + \sum_{j=0}^{m} f^{(j)} (k) \]
를 대입하면
\[ \sum_{k=0}^{n} c_k \left( e^k I(k) + \sum_{j=0}^{m} f^{(j)} (k) \right) = 0 \]
에서
\[ \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) = - \sum_{k=0}^{n} c_k e^k I(k) = - \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \]
를 얻는다.
ㅤ
ㅤ
ㅤ
이제 우리가 보일 것은 적당히 큰 \( p \) 에 대하여 \( \displaystyle \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \) 이 \( 0 \) 이 아닌 정수이면서 \( \displaystyle \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \) 의 절대값이 1 보다 작을 수 있다는 사실이다.
ㅤ
ㅤ
\[ \displaystyle \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \in \mathbb{Z} - \{0\} \]
를 보이기 위해 그 식이 정수 임을 보이고 \( p \)로 나눈 나머지가 0이 아님을 보인다. 나머지가 0이 아니라면 그 수는 0이 될 수 없음을 이용한다.
\[ \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) = c_0 \sum_{j=0}^{m} f^{(j)} (0) + \sum_{k=1}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \]
ㅤ
먼저 \( k=0 \) 의 앞부분을 계산해본다.
\( f(x) \) 의 \( x \) 차수는 \( p-1\) 이므로 그보다 적게 미분했을 때는 곱의 미분법에 의해 0을 대입했을 때 0이 된다.
정확히 \( p-1\) 번 미분했을 때 0이 아닌 항을 보자면 곱의 미분에서 \( x \) 항만 전부 미분해야 하기에
\[ f^{(p-1)} (0) = \left[ \frac{1}{(p-1)!} (p-1)! \, (x-1)^p (x-2)^p \cdots (x-n)^p \right| _{x=0} = (-1)^{np} (n!)^p \]
그리고 이때 충분히 큰 소수 \( p \)의 조건으로 \( n \)보다 크다를 사용한다면 \( n! \)은 \( p\) 의 배수가 아니게 된다.
그 다음 미분한 횟수가 \( j > p-1\) 보다 많다면 \( f^{(j)} (0) \) 은 \( f\) 의 \( j\) 차 항의 계수에 \( j! \)을 곱한 값이 된다. 이때 \( f\) 의 모든 계수는 정수이고 새로 곱해진 \( j! \) 은 \( j > p-1\) 에서 \( p! \)을 인수로 가진다. 이 인수는 분모의 \( (p-1)! \) 과 약분되어 \( p\)를 남긴다. 곧 \( f^{(j)} (0) \)은 \( p \)의 배수이다.
모든 \( j \neq p-1\)에 대하여 \( f^{(j)} (0) \)가 \( p\) 의 배수이고 \( f^{(p-1)} (0) \)은 \( p\)의 배수가 아님을 밝혔다. 따라서 이들의 합인\( \displaystyle \sum_{j=0}^{m} f^{(j)} (0) \) 는 \( p\)의 배수가 아니다.
앞에서 \( p\)는 \( c_0\) 보다 크다고 했으므로 소수 \( p\)는 \( c_0\) 를 나누지 않고 곧 가장 앞의 항 전체인 \( \displaystyle c_0 \sum_{j=0}^{m} f^{(j)} (0) \) 는 \( p\)의 배수가 아닌 정수이다.
ㅤ
그 다음에는 \(\displaystyle \sum_{k=1}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \) 가 \( p \)의 배수임을 밝히면 된다.
먼저 \( k \leq n \) 인 경우의 합이니 \( f\) 가 \( k \)를 근으로 가진다는 것을 알고 가자.
이 경우 \( k=0\) 인 상황이 없기 때문에 \( f^{(j)} (k) \) 를 계산할 때 모든 \( k \)는 \( p\) 차 이상의 근이다. 따라서 \( j \leq p-1 \) 인 경우와 \( j \geq p\) 인 경우 두 가지 밖에 없다.
\( j \leq p-1 \) 인 경우 \( (x-k)\)의 항이 남아 있으므로 \( f^{(j)} (k) \)의 값은 \(0\)이다.
\( j \geq p\) 일 때는 위 부분과 같이 \( p \)의 배수가 된다.
따라서 \( \displaystyle \sum_{k=1}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \) 는 \( p \)의 배수이다.
ㅤ
ㅤ
이로부터 \( \displaystyle \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \) 는 \( p \)의 배수와 \( p \)의 배수가 아닌 정수의 합이므로 \( p\) 의 배수가 아닌 정수이다. 어떤 소수의 배수가 아니므로 \( \displaystyle \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \) 는 정수이면서 0일 수 없다.
ㅤ
ㅤ
충분히 큰 소수 \( p \)의 조건이 적절하다면
\[ \left| \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \right| < 1 \]
ㅤ
먼저 상한의 계산을 편리하게 만들어준다.
\begin{equation*}
\begin{split}
\left| \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \right| &\leq \sum_{k=0}^{n} \left| c_k e^k \int_{0}^{k} e^{-x} f(x) dx \right| \\[2ex]
&\leq \sum_{k=0}^{n} \left| c_k \right| e^k \left| \int_{0}^{k} e^{-x} f(x) dx \right| \\[2ex]
&\leq \sum_{k=0}^{n} \left| c_k \right| e^k \int_{0}^{k} \left| e^{-x} f(x) \right| dx \\[2ex]
&\leq \sum_{k=0}^{n} \left| c_k \right| e^k \int_{0}^{k} \left| f(x) \right| dx
\end{split}
\end{equation*}
ㅤ
이때는 \( |f(x)| \) 의 \( x\) 와 상관없는 상한을 정하면 된다.
\[ f(x) = \frac{1}{(p-1)!} x^{p-1} (x-1)^p (x-2)^p \cdots (x-n)^p \]
\( k \in [0, \, n ] \) 인 상황에 \( x \in [0, \, k] \) 이므로 \( x, \, i \in [0, n] \) 에서 \( |x^{p-1} (x-1)^p (x-2)^p \cdots (x-n)^p| \) 의 각항 \( |x-i| \) 의 상한은 \( n \) 이다.
그러니
\begin{equation*}
\begin{split}
|f(x)| &= \frac{1}{(p-1)!} |x^{p-1} (x-1)^p (x-2)^p \cdots (x-n)^p| \\[2ex]
&= \frac{1}{(p-1)!} |x^{p-1}| |(x-1)^p|| (x-2)^p| \cdots |(x-n)^p| \\[2ex]
&\leq \frac{1}{(p-1)!} |n^{p-1}| |n^p| |n^p| \cdots |n^p| \\[2ex]
&= \frac{n^{(n+1)p -1}}{(p-1)!} \\
\end{split}
\end{equation*}
분자는 지수함수, 분모는 펙토리얼이므로 간단하게 0으로 수렴한다는 사실을 알 수 있을 것이다.
ㅤ
그래도 엄밀하게 적어보자면 \( |f(x)| \) 의 상한에 의해
\begin{equation*}
\begin{split}
\left| \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \right| &\leq \sum_{k=0}^{n} \left| c_k \right| e^k \int_{0}^{k} \left| f(x) \right| dx \\[2ex]
&\leq \sum_{k=0}^{n} \left| c_k \right| e^k \int_{0}^{k} \frac{n^{(n+1)p -1}}{(p-1)!} dx \\[2ex]
&= \sum_{k=0}^{n} \left| c_k \right| e^k k \frac{n^{(n+1)p -1}}{(p-1)!} \\[2ex]
&\leq \sum_{k=0}^{n} \left| c_k \right| e^k n \frac{n^{(n+1)p -1}}{(p-1)!} \\[2ex]
&= \sum_{k=0}^{n} \left| c_k \right| e^k \frac{n^{(n+1)p}}{(p-1)!} \\[2ex]
&= \frac{n^{(n+1)p}}{(p-1)!} \left( \sum_{k=0}^{n} \left| c_k \right| e^k \right) \\
\end{split}
\end{equation*}
이때 가장 밑 오른쪽에 있는 항은 \( n \) 이 정해졌을 때 값을 구할 수 있는 상수이므로 \( \displaystyle \sum_{k=0}^{n} \left| c_k \right| e^k = M \) 이라 둔다.
ㅤ
그리고 \( n^{n+1} = N \) 에 대하여 m에 대한 수열, \( \frac{N^{m}}{(m-1)!} \) 의 극한이 0임을 보인다.
스털링 근사에 의해
\[ \lim_{m \to \infty } \frac{N^{m}}{(m-1)!} = \lim_{m \to \infty } \frac{N^{m}}{\sqrt{2 \pi (m-1)} \left( \frac{m-1}{e} \right)^{m-1} } \]
이므로 \( \ln \) 을 취해준다면
\begin{equation*}
\begin{split}
\ln \left( \lim_{m \to \infty } \frac{N^{m}}{\sqrt{2 \pi (m-1)} \left( \frac{m-1}{e} \right)^{m-1} } \right) &= \lim_{m \to \infty } \ln \frac{N^{m}}{\sqrt{2 \pi (m-1)} \left( \frac{m-1}{e} \right)^{m-1} } \\[2ex]
& = \lim_{m \to \infty } m \ln N - \frac{1}{2} \ln ( 2\pi (m-1) ) -(m-1) (\ln (m-1) -1) \\[2ex]
\end{split}
\end{equation*}
이 때는 \( m \) 을 나눈 극한 을 계산해본다.
\[ \lim_{m \to \infty } \ln N - \frac{\ln ( 2\pi (m-1) )}{2m} -(1-\frac{1}{m}) (\ln (m-1) -1) = - \infty \]
이므로
\[ \lim_{m \to \infty } \ln \frac{N^{m}}{\sqrt{2 \pi (m-1)} \left( \frac{m-1}{e} \right)^{m-1} } = -\infty \]
곧
\[ \lim_{m \to \infty } \frac{N^{m}}{\sqrt{2 \pi (m-1)} \left( \frac{m-1}{e} \right)^{m-1} } = 0 \]
이다.
따라서 \( \displaystyle \lim_{m \to \infty} \frac{N^{m}}{(m-1)!} =0 \) 이다.
ㅤ
이는 어떤 양수 \( \epsilon\)이 주어졌을 때 적당한 \( L \in \mathbb{N}\) 가 존재하여
\[ m > L \Rightarrow \left| \frac{N^{m}}{(m-1)!} \right| < \epsilon \]
을 만족할 수 있다는 뜻이다. 그렇다면
\[ \frac{n^{(n+1)p}}{(p-1)!} \left( \sum_{k=0}^{n} \left| c_k \right| e^k \right) < 1 \]
로 만들기 위해 \( \epsilon = \displaystyle \frac{1}{M} = \frac{1}{\sum_{k=0}^{n} \left| c_k \right| e^k} \)
로 주어진 상황을 생각했을 때 적당한 자연수 \( P\) 가 존재하여 그 보다 큰 소수를 잡으면 Lemma2를 만족할 수 있다.
\[ \forall p > P \,\,\,:\,\,\, \frac{n^{(n+1)p}}{(p-1)!} \left( \sum_{k=0}^{n} \left| c_k \right| e^k \right) < \frac{1}{M} M = 1 \]
곧 이 때 \( p \) 조건이 \( p > \max \{n, \, |c_0|, \, P \} \) 라면
\[ \left| \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \right| < 1 \]
이 만족한다.
ㅤ
ㅤ
ㅤ
\[ \left| \sum_{k=0}^{n} c_k \left( \sum_{j=0}^{m} f^{(j)} (k) \right) \right| = \left| - \sum_{k=0}^{n} c_k e^k \int_{0}^{k} e^{-x} f(x) dx \right| < 1 \]
이므로 0이 아닌 정수의 절댓값이 1보다 작다는 결론이 나온다. 이는 명백한 모순이므로 처음의 귀류 가정, 즉 자연수 \( n \)과 수열 \( \{ c_k\}_{k=0}^{n} \)의 존재는 불가능하다.
ㅤ
ㅤ
따라서 \( e \)는 초월수이다.
ㅤ
ㅤ
보너스로 \( e\)의 무리성을 증명하자면 위 증명 과정에서 \( n=1\)을 그대로 대입하면
\[ \nexists (c_0 , \, c_1) \in \mathbb{Z}^2\,\,\,\, s.t.\,\,\,\, c_0 + c_1 e = 0 \Leftrightarrow e = - \frac{c_0}{c_1} \]
이다.