今天我们来看看 Apéry 是如何证明 \(\zeta(3)\) 是无理数的。

准备工作

  上回说到,对任意的 \(n\in \mathbb{N}\),如下恒等式成立: \[\sum_{m=1}^n \frac{1}{m^3}+\sum_{m=1}^n\frac{(-1)^{m-1}}{2 m^3 \binom{n}{m}\binom{n+m}{m}} =\frac{5}{2}\sum_{m=1}^n \frac{(-1)^{m-1}}{m^3 \binom{2m}{m}}.\]\(n\to\infty\) 时,左边第一项的极限就是 \(\zeta(3)\),但它的收敛速度其实不是太快;而右边收敛得相当快,这说明左边的第二项有加速收敛的作用。如果一个级数收敛得特别快,那么它的极限很可能就不是有理数。Apéry 的证明可以说正是基于上面这个收敛很快的级数。不过,它收敛得还是不够快,所以 Apéry 对它进行了一些改造,进一步加快了收敛速度,从而证明了 \(\zeta(3)\) 的无理性。
  我们先稍稍推广一下上面的级数。对于 \(0\le k\le n\),定义 \[c_{n, k}=\sum_{m=1}^n \frac{1}{m^3}+\sum_{m=1}^k\frac{(-1)^{m-1}}{2 m^3 \binom{n}{m}\binom{n+m}{m}}.\] 显然,对于任意给定的 \(k\)\(\lim_{n\to\infty} c_{n, k}=\zeta(3)\)。事实上我们还能证明更强的结论。

引理一 对于 \(k\in\mathbb{N}\)\(\{c_{n,k}\}\) 一致地收敛到 \(\zeta(3)\)
证明: 第一项跟 \(k\) 无关,所以显然一致收敛到 \(\zeta(3)\)。第二项的处理方式跟《$\zeta(2)$》证法四中的某一步几乎是一样的: \[\left|\sum_{m=1}^k\frac{(-1)^{m-1}}{2 m^3 \binom{n+m}{m}\binom{n}{m}}\right| \le \sum_{m=1}^k\frac{1}{2 m^3 \binom{n}{m}\binom{n+m}{m}}< k \frac{1}{2n(n+1)} \le \frac{1}{2(n+1)}.\] 所以它一致收敛到 \(0\)\(\Box\)

  下面这个推论是数学分析中的入门级小练习,我们就不证了。
推论一 对任意的正数数列 \(\{x_{n,k}\}\),定义 \[y_n=\frac{\sum\limits_{k=0}^n x_{n,k}c_{n,k}}{\sum\limits_{k=0}^n x_{n,k}},\] 则有 \(\lim_{n\to\infty}y_n=\zeta(3)\)

递推关系

  接下来是最核心的一步:取适当的 \(\{x_{n,k}\}\),使得相应的 \(\{y_n\}\) 能够以足够快的速度收敛。没人知道 Apéry 是如何找到下面这个答案的,我们只知道它的确满足要求。取 \[\begin{equation}\label{def-x} x_{n,k}=\binom{n}{k}^2\binom{n+k}{k}^2, \end{equation}\] 并定义 \[\begin{equation}\label{def-ab} a_n=\sum_{k=0}^n x_{n,k}c_{n,k}, \quad b_n=\sum_{k=0}^n x_{n,k}, \end{equation}\] 则根据推论一,有 \(\lim_{n\to\infty}\frac{a_n}{b_n}=\zeta(3)\)。这两个数列还具有更神奇的性质。

引理二 数列 \(\{a_n\}\)\(\{b_n\}\) 满足如下递推关系(取 \(u=a\)\(b\)): \[\begin{equation}\label{recursion} (n+1)^3 u_{n+1}-(34n^3+51n^2+27n+5)u_n+n^3 u_{n-1}=0, \end{equation}\] 并且它们由初始条件 \(a_0=0\)\(a_1=6\)\(b_0=1\)\(b_1=5\) 唯一决定。
证明: 初始条件和唯一性都是显然的,真正要证的是递推关系。
  为证明 \(\{b_n\}\) 满足递推关系 \(\eqref{recursion}\),我们引进 \[z_{n,k}=(n+1)^3 x_{n+1,k}-(34n^3+51n^2+27n+5)x_{n,k}+n^3 x_{n-1,k},\] 接下来只需证明 \(\sum_{k=0}^{n+1} z_{n,k}=0\)。记 \(B_{n,k}=\sum_{l=0}^{k} z_{n,l}\),计算一下 \(B_{n,0}\)\(B_{n,1}\)\(B_{n,2}\) 可以猜出如下公式: \[B_{n,k}=4(2n+1)\left(k(2k+1)-(2n+1)^2\right)x_{n,k},\] 它可以通过对 \(k\) 的归纳证明。特别地,取 \(k=n+1\)\(B_{n,n+1}=0\),这正是想要的恒等式。
  对于 \(\{a_n\}\),递推关系的证明要麻烦一些。我们引进 \[w_{n,k}=(n+1)^3 x_{n+1,k}c_{n+1,k}-(34n^3+51n^2+27n+5)x_{n,k}c_{n,k}+n^3 x_{n-1,k}c_{n-1,k},\] 需要证明 \(\sum_{k=0}^{n+1} w_{n,k}=0\)。首先将 \(w_{n,k}\) 改写为 \[w_{n,k}=c_{n,k} z_{n,k}+(n+1)^3x_{n+1,k}(c_{n+1,k}-c_{n,k})-n^3x_{n-1,k}(c_{n,k}-c_{n-1,k}).\]\(d_{n,k}=c_{n,k}-c_{n-1,k}\),利用对 \(k\) 的归纳法不难证明 \[d_{n,k}=\frac{(-1)^k}{n^2 (n-k) \binom{n}{k}\binom{n+k}{k}}.\]\(A_{n,k}=\sum_{l=0}^{k} w_{n,l}\),于是有 \[A_{n,k}=\sum_{l=0}^k \left(c_{n,l}\left(B_{n,l}-B_{n,l-1}\right)+(n+1)^3 x_{n+1,l}d_{n+1,l}-n^3 x_{n-1,l}d_{n,l}\right).\]\[e_{n,k}=c_{n,k}-c_{n,k-1}=\frac{(-1)^k}{2k^3\binom{n}{k}\binom{n+k}{k}},\] 利用分部求和公式可得 \[A_{n,k}=B_{n,k}c_{n,k}+\sum_{l=1}^k \left((n+1)^3 x_{n+1,l}d_{n+1,l}-n^3 x_{n-1,l}d_{n,l}-B_{n,l-1}e_{n,l}\right).\] 记上式右边的和式为 \(f_{n,k}\),利用对 \(k\) 的归纳可以证明 \[f_{n,k}=\frac{(-1)^{k-1}5k(2n+1)}{n(n+1)}\binom{n}{k}\binom{n+k}{k}.\] 于是 \[A_{n,n+1}=B_{n, n+1}c_{n,n+1}+f_{n,n+1}=0.\] 这样就证明了 \(\{a_n\}\) 的递推关系。\(\Box\)

  利用数列 \(\{a_n\}\)\(\{b_n\}\) 的递推关系可以证明它们的很多其它性质。

推论二 数列 \(\{a_n\}\)\(\{b_n\}\) 满足 \(a_nb_{n-1}-a_{n-1}b_n=\frac{6}{n^3}\)
证明:\(a_n\) 的递推关系乘以 \(b_n\),减去 \(b_n\) 的递推关系乘以 \(a_n\) 可得: \[(n+1)^3\left(a_{n+1}b_n-a_nb_{n+1}\right)=n^3\left(a_nb_{n-1}-a_{n-1}b_n\right),\] 于是 \(n^3\left(a_nb_{n-1}-a_{n-1}b_n\right)=\cdots=1^3\left(a_1b_0-a_0b_1\right)=6\)\(\Box\)

推论三 极限 \(\alpha=\lim_{n\to\infty}\frac{b_{n+1}}{b_n}\) 存在,且 \(\alpha=\left(1+\sqrt{2}\right)^4\)
证明:\(\{b_n\}\) 的递推关系改写为 \[\left(1+\frac{1}{n}\right)^3\frac{b_{n+1}}{b_n}-\left(34+\frac{51}{n}+\frac{27}{n^2}+\frac{5}{n^3}\right)+\frac{b_{n-1}}{b_n}=0.\]\(\lambda=\limsup_{n\to\infty}\frac{b_{n+1}}{b_n}\)\(\mu=\liminf_{n\to\infty}\frac{b_{n+1}}{b_n}\),对上式分别求上下极限可得 \[\lambda-34+\frac{1}{\mu}=0, \quad \mu-34+\frac{1}{\lambda}=0,\] 注意 \(\lambda, \mu \ge1\),由此可解得 \(\lambda=\mu=\left(1+\sqrt{2}\right)^4\)\(\Box\)

  下面这个推论又是一个数学分析小练习,所以我们也不证了。

推论四 对任意的 \(\epsilon>0\),存在 \(C_1,\ C_2>0\),使得 \[C_1(\alpha-\epsilon)^n < b_n < C_2(\alpha+\epsilon)^n.\]

整除性质

  根据定义 \(\eqref{def-ab}\)\(\{a_n\}\) 是正有理数序列,\(\{b_n\}\) 是正整数数列。为了计算 \(\{\frac{a_n}{b_n}\}\)\(\zeta(3)\) 的逼近速度,我们需要对 \(\{a_n\}\) 的分母有一定的估计。

引理三\(D_n\)\(1, 2, \dots, n\) 的最小公倍数,则 \(a_n\) 的分母整除 $2 D_n^3 $。
证明: 根据 \(a_n\) 的定义 \(\eqref{def-x}\)\(\eqref{def-ab}\),我们只需证明 \(2 D_n^3 \binom{n+k}{k} c_{n,k}\) 是整数。其中 \(c_{n,k}\) 的第一个和式中的每一项的分母都整除 \(D_n^3\),所以乘完之后当然是整数。对于第二个和式,我们只需证明对于 \(1\le m \le k \le n\),有 \[\frac{D_n^3 \binom{n+k}{k}}{m^3 \binom{n}{m}\binom{n+m}{m}}=\frac{D_n^3 \binom{n+k}{k-m}}{m^3 \binom{n}{m}\binom{k}{m}}\in\mathbb{N}.\]

  要证明这样的结论,我们只需说明对任意的素数 \(p\),它在上式分子中的阶大于等于它在分母的阶。关于组合数中素数的阶有著名的Kummer 定理,它的内容是:\(\binom{n}{m}\) 中素数 \(p\) 的阶(记为 \(\mathrm{ord}_p\binom{n}{m}\))等于在 \(p\) 进制中计算 \(n=m+(n-m)\) 时发生进位的次数。如果 \(m\)\(p\) 进制表达式末尾有若干零(零的个数即 \(\mathrm{ord}_p m\)),那么这些位置显然不会发生进位,所以进位次数与零的个数之和应该小于 \(n\)\(p\) 进制表达式的长度减一(因为 \(n\) 的第一位不会发生进位),所以如下不等式成立 \[\mathrm{ord}_p\binom{n}{m}+\mathrm{ord}_p m\le \left[\frac{\log n}{\log p}\right]=\mathrm{ord}_p D_n,\] 同理可得 \[\mathrm{ord}_p\binom{k}{m}+\mathrm{ord}_p m\le \mathrm{ord}_p D_k \le \mathrm{ord}_p D_n,\] 再注意到 \(\mathrm{ord}_p m\le \mathrm{ord}_p D_n\),则有 \[3 \mathrm{ord}_p D_n\ge 3 \mathrm{ord}_p m+\mathrm{ord}_p\binom{n}{m}+\mathrm{ord}_p\binom{k}{m}.\] 这就证明了 \(2 D_n^3 \binom{n+k}{k} c_{n,k}\) 的整性。\(\Box\)

  根据上述引理,定义 \[p_n=2 D_n^3 a_n, \quad q_n=2 D_n^3 b_n,\] 则它们都是整数,并且 \(\lim_{n\to\infty}\frac{p_n}{q_n}=\zeta(3)\)

定理证明

  先证明一个关于 \(\frac{p_n}{q_n}\to\zeta(3)\) 的逼近速度的定量刻画。

引理四 存在常数 \(C, \delta>0\),使得 \[\left|\zeta(3)-\frac{p_n}{q_n}\right|<\frac{C}{q_n^{1+\delta}}.\] 证明: 根据推论二, \[\frac{p_n}{q_n}-\frac{p_{n-1}}{q_{n-1}}=\frac{a_n}{b_n}-\frac{a_{n-1}}{b_{n-1}}=\frac{6}{n^3 b_{n}b_{n-1}},\] 所以 \(\frac{p_n}{q_n}\) 是严格单调上升的,且对于 \(m>n\),有 \[\frac{p_m}{q_m}-\frac{p_n}{q_n}=\sum_{k=n+1}^m \frac{6}{k^3 b_{k}b_{k-1}}.\]\(m\to\infty\)\[0<\zeta(3)-\frac{p_n}{q_n}=\sum_{k=n+1}^\infty \frac{6}{k^3 b_{k}b_{k-1}}<\frac{C_0}{b_n^2},\] 其中 \(C_0\) 可取为 \(6\zeta(3)\)。根据推论四还可以知道,对于任意的 \(\epsilon>0\),存在 \(C_1>0\),使得 \[\left|\zeta(3)-\frac{p_n}{q_n}\right|<\frac{C_0'}{(\alpha-\epsilon)^{2n}},\] 其中 \(C_0'=\frac{C_0}{C_1^2}\)
  接下来我们要把上式右边的分母换成 \(q_n\) 的某个幂次。根据 \(q_n\) 的定义和推论四,对于之前的 \(\epsilon>0\),存在 \(C_2>0\),使得 \(q_n=2 D_n^3 b_n < 2 C_2 D_n^3 (\alpha+\epsilon)^n\)。其中 \(D_n\) 满足 \[D_n=\prod_{p\le n} p^{[\log n/\log p]}<\prod_{p\le n} p^{\log n/\log p}=\prod_{p\le n} n=n^{\pi(n)}=e^{\pi(n) \log n}.\] 根据素数定理,存在 \(N\in\mathbb{N}\),使得当 \(n>N\) 时有 \(\pi(n) \log n < n(1+\epsilon)\),于是 \[q_n < 2C_2 (\alpha+\epsilon)^n e^{3\pi(n) \log n} < 2C_2 \left((\alpha+\epsilon)e^{3(1+\epsilon)}\right)^n.\]\[\delta=\frac{2\log(\alpha-\epsilon)}{\log(\alpha+\epsilon)+3(1+\epsilon)}-1,\]\[q_n^{1+\delta} < \left(2C_2\right)^{1+\delta}(\alpha-\epsilon)^{2n}.\] 所以有 \[\left|\zeta(3)-\frac{p_n}{q_n}\right| < \frac{C_3}{q_n^{1+\delta}},\] 其中 \(C_3=C_0'\left(2C_2\right)^{1+\delta}\)。注意上式仅对 \(n > N\) 成立,要使它对所有的 \(n\in\mathbb{N}\) 成立,可以适当扩大 \(C_3\),将前 \(N\) 项也包含进去即可。
  最后,还需要说明 \(\delta>0\)。只需取 \(\epsilon=0.05\),经过直接的计算可知 \(\delta>0.05\)\(\Box\)

定理(Apéry) \(\zeta(3)\) 是无理数。
证明: 假设 \(\zeta(3)=\frac{p}{q}\),其中 \(p, q\in\mathbb{N}\)。由引理四可知 \[\left|p q_n-q p_n\right|< C q q_n^{-\delta}.\] 注意 \(\frac{p_n}{q_n}\) 是严格单调增的,所以至多只会有一个 \(n\) 使得 \(\left|p q_n-q p_n\right|=0\),所以当 \(n\) 充分大时可以知道 \(\left|p q_n-q p_n\right|\ge1\)。但是另一方面,右边当 \(n\to\infty\) 时显然以 \(0\) 为极限,矛盾!\(\Box\)