記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

シンプソンの公式と誤差評価

今回は数値積分の一つの手法であるシンプソンの公式を紹介します. この公式が単なる近似公式ではないことを見ていきます.

(数学が苦手でない人はシンプソンの公式から読むと良いかもしれません)

数値積分とは


関数を定積分することを考えましょう。原始関数を求めれば計算ができるわけですが、実は、普段使う関数の原始関数は普段使う関数では書けないことが多々あります。例えば、 \displaystyle \frac{\sin x}{x}\displaystyle e^{-x^2/2} などは、重要であるにも関わらず、原始関数が"簡単に"書けないことが知られています。


今回は定積分, つまり, 実数を求めたいわけなので, その近似値を求めるという方向で考えていきます. 特に, 数値計算積分値を計算するということを考えます. 定積分数値計算において, ポイントは二つあると考えています.
・有限個のデータを使う
・任意の(有理数での)関数値が分かる
コンピュータを使うことから前者は自明でしょう. 一方で, 関数 f(x)積分をするときに, 好きな有理数  x での値が分かる, つまり, "使う"データは有限個でも"使える"データは無限個というのは重要です. というのも, 使えるデータが有限個で決まっているとなると, 使える手法に制限がかかります. また, 実際に決まった有限個のデータから推定値を出すという方向で考えることもあるので, それとは区別しましょうという意味です. よって, 問題は以下のようになります.


与えられるもの: 関数  f(x), x \in \mathbb{Q}積分区間  [a, b] , a, b \in \mathbb{Q}


求められるもの: 有限個の点  c_1< \dots < c_n \in \mathbb{Q} での値  f(c_1), \dots, f(c_n) から,  \int_a^b f(x) dx の近似値を求めるアルゴリズム.
特に, 使う点の個数  n が大きくなるほど精度が良くなるもの.


さらに, 問題を絞りましょう.
使う点の間隔は一定, つまり,  a_2 - a_1 = a_3-a_2 = \dots =a_n - a_{n-1} = h とします. すると,  k + 1個のデータが並ぶ区間  [ a_1, a_k] における定積分アルゴリズムを与えると、それを他の区間にも繰り返し適用することで全体の積分値が得られます。以下では、台形公式とシンプソンの公式と呼ばれるものを紹介しますが, それぞれ,  k = 2, k=3 の場合の一つの手法であり, それを全区間に繰り返すことは省略します.

台形公式


まず, 2 点でのデータが分かったときに, その間を積分区間とする定積分を計算することにしましょう. 関数  f(x)積分するかわりに, 二点  (a, f ( a ) ), (b, f(b) ) を通る直線
 \displaystyle
\quad \hat{f} (x) = \frac{f(b) - f(a)}{b - a} (x - a) + f(a)
積分します. すると, 一次関数の積分は簡単にできるので, 近似値が分かるわけです.


実際に計算してみると,
 \displaystyle
\begin{align*}
\quad \int_a^b \hat{f} (x ) dx &= \frac{f(b) - f(a) }{ b - a } \frac{(b-a)^2}{2} + f(a) (b-a) \\
&= \frac{b-a}{2} (f(a) + f(b) ) 
\end{align*}
となるので以下の近似公式が得られます.

(台形公式)
関数  f(x) aから  bまでの定積分
 \displaystyle
\quad \int_a^b f(x) dx \approx \frac{b-a}{2} (f(a) + f(b) )
の右辺で求めることを台形公式という.

図を書いてみるとすぐに分かるように, 求める図形を台形で近似したものになっています.


実際に使ってみましょう. 公式の作り方から一次関数を積分すると厳密な答えが出ることは自明です. そこで  x^2積分しましょう.  x = 1 から  x=2 まで積分すると, 近似値は
 \displaystyle
\quad \frac{2-1}{2} (2^2 + 1^2) = \frac{5}{2} = 2.5
であり, 実際の値は
 \displaystyle
\quad \int_1^2 x^2 dx = \left[ \frac{x^3}{3} \right]_1^2 = \frac{7}{3} = 2.333\dots
となり, 悪くはないですが, それなりに実際の値からはズレますね.
多項式以外にも適用してみましょう.  e^x x = 1 から  x=2 まで積分すると, 近似値は
 \displaystyle
\quad  \frac{2-1}{2} (e^2 + e^1) = \frac{1}{2}(e^2 + e) = 5.053\dots
であり, 実際の値は
 \displaystyle
\quad \int_1^2 e^x dx = \left[ e^x \right]_1^2 = e^2 - e  = 4.670\dots
となります. 式の形はずいぶん違いますが, それなりの近似値が出ている気がします.
上で述べたように, たくさんの点を取り細かく近似することで, いくらでも実際の値に近づくので, 問題があるわけではありません. しかし, もっと良い方法を考えたいものです.

シンプソンの公式

次は, 等間隔に並ぶ 3 点でのデータを使う場合を考えます.  3 点が分かればそれらを通る 2次関数が定まるので, 関数を 2次関数で近似することにしましょう.  (a ,\, f(a)) ,\, (b ,\, f(b) ) に加えてそれらの中点  ( (a+b)/2 ,\, f( (a+b)/2) )3点を通る 2次関数を \hat{f} (x)と書くことにします. すると, \int_a^b \hat{f} (x) dx \int_a^b f(x) dx の近似値であると考えることができます.

\int_a^b \hat{f} (x) dx を計算するために, 例えば, ラグランジュ補間なんかを使って  \hat{f} (x)を計算することができます. 結構計算は大変です*1. しかし, 積分の結果を知っていれば, その証明は簡単にできるので, 今回はそうします.

補題
 g (x) 2次関数とすると,
 \displaystyle
\quad \int_a^b g (x) dx = \frac{b-a}{6} \left( g (a) + 4 g \left(\frac{a+b}{2} \right) + g (b) \right)
となる.

(証明) g(x) = \alpha x^2 + \beta x + \gammaとおく. すると,
 \displaystyle 
\begin{align*}
\quad \int_a^b g(x) dx &= \frac{\alpha}{3} (b^3 - a^3) + \frac{\beta}{2} (b^2 - a^2) + \gamma (b - a)\\
&= \frac{b-a}{6} \left\{ 2\alpha (b^2 + ba + a^2) + 3\beta (b + a) + 6 \gamma \right\}
\end{align*}
であり,
 \displaystyle
\begin{align*}
\quad g(a) + 4 g \left(\frac{a+b}{2} \right) + g (b) =&\, \alpha a^2 + \beta a + \gamma \\
&+\alpha (a+b)^2 + e \beta ( a + b) + 4 \gamma \\
&+ \alpha b^2 +  \beta b + \gamma \\
=&\,  2\alpha (b^2 + ba + a^2) + 3\beta (b + a) + 6 \gamma
\end{align*}
となることから, 示すべき等式が証明できた. □

今回は,  f (x)  \hat{f} (x) x = a ,\, (a+b)/2 ,\, bでの値が等しいとするので, 補題より
 \displaystyle
\quad \int_a^b f (x) dx \approx \quad \int_a^b \hat{f} (x) dx = \frac{b-a}{6} \left \{ f(a) + 4 f \left( \frac{a+b}{2} \right) + f(b) \right \}
が分かります. よって,  f(x) 2次関数で近似することによって以下の近似式を得ることができました.

(シンプソンの公式)
関数  f(x) aから  bまでの定積分
 \displaystyle
\quad \int_a^b f(x) dx \approx \frac{b-a}{6} \left \{ f(a) + 4 f \left( \frac{a+b}{2} \right) + f(b) \right \}
の右辺で求めることをシンプソンの公式と呼ぶ.

以下では右辺を
 \displaystyle
\quad S_a^b (f) = \frac{b-a}{6} \left \{ f(a) + 4 f \left( \frac{a+b}{2} \right) + f(b) \right \}
と書くことにしましょう.

3次の多項式に適用→驚きの結果


さて, シンプソンの公式の作り方から, 2次関数までは厳密な結果が出ることが明らかなので, 三次関数  x^3積分を計算してみましょう.  x = 1 から  x=2 まで積分すると, 近似値は
 \displaystyle
\quad \frac{2-1}{6} \left( 1^3 + 4 \left( \frac{3}{2} \right)^3 + 2^3 \right) = \frac{1}{6} \left( ( 1 + \frac{27}{2} + 8 \right) =\frac{15}{4}
であり, 実際の値は
 \displaystyle
\quad \int_1^2 x^3 dx = \left[ \frac{x^4}{4} \right]_1^2 = \frac{16 - 1}{4} = \frac{15}{4}
となり, 結果が一致してしまいます. たまたまかな?と思って, 他の3次関数に適用してみても, 必ず一致することが分かります. (ぜひ自分でも計算してみてください.)


シンプソンの公式は, 関数を2次関数で近似したので, 2次関数の積分値が正しくでることは当然です. 3次関数を2次関数で近似すると当然関数は違います. しかし, その積分値は2次関数で近似しても正しくでるということが分かったのです. 今回の目標はこの現象を理解することです.


少し脱線しますが, シンプソンの公式でも  e^x積分を計算しておきましょう.  e^x x = 1 から  x=2 まで積分すると, 近似値は
 \displaystyle
\quad  \frac{2-1}{6} (e^1 + 4 e^{\frac{3}{2} } + e^2) = \frac{e + 4 e^{\frac{3}{2} } +  e^2 }{6} = 4.6723\dots
であり, 実際の値は
 \displaystyle
\quad \int_1^2 e^x dx = \left[ e^x \right]_1^2 = e^2 - e  = 4.6707\dots
となり, 小数第2位までの結果が一致しています. 非常に精度が良いです.

結果の理由1 (計算+幾何的説明)

3次関数に対しては, 近似値ではなく, 本当の公式になっているということは, 実際に代入して計算してみれば簡単に分かります.

また,  y = f(x) - \hat{f} (x) のグラフを書いてみると,  \displaystyle x =  \frac{a + b}{2} で点対称になっていることが分かります. このことから, 本当の関数と近似した関数の差  f(x) - \hat{f} (x) 積分値が  0 になることが分かるので, シンプソンの公式は厳密な値を返すということが分かります.

このように, 理由はいくらでも与えられるのですが, シンプソンの公式の本質に迫るような理由づけがしたいものです. それが次に説明する誤差評価です.

結果の理由2 (シンプソンの公式の誤差評価)

定理(シンプソンの公式の誤差)
関数  f(x) 4微分可能で f^{(4)} (x)は連続とする. (つまり,  f(x) C^4 級とする.)
このとき, 区間 [a ,\, b ] における |f^{(4)} (x)|の最大値を M,  h = (b- a)/2とすると
 \displaystyle
\quad \left| \int_a^b f(x) dx - S_a^b (f) \right| = \frac{M}{90} h^5
が成り立つ.

誤差評価の証明にはテイラー展開が必要です. ここで使うテイラー展開は数IIIの部分積分さえ分かっていれば証明ができます.

まず, 積分の基本定理より
 \displaystyle
\quad \int_a^x f^{\prime} (t) dt = f(x) - f(a)
なので,
 \displaystyle
\quad f(x) = f(a) + \int_a^x f^{\prime} (t) dt
となります. さらに, 部分積分の公式より
 \displaystyle
\begin{align*}
 \int_a^x f^{\prime} (t) dt &= - \int_a^x f^{\prime} (t) (x - t)^{\prime} dt \\
&= - \left [f^{\prime} (t) (x-t)  \right ]_a^x + \int_a^x f^{\prime \prime} (t) (x-t) dt \\
&= f^{\prime} (a)  (x-a)+ \int_a^x f^{\prime \prime} (t) (x-t) dt 
\end{align*}
が成立するので,
 \displaystyle
\quad f(x) = f(a) + f^{\prime} (a)  (x-a) + \int_a^xf^{\prime \prime} (t) (x-t)  dt
となります. これを繰り返すわけですが, もう一回分だけ書いておくと,
 \displaystyle
\begin{align*}
 \int_a^xf^{\prime \prime} (t)  (x-t) dt &=  - \int_a^x f^{\prime \prime} (t) \left( \frac{(x-t)^2}{2} \right)^{\prime} dt   \\
&=  \frac{ f^{\prime \prime} (a)}{2} (x-a)^2 + \frac{1}{2} \int_a^x  f^{\prime \prime \prime } (t) \, (x-t)^2dt
\end{align*}
となるので,
 \displaystyle
\quad f(x) = f(a) + f^{\prime} (a) \, (x-a) +   \frac{ f^{\prime \prime} (a)}{2} \, (x-a)^2 + \frac{1}{2} \int_a^x f^{\prime \prime \prime } (t) \, (x-t)^2 dt
と書けます. これを繰り返して得られる式を a周りのテイラー展開と言います.

補題テイラー展開
関数  f(x) n+1微分可能で f^{(n+1)} (x)が連続なら
 \displaystyle
\quad f(x) = \sum_{k=0} ^n  \frac{f^{(k)} (a)}{k !} (x - a) ^k + \frac{1}{n!} \int_a^x f^{(n+1)} (t) \, (x-t)^ndt
と書ける.

この補題を用いて, 誤差評価の証明をします.

(証明)
計算を簡単にするために,  m = (a+b)/2,\, h = (b - a)/2 (= b - m = m - a) とおく.
また,
 \displaystyle 
\quad e(h) =  \int_{m - h} ^{m+h} f(x) dx - S_{m - h}^{m + h} (f) \,  ( =  \int_a^b f(x) dx - S_a^b (f))
とおいて, この関数をテイラー展開を用いて評価する. そのために, この関数の微分を計算する.
ここで,
 \displaystyle
\quad S_{m - h}^{m + h} (f) = \frac{h}{3} \left\{ f(m-h) + 4 f(m) + f(m+h) \right\}
であることに注意する. 以下で, 計算が中途半端に見える部分があるが, 機械的に計算できることと計算量が少なくなることを意図している. まず一階の導関数
 \displaystyle
e^{\prime} (h ) = f(m+h) + f(m- h) - \frac{1}{3} \left\{ f(m-h) + 4 f(m) + f(m+h) \right\} - \frac{h}{3} \left\{ - f^{\prime} (m-h) + f^{\prime} (m+h) \right\}
であり, 微分係数 \displaystyle\quad e^{\prime} (0)  = 0 となる.  2階の導関数
 \displaystyle
\begin{align*}
e^{\prime \prime} (h) =& \, f^{\prime} (m + h) - f^{\prime} (m - h) - \frac{1}{3} \left\{ - f^{\prime} (m-h) + f^{\prime} (m+h) \right\}  \\
&- \frac{1}{3} \left\{ - f^{\prime} (m-h) + f^{\prime} (m+h) \right\}  - \frac{h}{3} \left\{ f^{\prime \prime } (m-h) + f^{\prime \prime} (m+h) \right\} 
\end{align*}
であり, 微分係数 e^{\prime \prime} (0) = 0 となる.  3階の導関数
 \displaystyle
\begin{align*}
e^{\prime \prime \prime } (h) =& \, f^{\prime \prime } (m + h) + f^{\prime \prime} (m - h) - \frac{1}{3} \left\{ f^{\prime \prime } (m-h) + f^{\prime \prime} (m+h) \right\}  \\
&- \frac{1}{3} \left\{  f^{\prime \prime} (m-h) + f^{\prime \prime } (m+h) \right\}  - \frac{1}{3} \left\{ f^{\prime \prime } (m-h) + f^{\prime \prime} (m+h) \right\} \\
&-  \frac{h}{3} \left\{ - f^{\prime \prime \prime} (m-h) + f^{\prime \prime \prime } (m+h) \right\}  \\
= & -  \frac{h}{3} \left\{ - f^{\prime \prime \prime} (m-h) + f^{\prime \prime \prime } (m+h) \right\}
\end{align*}
となり, やはり微分係数 e^{\prime \prime \prime} (0) = 0 となる. のちの不等式評価で便利なように  f4 次の導関数のみが現れるように,  e (h) 4 次の導関数を計算すると
 \displaystyle
\begin{align*}
e^{(4)} (h) & =  -  \frac{1}{3} \left\{ - f^{\prime \prime \prime} (m-h) + f^{\prime \prime \prime } (m+h) \right\} -  \frac{h}{3} \left\{  f^{(4)} (m-h) + f^{(4) } (m+h) \right\} \\
& = - \frac{1}{3} \int_{m - h}^{m + h} f^{(4)} (t) dt -  \frac{h}{3} \left\{  f^{(4)} (m-h) + f^{(4) } (m+h) \right\}
\end{align*}
と書ける.

以上の結果, テイラー展開 n = 3とした場合にあてはめると,
 \displaystyle
\quad e(h) = \int_0^h \frac{(h - t)^3}{3!} e^{(4)} (t) dt
となる. 絶対値をとり, 不等式を評価していくと
 \displaystyle
\quad \left| e(h) \right| \leq \int_0^h \frac{(h - t)^3}{3!} \left|e^{(4)} (t) \right| dt
であり,  M = max \left| f^{(4)} (t) \right|とおくと,
 \displaystyle
\begin{align*}
\left| e^{(4)} (h) \right| & \leq \frac{1}{3} \int_{m - h}^{m + h} \left|  f^{(4)} (t)  \right|dt -  \frac{h}{3} \left|    f^{(4)} (m-h) + f^{(4) } (m+h) \right|\\
&\leq \frac{1}{3} \int_{m-h}^{m+h} M dt + \frac{h}{3}2M\\
&= \frac{4Mh}{3} 
\end{align*}
となるので,
 \displaystyle
\quad | e(h) | = \frac{4M}{3! \times 3} \int_0^h (h - t)^3 t dt
となる. 最後に積分を計算すると,
\ \displaystyle
\begin{align*}
 \int_0^h (h - t)^3 t dt &=  \int_0^h \left\{ - \frac{(h - t)^4}{4} \right\}^{\prime} t dt \\
&= \left[  - \frac{(h - t)^4}{4}  t \right ]_0^h + \int_0^h \frac{(h - t)^4}{4} dt \\
&= \left[- \frac{(h - t)^5}{5\cdot 4} \right ]_0^h \\
&=\frac{h^5}{4}
\end{align*}
となるので, 求めたかった不等式
\displaystyle
\| e(h) \| \leq \frac{4M}{3!\cdot 3 \cdot 5\cdot 4} h^5 = \frac{M}{90} h^5
を得ることができた.□


さて,  3 次関数は  4微分 0 です. よって, シンプソンの公式を  3 次関数に適用すると, 誤差は  0 となり, 厳密に面積を求める公式となるのです.

まとめ

数値計算では, いろんな考え方で公式を導く方法があります. シンプソンの公式も他の見方をすることができます. どの考え方を採用するかで, 他の問題への一般化や新しい問題に対する適用範囲が変わってくるので, 実は公式だけでなくその背後の考え方=アルゴリズムの構造も大切だったりします. 今回の記事では, 数値計算という分野の面白さの一端を見せることができていれたなら, 幸いです.
今回の証明では,
吉田耕作『私の微積分法』
を参考にしました. 高校生でも大学の解析学を学べる良書だと思います. 気になった人はぜひ手にとってみてください.

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

↑ ↑ ↑ ↑ ↑ ↑ ↑ ↑

*1:高校生に教えるときには, 計算練習もかねて実際に計算してもらいます

逆像が像より自然な理由〜引き戻しと押し出し〜

今回は, 逆像の理解をモチベーションとして, 引き戻しと押し出しについて書きます.
細かいことを書くときりがないので, 曖昧な主張をしたり少し不具合の残る定義をしたりしますので, ご了承ください. (多様体などが例に出てきますが, 細かいところは関係ないので, うまく無視すれば, 写像さえ分かっていたら理解できる内容のはずです.)

逆像と像


U を集合,  A,\, B をその部分集合とします. このとき, 写像 f:A\to B が与えられたなら, その逆像と像が定義できます. 逆像とは
 
\quad f^{-1} (B) = \{ a \in A \, | \, f(a) \in B\}
で定まる  A の部分集合であり, 像は
 
\quad f(A) = \{ b \in B \, | \, ^{\exists} a \in A \text{ s.t. } f(a) = b\}
で定まる  B の部分集合でした.


不思議なことに, 像よりも逆像の方が自然な概念です. このことは, 例えば, 位相空間連続写像を, 像ではなくて逆像を使っていることから分かります. 他にも, 逆像では,

\begin{align*}
\quad f^{-1} (Q_1 \cup Q_2 ) &= f^{-1} (Q_1) \cup f^{-1} (Q_2) \\
f^{-1} (Q_1 \cap Q_2) &= f^{-1} (Q_1) \cap f^{-1} (Q_2)
\end{align*}
が成り立つ一方で, 像に関しては
 
\quad f(P_1 \cup P_2) = f(P_1) \cup f(P_2)
は成り立つものの

\quad f(P_1 \cap P_2) \subset f(P_1) \cap f(P_2)
では一般に等号が成り立ちません. これも, 逆像の方が像よりも自然であることの証拠です.


このことを説明するために, まずは, 「引き戻し(pull-back)」と「押し出し(push-forward)」という概念を説明します.
これが, 逆像が自然であることの一つの根拠を与えていると思っています.

引き戻しと押し出し


引き戻しと押し出しについて説明します. 写像 f:A \to B があった時に, これを用いて,  Bから定まる集合から  A から定まる集合への写像を定めるのが引き戻しです. 逆に,  Aから定まる集合から  B から定まる集合への写像を定めるのが押し出しです. これでは, ナンノコッチャ分からないので, 具体例を用いて説明します.

例1 双対ベクトル空間


 V ,\, W \mathbb{R} 上のベクトル空間とします.  V から \mathbb{R} への線形写像のなすベクトル空間を  V の双対ベクトル空間といい  V^* と書きます. 同様に  W の双対ベクトル空間  W^* も定義できます.


さて, 線形写像  f: V \to W があったとします. このとき, 双対ベクトル空間の元  w \in W^* は線形写像  w : W \to R ですので, fとの合成写像を考えると, 新たな線形写像  w \circ f: V \to R を得ることができます. つまり,  f を用いて  W^* から  V^* への写像  f^* (w) = w \circ f が定義できます.  f \circ w などの他の合成はうまくいかず,  V^* から  W^* への写像は得られないことに注意しましょう.

例2 接空間


 M ,\, N \mathbb{R}^n の部分多様体とします. 多様体の各点では, 接空間と呼ばれるベクトル空間がくっついています. これを簡単に説明します.  x \in M を通る曲線, すなわち
 
\quad c: \mathbb{R} \to M, \quad c(0) = x
となる  c の集合を  C_x M と書くことにします. この曲線の  x における方向のみを見たいので,  c_1 ,\, c_2 \in C_x M に対して
 
\quad c_1 \sim c_2\quad : \Leftrightarrow \quad c_1^{\prime} (0) = c_2^{\prime} (0)
によって同値を定めて, これによって  x における接空間  T_x M を定義します.  T_x M の元  [ c ]  x における接ベクトルといいます. 各点での接空間を合わせて,  Mの接空間を
 
\quad TM = \bigcup_{x \in M*} T_x M
と定義します. 同様に  N に対しても,  T_y N TN が定まります.


 f: M \to N多様体写像とします.  x での接ベクトルを  [ c ] \in T_x M は, 同値類うんぬんのくだりを忘れると, 単なる写像  c : \mathbb{R} \to M です. そこで, f との合成をとることで, 写像  f \circ c : \mathbb{R} \to N が定まります.  c(0) = x ,\, (f \circ c) (0) = f (x) に注意すると,  f \circ c f(x)における曲線なので,  f(x) \in N における接ベクトル  [ f \circ c ] \in T_{f(x)} N が定まります. そこで,  f_* (c) = f \circ c と書くと,  f で定まる写像  f_* :TM \to TN が得られたことになります. この  f^* を接空間の押し出しと言います.  c \circ f などの合成はうまくいかず,  TN から  TM への写像は得られないことに注意しましょう. 双対ベクトル空間のときと比べ, 合成をとる順番が逆になっていることに注意しましょう.


これらの例で分かったことをまとめておきましょう. 写像  f: A \to B があったとします. さらに,  A,\, B を始域か終域にもつ写像の集合(  S_A ,\, S_B と書くことにしましょう) があったとします. 双対ベクトル空間は, ベクトル空間を始域にもつ写像の集まりでした. 接空間は多様体を終域にもつ写像の集まりでした. すると,  f との合成を考えることで,  S_B \to S_A (引き戻し) あるいは  S_A \to S_B (押し出し) が得られます. ここで, どちらの写像が得られるかは, うまく f と合成できるかで決まる, つまり, 写像の集まり  S_A ,\, S_B の元が  A ,\, B を始域か終域のどちらにもつかで決まります. このように, 引き戻しか押し出しが定義できるのですが, どちらになるかは自然に決まっているのです.

部分集合の写像による解釈


元の問題に戻って, 写像の逆像について考えます. 像にしろ逆像にしろ, 部分集合から部分集合への写像になっています. 前節の結果を用いるためには, 部分集合を写像として定義する必要があります. (写像の合成をするわけですから.)  U の部分集合  A とは何だったのかというと,  U の各元が  A の中に入っているかどうかを決めるルールと考えることができます. つまり, 入っているを  1, 入っていないを  0 と表すことにし, 集合  \mathbb{2} = \{ 0 ,\, 1\} を用いると,  U の部分集合と,  U から  \mathbb{2} への写像が一対一に対応します.  X から  Y への写像の集合を  Y^X と書くので,  U から  \mathbb{2} への写像の集合を  \mathbb{2}^U と書きます. よって,  U の部分集合のなす集合は  \mathbb{2}^U と書けるわけです.


以上で準備はできました. 写像  f : A \to B があるとき,  A ,\, B の部分集合のなす集合  \mathbb{2}^A ,\, \mathbb{2}^B を考えます.  m \in \mathbb{2}^B写像  m: B \to \mathbb{2} なので,  f との合成を考えると, 新たな写像  m \circ f: A \to \mathbb{2} が得られます(これは引き戻し). つまり,  B の部分集合から  A の部分集合への写像が前節での方法で得られたわけです. 特に, ( B の部分集合としての)  B を表す \mathbb{2}^B の元を  m_B と書くと,  m_B \circ f: A \to \mathbb{2} こそが  A の部分集合である逆像  f^{-1} (B) に対応することが簡単に分かります. これだけは絶対に自分でチェックしてください.

まとめ

写像があるときに, それから引き戻しや押し出しが定義できます. これらは最も自然な写像の合成で定まります. 特に, 集合の逆像は部分集合の引き戻しであることを明らかにしました. 数学ではここで説明したもの以外にも, たくさんの引き戻しや押し出しがあります. しかし, 合成するだけなので, 今回の考えが理解できれば, それほど難しくないと思います.

言い忘れましたが,  f から定まる引き戻しは  f^* と書き, 押し出しは  f_* と書きます. 意外といろんなところで使われているので,  * を見つけた時は注意してみてください.

Liouvilleの定理の証明

今回はついにLiouvilleの定理の証明をします。以前の結果を使ったり、少し面倒な補題が必要になるので、証明のアイデアがわかることを重視して書こうと思います。
e^{x^2}の不定積分が書けないことの証明は、以下の記事を参考にしてください。
http://tetobourbaki.hatenablog.com/entry/2017/01/08/182822tetobourbaki.hatenablog.com
(以前書いていたLiouvilleの定理は意味のない主張になっていました。Liouvilleの定理は今回のものを参考にしてください。Liouville判定法は以前のもので正しいです。)

Liouvilleの定理の主張

Liouvilleの定理(素朴な主張)
 y_1 ,\, \dots ,\, y_n \displaystyle \frac{d y_1}{dx} ,\, \dots ,\, \frac{dy_n}{dx}x,\, y_1 ,\, \dots ,\, y_mの有理関数になるようなxの関数とする。

 F(x ,\, y_1 ,\, \dots ,\, y_n) x ,\, y_1 ,\, \dots ,\, y_nの有理関数とする。
このとき、 以下が同値である:
(i) F(x ,\, y_1 ,\, \dots ,\, y_n) の原始関数が初等関数で書ける
(ii) 複素定数 c_1 ,\, \dots ,\, c_m \in \mathbb{C}と有理関数
 G_1 (x ,\, y_1 ,\, \dots ,\, y_n) ,\, \dots ,\, G_m (x ,\, y_1 ,\, \dots ,\, y_n) ,\, H (x ,\, y_1 ,\, \dots ,\, y_n)が存在して、
 { 
\displaystyle
\begin{equation}
\qquad F(x ,\, y_1 ,\, \dots ,\, y_n) = \sum_{j=1}^n c_j \frac{\frac{d}{dx} G_j (x ,\, y_1 ,\, \dots ,\, y_n) }{G_j (x ,\, y_1 ,\, \dots ,\, y_n)} + \frac{d}{dx} H(x ,\, y_1 ,\, \dots ,\, y_n) 
\end{equation}
}
と書ける。

少し分かりにくいですね。例えば、 \displaystyle \frac{e^x}{1 + \log x}の原始関数が初等関数で書けるかを調べたいなら、

\displaystyle
\qquad y_ 1 = e^x ,\, y_2 = \log x ,\, F(x ,\, y_1 ,\, y_2) = \frac{y_1}{1 + y_2}
とおけば、

\displaystyle
\qquad \frac{d y_1}{dx} = e^x = y_2 \in \mathbb{C} (x ,\, y_1 ,\, y_2)  ,\quad \frac{d y_2}{dx} = \frac{1}{x} \in \mathbb{C} (x ,\, y_1 ,\, y_2)
より、Liouville判定法を使うことができます。
 y_1微分 \mathbb{C} (x ,\, y_1 ,\, \dots ,\, y_n )に含まれない場合があります。その場合は変数 y_{m+1}を増やさなければ、Liouville判定法が使えません。 しかし、変数を増やすと、判定で現れる G_1 ,\, \dots ,\, G_m ,\, Hのクラスが大きくなるので、判定が難しくなることにも注意してください。


さて、ここで問題になるのは「初等関数とは何か」です。まず、微分体の定義を復習しましょう。体 K微分体であるとは、写像  \partial : K \to Kが存在し、
(1) 線型性、つまり、  \partial (a + b) = \partial (a) + \partial (b)
(2) ライプニッツ則、つまり、 \partial(ab) = \partial (a) b + a \partial (b)
を満たすことを言うのでした。単に、\partial (a) a^{\prime}とも書くことがあります。また、 \partial (c) = 0となるものの集まりを定数体と言います。今回の話では、有理関数体  \mathbb{C} (X)に対して普通の意味での微分を考えたものを Kとして、微分体の結果を適用します。


次に、「初等関数」を以下のように定義します。

定義(初等拡大)
微分体の拡大K \subset Lが初等拡大であるとは、拡大の列
\displaystyle
\qquad K = K_0 \subset K_1 \subset \dots \subset K_N = L
が存在し、 各拡大が単拡大 K_{i+1} = K_i (a_i) ,\, a_i \in K_iでそれぞれ以下のいずれかの場合になっていることをいう:

 (a)  a_iK_i上代数的、つまり、 a_iK_i係数の多項式の根である;
 (b)  a_iK_iの元の対数、つまり、ある元  b_i \in K_iが存在し   \displaystyle (a_i)^{\prime} = \frac{(b_i)^{\prime}}{b_i}となる。
 (c)  a_iK_iの元の指数、つまり、ある元  b_i \in K_iが存在し  \displaystyle \frac{(a_i)^{\prime}}{a_i} = (b_i)^{\prime}となる;
特に、K = \mathbb{C} (X)のとき、ある初等拡大K \subset LLの元を初等関数という。
(b)の場合の拡大を対数拡大、(c)の場合を指数拡大と呼ぶことにします。

この定義については以下の記事で詳しく書きました。僕は、この定義を納得することが、一番難しいと思います。
tetobourbaki.hatenablog.com
また、微分体の拡大については、定数を増やさないもの考えることが一般的です。これについては以下の記事に書いています。定理の証明では、この記事に書いた結果も使います。
http://tetobourbaki.hatenablog.com/entry/2017/01/15/121054tetobourbaki.hatenablog.com


以上より、Liouvilleの定理は微分体の言葉で以下のように書きなおすことができます。

Liouvilleの定理(微分体による定式化)
 K標数0の微分体で、 C Kの定数体とする。また、 a \in Kとする。
このとき、以下が同値である。

(i) 定数体が Kの定数体  Cと等しい微分体による初等拡大
 
\qquad K = K_0 \subset K_1 \subset \dots \subset K_{N-1} \subset K_N
が存在し、 b^{\prime} = aとなる  b \in K_Nが存在する。

(ii) 定数 c_1 ,\, \dots ,\, c_n \in Cg_1  ,\, \dots ,\, g_m ,\, h \in Kが存在して、
 { 
\displaystyle
\begin{equation}
\qquad a = \sum_{j=1}^m c_j \frac{g_j^{\prime} }{g_j } + h^{\prime}
\end{equation}
}
と書ける。

この定理のすごいところは、拡大した後の性質が、拡大する前の Kの元同士の関係で書けているところです。
次にLiouvilleの定理の証明に用いる補題を紹介します。

補題
微分体の拡大 L = K(l)において、 l K上で超越的であるとする。 a[ l ] \in K[ l ]  q_1 (l) ,\, \dots ,\, q_m (l) ,\, r(l) \in K(l)を用いて、
 { 
\displaystyle
\begin{equation}
\qquad a(l) = \sum_{j=1}^m c_j \frac{q_j^{\prime} (l) }{q_j (l)} + (r(l))^{\prime} \quad (1)
\end{equation}
}
と書けるとする。 q_i (l) \neq q_j (l) ,\, i \neq jとしておく。(一般性を失わない。)このとき、 q_i (l)がモニックな既約多項式 (q_i (l) )^{\prime} \in K [l]なら、 (q_i (l) )^{\prime}  q_i (l)で割り切れる。
(証明)
 (q_i (l) )^{\prime}  q_i (l)で割り切れないと仮定する。式(1)の部分分数分解を考え、その一意性を用いる。\sum_{j=1}^m c_j \frac{q_j^{\prime} (l) }{q_j (l)}に現れる \frac{q_i^{\prime} (l) }{q_i (l)}は分母が既約多項式 1乗である。一方、 r(l)の規約分解に \frac{p(l)}{(q_i (l))^d}という項がある場合、 (r(l))^{\prime}には

\displaystyle
\qquad \frac{-d p(l)(q_i (l) )^{\prime} }{(q_i (l))^{d+1}} + \frac{(p(l))^{\prime} }{q_i (l)}
という項が現れる。つまり、既約多項式 (q_i (l))  d+1 (\geq 2 )乗の項が現れる。よって、式(1)の右辺には分数が必ず現れるが、左辺は分数がないので、一意性から矛盾。よって、 (q_i (l) )^{\prime}  q_i (l)で割り切れる。

Liouvilleの定理の証明

( (ii)  \Rightarrow (i) ) は
 
\qquad (\sum_{j=1}^m c_j \log g_j + h )^{\prime} = \sum_{j=1}^m c_j \frac{g_j^{\prime} }{g_j } + h^{\prime} = a
より分かる。
( (i)  \Rightarrow (ii) ) は初等拡大の列の長さに関する数学的帰納法により示す。
 N = 0のとき、 b \in K_0 = K a = b^{\prime}と書けるので(a)が成り立つ。次に、初等拡大の列、
 
\qquad K = K_0 \subset K_1 \subset \dots \subset K_{N-1} \subset K_N
を考えたとき、 a \in K \subset K_1に注意すると、帰納法の仮定より、
 
\qquad K_1 \subset \dots \subset K_{N-1} \subset K_N
に対して(ii)が成り立つので、定数 c_1 ,\, \dots ,\, c_n \in Cg_1  ,\, \dots ,\, g_m ,\, h \in K_1が存在して、
 { 
\displaystyle
\begin{equation}
\qquad a = \sum_{j=1}^m c_j \frac{g_j^{\prime} }{g_j } + h^{\prime}\qquad (2)
\end{equation}
}
と書ける。この式を用いて、初等拡大  K_1 = K (l)のそれぞれの場合で(ii)を示せばよい。


(a)  l K上で代数的となるとき。
この場合は体の理論を用いる。
 K代数閉体 Lとする。 l n次の代数的な元とすると、ちょうど n個のK上の埋め込み \sigma_i : K(l) \to Lが存在する。これは  K上の自己同型  L \to Lに延長できる。
ここで、微分代数に関する以下の基本的な定理を用いる。つまり、 K微分体で L \supset Kが代数拡大なら、 Kへの制限が K微分と一致する L微分が唯一に決まる。(つまり、 L \supset K微分が一意に定まる。)そこで、 L上の微分 \partialとする。さらに、写像  \sigma_i \circ \partial \circ \sigma_i^{-1} : L \to L L上の微分であることが計算で分かるので、微分が一意であることから、

\qquad  \sigma \circ \partial \circ \sigma^{-1} = \partial
つまり、

\qquad  \sigma \circ \partial  = \partial \circ \sigma_i
となり、すべての \sigma_i微分 \partialと可換である。式(2)に \sigma_jを作用させると、 \sigma_iが準同型かつ微分と可換だから
 { 
\displaystyle
\begin{equation}
\qquad a = \sum_{j=1}^m c_j \frac{(\sigma_i (g_i) ) ^{\prime} }{\sigma_i (g_j) } + ( \sigma_i (h)  ) ^{\prime}
\end{equation}
}
となる。すべての iに関して得られるこの式で両辺の和をとると、
 { 
\displaystyle
\begin{equation}
\qquad n a = \sum_{j=1}^m c_j \sum_{i=1}^n \frac{ (\sigma_i (g_j)) ^{\prime} }{\sigma_i (g_j) } + \sum_{i=1}^n (\sigma_i (h) ) ^{\prime}
\end{equation}
}
であり、対数微分の公式(この公式自体は対数を使わずとも示せる)
 
\displaystyle
\qquad \sum_{i=1} \frac{(t_i)^{\prime}}{t_i} = \frac{(\prod_{i=1}^n t_i)^{\prime}}{\prod_{i=1}^n t_i}
に注意すると、
 { 
\displaystyle
\begin{equation}
\qquad n a = \sum_{j=1}^m c_j \frac{(\prod_{i=1}^n \sigma_i (g_j ) )^{\prime} }{\prod_{i=1}^n \sigma_i (g_j) }+( \sum_{i=1}^n \sigma_i (h )) ^{\prime}
\end{equation}
}
となる。 \prod_{i=1}^n \sigma_i (g_j ) ,\, \sum_{i=1}^n \sigma_i (h )はすべての  \sigma_k で不変であることから、 Kの元となります。(ガロア理論でいうとノルムとトレースになっている。)よって、
 { 
\displaystyle
\begin{equation}
\qquad  a = \sum_{j=1}^m \frac{c_j}{n} \frac{(\prod_{i=1}^n \sigma_i (g_j ) )^{\prime} }{\prod_{i=1}^n \sigma_i (g_j) }+\left( \frac{1}{n} \sum_{i=1}^n \sigma_i (h ) \right) ^{\prime}
\end{equation}
}
と書けるので、(ii)が成り立つ。


次に、 l Kの指数または対数の場合を考える必要があります。 lが代数的な場合は示せているので、 lは超越的と仮定します。よって、 lの有理関数で書けるので、 g_j = q_j (l) ,\, h = r(l) \in K(l)とします。特に、有理関数 q_j (l)の分母と分子を既約分解し式(2)に代入すると、 q_jmは変化しますが、再び式(2)の形の式になります。そこで始めからq_j (l)はモニックで既約な多項式と仮定します。その上で、 lが指数の場合と対数の場合で場合分けします。
ここで以下の記事の命題を用いるので、そのときは「前記事の命題より」と述べます。
http://tetobourbaki.hatenablog.com/entry/2017/01/15/121054tetobourbaki.hatenablog.com


(b)  lKの対数的な元、つまり、 l^{\prime} = k^{\prime}/k ,\, k \in Kのとき。
 q_j(l) \notin Kと仮定し次数を n > 0とおくと、 l^{\prime} \in Kかつ p(l)がモニックだから、前記事の命題より (p_j (l))^{\prime} \in K[l ]  n - 1次の多項式になります。しかし、補題より  (p_j (l) )^{\prime}  p_j (l)で割り切れるはずなので、矛盾します。よって、すべての q_j Kの元です。
一方、式(2)から (r(l))^{\prime} \in Kとなります。再び前記事の命題を使うと、 r(l) \in K[ l] であること、さらに、 r (l) = c_0 l + k_0 ,\, c_0 \in C ,\, k_0 \in Kと書けることがわかります。
よって、式(*)は
 { 
\displaystyle
\begin{equation}
\qquad a = \sum_{j=1}^m c_j \frac{g_j^{\prime} }{g_j } + c_0 \frac{k^{\prime}}{k} +k_0^{\prime}
\end{equation}
}
と書けるので、示すべき式が得られた。


(c)  lKの指数的な元、つまり、 l^{\prime}/ l = k^{\prime} ,\, k \in Kのとき。
 q_j (l) \notin Kと仮定すると、補題より (q_j (l))^{\prime}  q(j)で割り切れる。よって、前記事の命題より、 q_j(l)は単項式となる。さらに、これが既約なので、 q_j(l) = lである。以上より、すべての q_j (l) Kの元か lである。
いずれにせよ、  (q_j (l))^{\prime}/ q_j (l) Kの元なので、式(*)から (r(l))^{\prime} \in Kとなる。再び前記事の命題より、 r (l) \in Kでなければならないことが分かる。
以上より、 q_j (l) = lとなるものだけ Kの元ではないが、その場合は c_j (q_j (l))^{\prime}/ q_j (l) = (c_j k)^{\prime}となるので、示すべき式で書けることが分かる。

以上でLiouvilleの定理の証明が終わりました。


さて、Liouvilleの定理(素朴な主張)は、 K = \mathbb{C} (x ,\, y_1 ,\, \dots ,\, y_n)とおき、Liouvilleの定理(微分体による定式化)を適用することで示されます。 y_1 ,\, \dots ,\, y_n微分に関する仮定は、 K微分で閉じるために必要な仮定です。

Liouville判定法とその証明


まず、微分代数によるLiouville判定法を述べます。いくつか仮定があるが、微分代数で定式化したために出てくる仮定であり、あまり気にしなくても大丈夫。

Liouville判定法
微分体の指数的拡大 E \subset K = K (e^g)を考える。 a E上超越的とする。 E ,\, Kの定数体は一致するとしCとかく。
このとき、 f \in Eに対して、以下が同値である。
(i) 定数体が Kの定数体  Cと等しい微分体による初等拡大
 
\qquad K = K_0 \subset K_1 \subset \dots \subset K_{N-1} \subset K_N
が存在し、 h^{\prime} = f e^g となる、 h \in K_Nが存在する。
(ii) ある元 a \in Eが存在して、

\qquad f = a^{\prime} + a g^{\prime}
と書ける。

少し、コメントしておきます。Liouvilleの定理より、原始関数があるかどうかは、条件を満たす Kの元があるかどうかで分かるのですが、Liouville判定法の主張の良さは、 Kそれより小さい体  Eの元の条件に簡単化している部分にあります。


(証明) (ii)  \Rightarrow (i) は (ae^g)^{\prime} = a^{\prime} e^g + a g^{\prime} e^g = (a^{\prime} +ag^{\prime} ) e^g = fe^gより分かる。

(i)  \Rightarrow (ii)を示す。Liouvilleの定理より、
 
\displaystyle 
\qquad fe^g = \sum_{j=1}^m c_j \frac{q_j^{\prime} }{q_j} + r^{\prime} \quad  (3)
となる  c_j \in C ,\, q_j ,\, r \in Kが存在する。 E \subset K = E (e^g)が指数的拡大であり、e^g E上で超越的なので、Liouvilleの定理の証明の(c)と同様の手順により、すべての q_j^{\prime} /q_j Eの元である。また、補題の証明のように、 rの既約分解を考え \frac{p(e^g)}{(q(e^g))^d}という項がある場合、 r^{\prime}には

\displaystyle
\qquad \frac{-d p(e^g)(q (e^g) )^{\prime} }{(q (e^g))^{d+1}} + \frac{(p(e^g))^{\prime} }{q (e^g)}
であるが、

\displaystyle
\qquad \frac{-d p(e^g) (q (e^g) )^{\prime} }{(q (e^g))^{d+1}} = \frac{-d p(e^g )q^{\prime} (e^g) g^{\prime} e^g }{(q (e^g ))^{d+1}}
となる。 q^{\prime} (e^g) q (e^g )より次数が1低いe^gに関する多項式であることと、 q (e^g )が既約であることから、右辺に分数が現れないためには q (e^g) = e^gでなければならないことが分かる。よって、 r = \sum_{i=-s}^t a_i (e^g)^i ,\, a_i \in Eと書ける。式(2)の e^gの係数を比較すれば、

\qquad f = a_1^{\prime} + a_1 g^{\prime}
が得られる。

さて、このLiouville判定法を有理関数体に適用すると、普段の積分で使える定理が得られます。
Liouville判定法(実用バージョン)
 C = \mathbb{C} または  \mathbb{R}とする。有理関数 f(X) ,\, g(X) \in C(X)に対して、以下が同値:
(i) 初等拡大
 
\qquad E = K_0 \subset K_1 \subset \dots \subset K_{N-1} \subset K_N
が存在し、 h^{\prime} (X) = f(X) e^{g (X)}となる、 h(X) \in K_Nが存在する。
(ii) ある元 a (X) \in C(X)が存在して、

\qquad f(X) = a^{\prime} (X) + a (X) g^{\prime} (X)
と書ける。


この定理の使い方は過去記事で書いています。Liouvilleの定理やLiouville判定法の証明からは、もっと多くのことが分かります。これを掘り下げると数式処理で積分を計算するRischのアルゴリズムを得ることができます。

感想と参考文献

ほえー。記事自体は思ったよりすぐに書けたのですが、証明を調べたりするのがなかなか大変でした。ただ、調べる過程でさらにいろんなことが分かってきました。Liouville判定法は f(x) e^{g(x)}の原始関数の存在を判定しますが、 f(x) \log xの原始関数を調べるLiouville-Hardyの判定法というものもあります。これにより a \neq 0のときに \displaystyle \frac{\log (x)}{x - a}の原始関数が初等関数で書けないことが示せます。この積分にはポリログ関数が関係しており、それ自体も面白そうです。Liouville-Hardyの判定法はLiouvilleの定理の特別な場合をHardyが考えただけですが、Hardyはかなり計算を省略しているので、証明がまだ分かりません。(これを解説した数少ない論文もあったのですが、明らかなミスがあり全然役に立ちませんでした。)今回の記事で興味を持たれた方は、ぜひ参考文献にあたって調べてみてください。

積分が初等関数で書けるというのは、微分ガロア理論を使わずとも微分代数だけで示すことができます。このことを確認するのが一連の記事の目的でした。でも、やはりガロア群が僕の興味の対象なので、しばらくは初等関数の話から離れます。微分ガロア群の記事や、もっと広く(高校〜大学程度のレベルで)興味を持ってもらえる記事を書きたいなと思います。

参考文献
R. C. Churchill, "Liouville's Theorem on Integration in Terms of Elementary Functions"
G. H. Hardy, "The Integration of Functions of A Single Elementary Variables"
E. A. Marchisotto, G. Zakeri, An Invitation to Integration in Finite Terms"
M. Rosenlicht, M. Singer, "On elementary, generalized elementary, and Liouvillian extension fields"

ライプニッツ則と合成関数の微分

ライプニッツ則と合成関数の微分の関係について、少し書いておきます。


一般の体  Kを考えます。この体が微分体であるとは、関数  \partial: K \to Kがあり、以下の2つの条件を満たすことを言います:
(i) (加法的) すべての a ,\, b \in K に対して  \partial (a + b) = \partial (a) + \partial (b)が成り立つ。
(ii) (ライプニッツ則) すべての a ,\, b \in K に対して  \partial (ab) = \partial (a) b  + a\partial (b)が成り立つ。


さて、ライプニッツ則から商の微分などの公式を導くことができます。一方、微分体には「合成関数」の概念がないので、合成関数の微分は定義できません。しかし、多項式は定義できるので、多項式に代入するという見方をすることはできます。例えば、 a^2 + a + 1多項式  x^2 + x + 1aを代入したものとみなすことができます。そうすると、多項式の合成関数の微分公式は証明することができます。つまり、微分体に対して、
(iii) すべての  a \in K自然数  nに対して、 \partial (a^n) = n a^{n-1} \partial (a)
が成り立ちます。一般の多項式微分は(i)と(iii)で計算ができます。
逆に多項式の合成関数の微分公式からライプニッツ則を導くことができます。

命題
K標数0の体とする。また、関数  \partial: K \to Kがあり、(i) を満たすとする。このとき、以下の3条件は同値:
(ii) (ライプニッツ則) すべての a ,\, b \in K に対して \partial (ab) = \partial (a) b  + a\partial (b)が成り立つ。
(iii) すべての  a \in K自然数  nに対して、 \partial (a^n) = n a^{n-1} \partial (a)
(iv) すべての  a \in Kに対して、 \partial ( a^2 ) = 2 a \partial (a)

証明. (ii)から(iii)が成り立つことは上で述べたが、簡単な計算でわかる。(iv)は(iii)で n = 2としたときである。
よって、(iv)から(ii)が導けることを示す。 (a + b)^2微分を考えると、
 \partial ( (a+b)^2) = \partial (a^2 + 2ab + b^2) = \partial (a^2) + 2\partial (ab) + \partial (b^2) = 2a\partial(a) + 2 \partial (ab) + 2b\partial (b)
最後の等式で(iv)を用いた。一方、最初に(iv)を使うと、
 \partial ( (a+b)^2) = 2(a+b) \partial(a+b) = 2(a+b)(\partial (a) + \partial (b)) = 2a\partial(a) + 2a\partial (b) + 2b\partial(a) + 2b\partial (b)
となる。よって、(ii)が成り立つことがわかる。


例えば、標数が2だと、 2\partial (ab) = 0となるので(ii)を導くことができません。細かい注意です。
(iv)からライプニッツ則(ii)が出てくるというのも面白いですが、合成関数の微分から出てくるという見方をするともっと面白いかなと思い、書いてみました。

【書評】梅村浩『ガロア 偉大なる曖昧さの理論』

今回は、ガロアについて書かれたこの本を紹介します。実は、微分ガロア理論まで紹介したすごい本なのです。

ガロア/偉大なる曖昧さの理論 (双書・大数学者の数学)

ガロア/偉大なる曖昧さの理論 (双書・大数学者の数学)

本の内容


著者の梅村浩先生は、無限次元の微分ガロア理論を作られた方です。ガロアのアイデアがどのように数学者に理解され、発展し、ついには無限次元の微分ガロア理論に至たったのか。その流れを、歴史的な記述と数学的な記述を織り交ぜながら明らかにした本です。


この本は4つの章に分かれています。1章は、当時のフランスの社会や数学者との関わりを交えながら書かれた、ガロアの人生についての解説です。2章では、代数的なガロア理論ガロアのアイデアに沿って説明し、現代的な定式化をしたのち、5次方程式の非可解性や作図不可能生が紹介されています。3章は微分ガロア理論の解説です。線形微分方程式のPicard-Vessiot理論を2階の方程式の例に沿って具体的に説明しています。次に、非線形微分方程式ガロア理論のどこに困難があり、どのようにその困難が乗り越えられたのかという部分が、明らかにされます。4章は数学的な基礎知識の章です。1章から3章では、群や体の基本知識が説明されていないですが、前提知識が無い人でも4章を適宜読むことで読み進められるようになっています。


この本の最大の特徴は、数学者と数学の発展がいきいきと描かれているところでしょう。無限次元微分ガロア理論を研究されている著者自身による微分方程式の解説も必見です。完全に理解するために必要な知識は4章に書かれていますが、初学者が最後まで読むことは難しいと思います。そのぶん、2章から3章にかけて細かいことにこだわることなく解説がされているため、ガロア理論の考え方がテンポ良く分かるようになっています。最初から全部理解するのは大変だと思いますが、どの段階の人でも読むたびに発見がある面白い本なのではないでしょうか。

感想


この本では「5次方程式が解けない」ことを明らかにした後に「5次方程式が解ける」ことがちゃんと説明されています。もちろん矛盾しているわけではなく、「解ける」の意味が違うわけです。5次方程式もモジュラー関数や超楕円関数を用いれば解けます。ガロア理論で「解けない」ことを説明した本は、この点を説明するべきだと思います。


無限次元の微分ガロア理論のもっとも重要な応用は、パンルヴェ方程式の還元不能性でしょう。パンルヴェと論争をしていたR. リュービルがジョセフ・リュービルの息子であるとさらっと書いてありますが、実はこれは気になっていたところなので、本当にそうなのか調べてみたいと思います。

参考文献

微分ガロア理論について多くのページを割いている本であるにもかかわらず、この本には微分ガロア理論の参考文献がほとんど書いてありません。線形微分方程式微分ガロア理論を厳密に解説した日本語の本として
西岡久美子『微分体の理論』
があります。また、厳密かつ簡潔に解説した文章としては、
M. van der Put, Galois Theory of Differential Equations, Algebraic Groups and Lie Algebras, 1999
があります。線形および非線形微分方程式ガロア理論に関しては梅村先生が書かれた
H. Umemura, Invitation to Galois Theory, 2006
があります。雑誌『数学』にある梅村先生の記事も参考になるでしょう。

微分環と双対数

微分環は、環の構造に加えて微分を考えているものでした。双対数を用いると、微分環は単なる環の議論に言い換えることができるということを知りました。けっこう感動したので、まとめておこうと思います。

f:id:tetobourbaki:20161230194843p:plain:w145

今回の記事では、1を持つ可換環を環と呼ぶことにします。

双対数の定義


Rの双対数 R [\epsilon]とは、z = a + b \epsilon ,\, a ,\, b \in Rの集まりで\epsilon^2 = 0となるように演算を定めた環のことです。双対数といいつつ環であることに注意。具体的に演算を計算すると、
 \displaystyle
\begin{align*}
&(a_1+b_1\epsilon) + (a_2 + b_2 \epsilon) = a_1 + a_2 + (b_1 + b_2) \epsilon\\
&(a_1+b_1\epsilon) \cdot (a_2 + b_2 \epsilon) = a_1 a_2 + (a_1 b_2 + a_2 b_1) \epsilon + b_1 b_2 \epsilon^2 =   a_1 a_2 + (a_1 b_2 + a_2 b_1) \epsilon
\end{align*}

となります。厳密に双対数を定義するには、多項式環 R[X] イデアル (X^2)で割ったもの、 R[\epsilon] := R[X]/(X^2) とすれば良いでしょう。


双対数は英語では dual number と言います。定義が似ているのは複素数ですね。Rを実数の集合として、 z = a + biの集まりでi^2 = -1と演算を入れたものが複素数でした。
複素数 \mathbb{C} = \mathbb{R} [X ] / (X^2 + 1)と厳密に定義ができます。


環の元aが可逆元であるとは、a a^{-1} = 1となる元 a^{-1}が存在することでした。つまり、aで割ることができるということです。後の議論で使う、以下の補題を覚えておいてください。

補題
以下は同値である。
(1)  a + b\epsilon \in R[ \epsilon ]が可逆元。
(2)  a \in Rが可逆元。

実際、
 { \displaystyle
(a+b \epsilon)^{-1} = \frac{1}{a} - \frac{b}{a^2} \epsilon
}
の関係がすぐに分かります。

微分環と双対数


さて、微分環と双対数の関係を考えます。
R微分環であるとは、写像D:R \to Rが存在して、
(1) D(a+b) = D(a) + D(b)
(2) D(ab) = D(a) b + a D(b)ライプニッツ則)
が成り立つことを言うのでした。
このとき、DR微分と言います。


ここからが面白いところです。実は、微分の条件は双対数の環の準同型の条件と同値なのです。

補題
Rを環、R[\epsilon]はその双対数、D:R\to R写像とします。以下は同値である。
(1) D: R \to R微分である。
(2)  a \mapsto a + D(a) \epsilonで定義された写像F_D : R \to R [\epsilon] が環の準同型である

特に、F_Dの積に関して準同型であるという条件を見てみると、
{\displaystyle
F_D(a b)= F_D (a) F_D(b)
}
つまり、
 \displaystyle
ab + D(ab)\epsilon=  (a +D(a) \epsilon) (b + D(b) \epsilon)
さらに、
 \displaystyle
ab + D(a b) \epsilon =  ab +(D(a) b + a D(b))\epsilon
となるので、F_Dが積に関して準同型であることと、Dライプニッツ即を満たすことが同値であることが分かります。他の条件は簡単に分かります。


このように微分と双対数は深い関係があるのです。上の補題以外にも、微分と双対数を結びつける考え方があります。それを使って微分係数を計算するテクニックがあるそうです。双対数はたかだか多項式の計算をするだけで、極限の操作がないことが効いているようです。今回は関係がないのでこれ以上は述べませんが、双対数か二重数で調べると出てくると思います。

双対数の応用:微分を商環に拡張する

さて、以上のことを応用してみましょう。
微分 Rの積閉集合Qによる商環 Q^{-1}R に、R微分を拡張するということを考えます。簡単に言うと、商環とはQの元を可逆元にした環のことでした。Q = \{1 ,\, x ,\, x^2 ,\, \dots \}と定義すると、 Q^{-1}Rではxが可逆元になります。Rが整域の時は、Q = R\backslash \{ 0 \} と取ることができ、Q^{-1}Rでは0以外の元が可逆元になります。つまり、体になります。これをRの商体と言うのでした。


さて、以下の簡単な補題に注意しましょう。

補題
環の準同型 f: R_1 \to R_2R_1の積閉集合Qがあるとする。
任意の  q \in Qf(q)\in R_2が単元なら、fQ^{-1} R_1から  R_2への環の準同型 \bar{f}に一意に拡張できる。

これは、\displaystyle \bar{f}( \frac{p}{q}) = \frac{f(p)}{f(q)}の関係に注意すればすぐに分かります。


さて、RD微分に持つ微分環とします。上の補題を用いて、Q^{-1} R微分を拡張することを考えましょう。微分を拡張するとは、Q^{-1}R微分が定義でき、そのRへの制限がDと一致することを言います。

補題2のように定義した F_D : R \to R[\epsilon] と自然な単射 R[\epsilon] \to Q^{-1} R [\epsilon ] の合成をG: R \to Q^{-1} [\epsilon]とします。つまり、G(p) = (p/1) + (D(p)/1) \epsilonです。q \in Qに対して q/1  \in Q^{-1} Rは単元なので、補題1と3によりGは環の準同型\bar{G}: Q^{-1} R \to Q^{-1} R [ \epsilon ]に拡張できます。ある関数E:Q^{-1} R \to Q^{-1} R が存在して\bar{G} (a) = a + E(a) \epsilon となる形になっているので、補題2により微分Dの拡張E:Q^{-1} R \to Q^{-1} Rが一意に定まることがわかりました。


どのように拡張されるかは補題(の下に書いた式)から計算できる。実際、補題1より
\displaystyle
\left(\frac{q}{1} + \frac{D(q)}{1}  \epsilon \right)^{-1} = \frac{1}{q} - \frac{D(q)}{q^2} \epsilon

なので、
 {\displaystyle 
\begin{align*}
\bar{G} \left(\frac{p}{q} \right) &= \left( \frac{p}{1} + \frac{D(p)}{1} \epsilon \right) \left( \frac{1}{q} - \frac{D(q)}{q^2} \epsilon \right) \\
&= \frac{p}{q} + \frac{D(p) q - p D(q)}{q^2} \epsilon 
\end{align*}
}

となり、Q^{-1} R微分が、
 {\displaystyle
E = \frac{D(p) q - p D(q)}{q^2}
}

と(通常のように)定義できることがわかる。

この結果を用いると、整域の商体に微分が拡張できることがわかる。この証明の面白いところは、商の微分の公式が、双対数の逆元の公式から来ていることが分かるところです。商の微分で分母が2乗されることの解釈が得られたと言えるでしょう。


参考文献
A. R. Magid, Lectures on Differential Galois Theory.
実は、このMagidの本の読書メモを書こうとしてたのですが、長くなりそうなので止めました。今回の内容は、その時に書きかけていたものを、独立して記事にしたものです。

微分体の応用(Schanuel予想もあるよ)

今回は微分体の応用として、\displaystyle \log x\displaystyle e^{x}が有理関数体 \mathbb{C} (X)上で超越的であることを見ていきます。
実は、今回の内容はLiouvilleの定理の証明の準備になっています。
(というより、Liouvilleの定理の証明が大変なので、記事を分けることにした次第です。)
おまけとして、\pieが代数的に独立であることを系に持つSchanuel予想を紹介します。

(Schanuel予想に興味がある人は、このリンクから飛んでください)

微分体の定数体に関する仮定


微分体の理論については以下の記事で簡単にまとめています。
tetobourbaki.hatenablog.com
微分体や微分ガロア理論はいつか詳しく書きたいとは思っています。


さて、微分\partial微分Kを考えます。
 C_{K} = \mathrm{Ker} \partial_K微分Kの定数体というのでした。
簡単に、 a^{\prime} := \partial (a)と書くことにしましょう。
微分体の理論では、この C_Kにいくつかの仮定を置くことが多いです。


例えば、C_K標数 0代数閉体であるというのが、線形微分ガロア理論における基本的な仮定です。
(この仮定を緩めることは現在の研究対象の一つです。)


また、微分体の拡大  K \subset Lがあるとき、一般に  C_K \subset C_Lとなりますが、 C_K = C_Lであるという仮定をおくことが多いです。
このときは、no new constant な拡大であると言ったりします。
つまり、微分体を拡大するときに、定数は追加しないということですね。
以下の補題が成り立ちます。

命題
微分体の拡大  K \subset Lに対して、以下の条件は同値である。
(a)  C_K = C_L;
(b)  k \in K ,\, \ell \in L \backslash K に対して k^{\prime} \neq \ell^{\prime}

簡単ですが、証明しましょう。
(証明)
(a)が成り立つとします。 k^{\prime} = \ell^{\prime}を仮定すると、  (k-\ell)^{\prime}  = k^{\prime} - \ell^{\prime} = 0より  k-\ellは定数。
特に、Kの元である。
これは \ell \notin Kに矛盾する。
(b)が成り立つとする。
Lの定数で Kの定数でないもの cがあったとすると、c^{\prime} = 0 = 1^{\prime}となり矛盾。


さて、no new constant の仮定にどのような意味があるかを簡単に見てみましょう。
線形微分方程式  x^{\prime} - x =0を解きたいとします。
明らかに指数関数 e^xが解ですね。
有理関数体  K = \mathbb{C} (X)には微分方程式を満たす元はありません。
解を Kに添加して、解を含む微分Lを得ることができます。
厳密には、不定Yを用いて体  L = K(Y) = \mathbb{C} (X, \, Y)を考えると、YKで超越的なので、
Y^{\prime} = Yとなる微分Lに定義でき、 K \subset L微分体の拡張となります。
線形ガロア理論の用語でいうと、この拡大 K \subset Lが方程式 x^{\prime} - x =0のPicard-Vessiot拡大と呼ばれるもので、代数方程式でいうガロア拡大に対応します。

しかし、Lに対して同じステップで新たに解を追加することができます。
すなわち、 M = L(Z) = \mathbb{C} (X,\, Y ,\, Z)Y ,\, Zが方程式  x^{\prime} - x = 0を満たす微分Mが定義できます。
つまり、無駄な解が定義できたわけです。
実は、
{\displaystyle 
\left( \frac{Y}{Z} \right)^{\prime} = \frac{Y^{\prime} Z - Y Z^{\prime}}{Z^2} = \frac{Y Z - Y Z}{Z^2} = 0
}

となるので、\displaystyle\frac{Y}{Z}Mの定数になっています。
 \displaystyle\frac{Y}{Z}\notin Kですので、拡大  K \subset Mで新たな定数が追加されています。
よって、no new constant の仮定を置くことで、このような無駄な拡大を考えないで良いことになります。


以下では、e^x\log xの超越性を示します。
ついでにLiouvilleの定理の証明で必要な命題も示します。
モチベーションを簡単に説明しましょう。
多項式では恒等式の両辺の次元を比較することで、何かが分かることがあります。
多項式では微分すると次数が一つ下がり、このことを用いる議論もたくさんあります。
しかし、e^xlog x多項式では、微分しても次数が下がるとは限りません。
そこで、これらの多項式微分したときにどうなるかについて、情報を与えてくれるのがこれから示す命題です。

log x の超越性

命題
K \subset L微分拡大とし、C_K = C_L =: Cとする。定数体C標数は0とする。
\ell \in L \backslash K\ell^{\prime} \in Kを満たすとする。
このとき、
(a) \ellK上超越的;
(b) 多項式 p(\ell) = \sum_{i=0}^n k_i \ell^{i} \in K[ \ell ] ,\, n > 0 ,\, k_n \neq 0を考えたとき、
  (p(\ell))^{\prime} \elln次の多項式であることと、k_n \notin Cであることは同値である。
 k_n \in Cなら、(p(\ell))^{\prime}n-1次の多項式になる。
が成立する。

(証明)
(a) no new constantの仮定より、\ell^{\prime} \neq 0である。
\ellK上で代数的と仮定すると、ある n > m \geq 0が存在し、
{ \displaystyle
\ell^{n} + c_m \ell^{m} + \dots + c_0 = 0 ,\, c_i \in K ,\, c_m \neq 0
}
と書ける。
 nはこのように書ける最小のものとする。
この代数方程式を微分すると、
{\displaystyle
\begin{equation}
n \ell^{\prime} \ell^{n-1} + c_m^{\prime} \ell^{m} + m c_m \ell^{\prime} \ell^{m-1}+ \dots + c_0^{\prime} = 0  \tag{1}
\end{equation}
}
となる。
3つのケースに場合分けする。
n-1 > mの場合。
標数が0であることと、\ell^{\prime} \neq 0より(i)式を n \ell^{\prime}で割ることで、n-1次の代数方程式を得る。
これは nの最小性に矛盾する。
n-1 = mかつ  n \ell + c_m^{\prime} \neq 0の場合。
(i)式を  n \ell + c_m^{\prime}で割ることで、m次の代数方程式を得る。
これも nの最小性に矛盾する。
n-1 = mかつ  n \ell + c_m^{\prime} = 0の場合。
 (n \ell + c_m)^{\prime} = n \ell + c_m^{\prime} = 0より、 n \ell + c_m \in C
しかし、n \ell + c_m \notin Kより、no new constant の仮定に矛盾。
(b) p(\ell)微分すると、
 { \displaystyle
\begin{align*}
(p(\ell))^{\prime} &= k_n^{\prime} \ell^{n}+ nk_n \ell^{\prime} \ell^{n-1} + k_{n-1}^{\prime} \ell^{n-1} + \dots + k_0^{\prime}\\
&=k_n^{\prime} \ell^n + (nk_n \ell^{\prime}  + k_{n-1}^{\prime} )\ell^{n-1} + \dots + k_0^{\prime}
\end{align*}
}
これが n次であることと k_n^{\prime} \neq 0であることは同値である。
k_n^{\prime} = 0とする。
 nk_n \ell^{\prime}  + k_{n-1}^{\prime} = 0と仮定すると、 ( n k_n \ell  + k_{n-1} )^{\prime} = 0となる。
標数が0なので、 n k_n \ell + k_{n-1} \notin Kとなり、no new constant の仮定に矛盾。


(\log x)^{\prime} = 1/x \in \mathbb{C} (X)などに注意すると、様々な系が得られる。


f(x)を定数でない有理関数とする。
\log f(x)は有理関数体 \mathbb{C} (X)上で超越的。

また、命題の(b)より、 \log x多項式微分したときに、次数が下がらないか高々1つしか下がらないことが分かる。
命題の(a)は一般的な状況の系を導く。


K標数0の微分体とする。k \in K \backslash C_Kかつ  k^{\prime} \in C_Kならk C_K上で超越的。

(証明)C_K \subset Kが no new constant な微分拡大なので、命題(a)が使える。


この系の標数が0でない場合も容易に証明できる。

命題
 K標数 p > 0微分体とする。Kの元は定数体  C_K上で代数的。

(証明)k \in Kとする。
(k^p)^{\prime} = p k^{\prime} k^{n-1} = 0より、 k^{p} \in C_K
よって、 x^p - k^p = 0C_K上の多項式 kを解に持つ。

e^xの超越性

命題
K \subset L微分拡大とし、C_K = C_L =: Cとする。定数体 C標数は0とする。
\ell \in L \backslash K\displaystyle \frac{\ell^{\prime}}{\ell} \in Kを満たすとする。
このとき、
(a) \ellK上で代数的であることと、ある n > 1 \ell^n \in Kとなることは同値;
(b) \ellK上で超越的とする。
 多項式 p(\ell) = \sum_{i=0}^n k_i \ell^{i} \in K[ \ell ] ,\, n > 0 ,\, k_n \neq 0を考えたとき、
  (p(\ell))^{\prime} \elln次の多項式である。さらに、 p(\ell)で割り切れることと、p(\ell)が単項式であることは同値。
が成立する。

(証明)
no new constant の仮定より \displaystyle b:= \frac{\ell^{\prime}}{\ell} \neq 0である。
(a) 一方は明らか。
\ellK上で代数的と仮定すると、ある n > m \geq 0が存在し、
{ \displaystyle
\ell^{n} + c_m \ell^{m} + \dots + c_0 = 0 ,\, c_i \in K ,\, c_m \neq 0
}
と書ける。
 nはこのように書ける最小のものとする。
この代数方程式を微分すると、
{\displaystyle
\begin{equation}
n b \ell^{n} + (c_m^{\prime} + m c_m b )\ell^{m}+ \dots + c_0^{\prime} = 0  \tag{1}
\end{equation}
}
となる。
この式から、nbp (\ell ) = 0を引くと、n次未満の代数方程式が得られるので、nの最小性より、m次の係数  c_m^{\prime} + mc_m b - nbc_mが0でなければいけない。
つまり、\displaystyle c_m^{\prime} + (m - n) c_m b = 0となる。
よって、
{\displaystyle
\begin{align*}
(c_m \ell^{m-n})^{\prime} &= (m - n) c_m \ell^{m - n - 1} b \ell + c_m^{\prime} \ell^{m - n}\\
&= (m-n) b c_m \ell^{m-n} + c_m^{\prime} \ell^{m-n} \\
&= 0
\end{align*}
}
となる。
以上より、c_m \ell^{m-n} \in C_K \subset K
nの最小性より、m = 0であり、 \ell^n \in Kを得る。
(b)一方は明らか。
p(\ell)^{\prime} = k p(\ell) ,\, k \in Kと書けたとする。
p(\ell)が単項式でないと仮定すると、 m < nk_m \neq 0となるものがある。
p(\ell)^{\prime} = k p(\ell)より  k_j^{\prime} + j k_j b = k k_j ,\, j = n ,\, mとなる。
kを消去すると (n - m) k_n k_m b + k_m k_n^{\prime} - k_n k_m^{\prime} = 0を得る。
よって、
{\displaystyle
\begin{align*}
\left( \frac{k_n \ell}{k_m \ell^m} \right)^{\prime} &= \frac{(k_n^{\prime} \ell^{n} +n k_n b \ell^n) k_m \ell^m - k_n \ell^{n} (k_m^{\prime} \ell^{m} +m k_m b \ell^m)}{(k_m \ell^{m})^2} \\
&= \frac{( (n-m)k_n k_m b + k_n^{\prime}  k_m  - k_n k_m^{\prime})\ell^{n+m}}{(k_m \ell^{m})^2}\\
&= 0
\end{align*}
}
よって、\displaystyle \frac{k_n \ell}{k_m \ell^m} \in C_K \subset Kとなり、\ellが超越的であることに矛盾する。
よって、 p(\ell)は単項式。


(e^{f(x)})^{\prime} / e^{f(x)} = f^{\prime} (x)から以下の系が出てきます。


定数でない有理関数f(x)に対して、\displaystyle e^{f(x)}は有理関数体 \mathbb{C} (X)上で超越的。

Schanuel予想


さて、有理関数体上の超越的であることを見てきたのですが、このような方向性で面白い問題があるのでしょうか?
超越数に関する未解決問題は、\pieの代数的独立性です。
例えば、e\mathbb{Q}(\pi)を係数とする方程式の解になるとは思えないわけです。
つまり、\mathbb{Q}上の \mathbb{Q}(\pi ,\, e)の超越次数は2と予想されているわけです。
この予想を証明する鍵になると思われているのが、Schanuel予想です。

Schanuel予想
 x_1 ,\, \dots ,\, x_n \in \mathbb{C}\mathbb{Q}上で一次独立なら、
\mathbb{Q} (x_1 ,\, \dots ,\, x_n ,\, e^{x_1} ,\, \dots ,\, e^{x_n} )\mathbb{Q}上の超越次数は  n以上になる。

この予想において、 x_1 = 1 ,\, x_2 = i \piとおけば、\mathbb{Q} (1 ,\, i \pi ,\, e ,\, e^{ i \pi}) = \mathbb{Q} (i \pi ,\, e)となり、\pieの代数的独立性が導かれます。


Schanuel予想が微分体の理論の範疇に入るかは微妙ですが、その類似の結果は微分体の理論で証明できます。

Axの定理
最低次の項の次数が1以上の形式べき級数  f_1(X) ,\, \dots ,\, f_n (X) \in X \mathbb{C} [ [ X ] ] \mathbb{Q}上で線形独立なら、
\mathbb{C} (X ,\, f_1 (X) ,\, \dots ,\, f_n (X) ,\, e^{f_1 (X)} ,\, \dots ,\, e^{f_n (X)} ) \mathbb{C}(X)上の超越次数は n以上である。

証明は参考文献の『微分体の理論』に譲ります。
Schanuel予想にはまだまだ遠いですが、微分体の意外な応用があることが伝わったかなと思います。


参考文献
西岡久美子『微分体の理論』
R. C. Churchill, "Liouville's Theorem on Integration in Terms of Elementary Functions