記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

二体問題を解く話(四元数の応用)

二体問題は解けて三体問題は解けないと言いますが,二体問題の解法の一つを紹介します.これは三体問題に関する次の記事の準備というのが最大のモチベーションです。せっかくなので以下の論文で紹介されている四元数を使った解法を説明します.
Jan Vrbik, "A novel solution to Kepler’s problem", 2003.

二体問題とケプラー問題

二体問題とケプラー問題の関係が曖昧になっている印象なので,まずはそれらを整理しておきます.

三次元空間の二つの質点の位置を  v = (v_1, v_2, v_3), w = (w_1, w_2, w_3) とし,それぞれの質量を  m_1, m_2 とします.万有引力定数を G とすると,二体問題運動方程式

\displaystyle
\qquad m_1 \ddot{v} = - \frac{G m_1 m_2}{|v - w|^3} (v-w) \\
\displaystyle
\qquad m_2 \ddot{w} = - \frac{G m_1 m_2}{|v - w|^3} (w-v)
です.

ここで,質点2から見た質点1の相対座標  r = v - w

\displaystyle
\qquad \ddot{r} =   \ddot{v} - \ddot{w} \\
\displaystyle \qquad \, = \left( - \frac{G m_1 m_2}{m_1 |v - w|^3} (v-w)   + \frac{G m_1 m_2}{m_2 |v - w|^3} (w-v)  \right) \\
\displaystyle \qquad \, = - \left(  \frac{G m_1 m_2}{m_1 |r|^3} r   +  \frac{G m_1 m_2}{m_2 |r|^3} r  \right) \\
\displaystyle \qquad \, = -  \frac{G m_1 m_2}{M |r|^3} r
ここで,

\displaystyle \qquad M = \left(\frac{1}{m_1} + \frac{1}{m_2} \right)^{-1} = \frac{m_1 m_2}{m_1 + m_2}
である.ここで, \mu = G m_1 m_2 / M と置けば定数は一つになる.このように導かれた以下の方程式をケプラー問題という.

\displaystyle \qquad \ddot{r} = -\frac{\mu}{ |r|^3} r

一方,質量中心

\displaystyle
\qquad u = \frac{m_1 v + m_2 w}{m_1 + m_2}
をとると,

\displaystyle
\qquad \ddot{u} = \frac{1}{m_1 + m_2} \left( m_1 \ddot{v} + m_2 \ddot{w} \right) \\
\displaystyle \qquad \, = \frac{1}{m_1 + m_2} \left( - \frac{G m_1 m_2}{|v - w|^3} (v-w)   - \frac{G m_1 m_2}{|v - w|^3} (w-v)  \right) \\
\qquad  \, = 0
となるので,質量中心は等速直線運動する.

このことから,二体問題はケプラー問題の解を使って書けることが分かる.

(命題)
ケプラー問題の解を用いて二体問題は書ける.つまり,ケプラー問題が解ければ二体問題も解ける.

証明.質量中心  u = (m_1 v + m_2 w) / (m_1 + m_2) は等速直線運動するので,

\displaystyle
\qquad u(t) = \frac{m_1 v(t) + m_2 w(t)}{m_1 + m_2} = u_0 + u_1 t
のように書ける.ここで  u_0, u_1 は定数ベクトル.ここでケプラー問題の解を  r(t) とすると, r(t) = v(t) - w(t) なので,計算すると

\displaystyle
\qquad v(t) = \frac{m_2}{m_1 + m_2} r(t) + u(t) \\
\displaystyle
\qquad w(t) = \frac{-m_1}{m_1 + m_2} r(t) + u(t)
のように二体問題の解を求めることができる.\square

ケプラー問題は,二体問題で一つの質点を固定した問題と見ることもできる.質量の差が大きい場合には二体問題をそのように捉えることは妥当である.しかし,二体問題の近似としてケプラー問題を考えて,ケプラー問題の性質から二体問題の解が楕円や双曲線になると述べてるものがあるが,そういう説明では論理に飛躍がある.上で述べたような,ケプラー問題の解を使って二体問題が書けるというのが正しい説明の仕方だと思う.

(もっと言えば,ケプラー問題は制限二体問題とも言える.二体問題と制限二体問題を同一視していい理由は自明ではない.例えば,三体問題と制限三体問題では結構違いが出てくる.)

四元数を使ったケプラー問題の解法

ケプラー問題を解こう.様々な解法や説明の仕方があると思うが,今回は四元数による説明をする.

四元数について

ここからは三次元ベクトルを表すのに太字  \mathbf{a} を用いて,四元数を表すのにブラックボード体  \mathbb{a} を用いる.また,実部を持たない四元数  \mathbb{a} = xi + yj +zk をベクトル  \mathbf{a} = (x,y,z) と同一視する.

四元数の知識は既知とするが今回使うのはそれほど難しいものではない.複素数の場合, i^2 = -1 となる  i を導入するが,それに加えて  j^2 = k^2 = -1 となる  j,k を加えたものが四元数である.ただし,積に関して可換ではなく, ij = k,  jk = i,  ki = j となる一方で  ji = -k,  kj = -i,  ik = -j となる.慣れてなければ, i,j,k はこういう性質を満たす行列と思えば計算ミスが少なくなる.

行列と同様,指数も

\displaystyle
\qquad e^{\mathbb{a} } = \sum_{l=0}^\infty \frac{1}{n!} \mathbb{a}^n
と定義する.特に,

\displaystyle \qquad e^{x i} = \cos (x) + i \sin (x) \\
\displaystyle \qquad e^{x j} = \cos (x) + j \sin (x) \\
\displaystyle \qquad e^{x k} = \cos (x) + k \sin (x) \\
となる.今回の内容では,指数は三角関数に直して計算すればうまくいくと思う. \mathbb{a}, \mathbb{b} が可換でなければ  e^{\mathbb{a} } e^{\mathbb{b} } = e^{\mathbb{b} } e^{\mathbb{a} } とはならないことに注意せよ .

共役とノルムを  \bar{\mathbb{a}}, |\mathbb{a} | で表す.論文に合わせて, \mathbb{w} \bar{\mathbb{w}} = 1 を満たす四元数回転四元数と呼ぶことにする.実部を持たない四元数,つまり,ベクトル  \mathbf{u} を用いて,回転四元数 \mathbb{w} = e^{\mathbf{u}} と書くことができる.三次元での回転は回転四元数による変換

\quad \displaystyle \mathbf{r} \mapsto \mathbb{w} \mathbf{r} \bar{\mathbb{w}} = \exp (\mathbf{u} )  \mathbf{r} \exp (-\mathbf{u})
と書くことができる.

ケプラー問題を解く準備

さて,ケプラー問題

\displaystyle \qquad \ddot{\mathbf{r} } = -\frac{\mu}{ |\mathbf{r}|^3} \mathbf{r}
四元数を用いて解いていこう.ポイントはベクトル  \mathbf{r} を変数変換

\quad \displaystyle
\mathbf{r} = \mathbb{u} k \bar{\mathbb{u} }
により四元数  \mathbb{u} と変換することである.右辺の共役をとると,

\quad \displaystyle \overline{\mathbb{u} k \bar{\mathbb{u} } } = \mathbb{u} \bar{k} \bar{\mathbb{u} } = - \mathbb{u} k \bar{\mathbb{u} }
となり,実部を持たないから,任意の  \mathbb{u} \mathbf{r} はちゃんとベクトルになっている.注意として,ベクトルは3次元で四元数は4次元だからこの変換は一対一ではない.別の言い方をすれば  \mathbb{u} には1次元ぶん自由に決めることができる.この性質をうまく使う.

少し記号がややこしくなるが \displaystyle r = |\mathbf{r} | = \sqrt{\mathbf{r}  \bar{\mathbf{r}} } と表す.計算すれば, r = \mathbb{u} \bar{\mathbb{u}} = \bar{\mathbb{u} } \mathbb{u} であることも分かる.(計算の途中で, \mathbb{u} \bar{\mathbb{u}} が実数だから  k と可換であるという性質を使う.)

非可換なので  r微分してみると,

\quad \displaystyle \dot{\mathbf{r}} = \dot{\mathbb{u}} k \bar{\mathbb{u}} +  \mathbb{u} k \dot{ \bar{\mathbb{u}} }
となり,微分方程式に代入してみても非常に複雑な式が出る.そこで,

\quad \displaystyle \Gamma = \mathbb{u} k \dot{ \bar{\mathbb{u}} }-\dot{\mathbb{u}} k \bar{\mathbb{u}}
とおくと,

\quad \displaystyle \dot{\mathbf{r}} = 2\dot{\mathbb{u}} k \bar{\mathbb{u}} + \Gamma
となる. \mathbb{u} の定め方に不定性があったので, \Gamma = 0 となるようにすれば,

\quad \displaystyle \dot{\mathbf{r}} = 2\dot{\mathbb{u}} k \bar{\mathbb{u}}  \, (= 2 \mathbb{u} k \dot{ \bar{\mathbb{u}} } )
となり,計算が簡単になる. \Gammaゲージという.さらに, t

\quad \displaystyle \frac{d t}{d s} = 2r \sqrt{\frac{a}{\mu} }
により  s に変換する.ここで  a は初期値に応じて定める定数である.以下では  s による微分 \mathbb{u}' のようにプライムで表示する.するとケプラー問題は以下のように書ける.

(命題)
ゲージ  \Gamma = 0 の下でケプラー問題

\displaystyle \qquad \ddot{\mathbf{r} } = -\frac{\mu}{ |\mathbf{r}|^3} \mathbf{r}


\displaystyle \qquad
\mathbb{u}'' - \mathbb{u} \left( \frac{ \bar{\mathbb{u} }' \mathbb{u}' -2a}{r} \right) = 0
と書ける.

証明. \dot{\mathbf{r}} = 2\dot{\mathbb{u}} k \bar{\mathbb{u}} の両辺に右から  2\sqrt{a/\mu} u k をかけると,

\displaystyle \qquad 2 \sqrt{\frac{a}{\mu}} \dot{r} u k =  - 2 \sqrt{\frac{a}{\mu}} 2 \dot{u} r = - 2 u'
となる.さらにこれを  s微分すると,

\displaystyle \qquad -2 \mathbb{u}'' = 2 \sqrt{\frac{a}{\mu}} r \frac{d}{dt} \left(2 \sqrt{\frac{a}{\mu}} \dot{r} \mathbb{u} k \right) \\
\displaystyle \qquad \qquad  =4r \frac{a}{\mu} ( \ddot{\mathbf{r} } \mathbb{u} k + \dot{\mathbf{r}} \dot{\mathbb{u} } k) \\
\displaystyle \qquad \qquad =4a \frac{\mathbb{ u } }{r^2} + \frac{2}{r} \mathbb{u}' k \bar{\mathbb{u} } \mathbb{u}' k
ここで,ケプラー問題の方程式を用いた.さらに  \Gamma = 0 の式を用いると最後の項は

\displaystyle \qquad \frac{2}{r} \mathbb{u}' k \bar{\mathbb{u} } \mathbb{u}' k = \frac{2}{r} \mathbb{u} k \bar{\mathbb{u} }' \mathbb{u}' k = - \frac{2}{r} \mathbb{u}  \bar{\mathbb{u} }' \mathbb{u}'
となる.これを用いて整理すると,

\displaystyle \qquad  \mathbb{u}'' - \mathbb{u} \left( \frac{ \bar{\mathbb{u} }' \mathbb{u}' -2a}{r} \right) = 0
が分かる. \square

ここで登場した

\displaystyle \qquad
 \frac{ \bar{\mathbb{u} }' \mathbb{u}' -2a}{r}
微分すると0になるので一定であることが分かるが,実は計算するとハミルトニアンの定数倍になっていることも分かる.

(命題)
ケプラー問題のハミルトニアン

\displaystyle \qquad H = \frac{ |\dot{\mathbf{r}} |^2}{2} - \frac{\mu}{r}
を用いれば,

\displaystyle \qquad
 \frac{ \bar{\mathbb{u} }' \mathbb{u}' -2a}{r} = 2a \mu H
と書ける.
証明.

\displaystyle \qquad
 \frac{ \bar{\mathbb{u} }' \mathbb{u}' }{r} = 4\frac{a}{\mu} r\bar{\dot{ \mathbb{u} } } \dot{ \mathbb{u}}
であり,

\displaystyle \qquad |\dot{\mathbf{r} }|^2 = \dot{\bar{\mathbf{r} } } \dot{\mathbf{r}} =- \dot{\mathbf{r}} \dot{\mathbf{r}} = -4 \dot{\mathbb{u}} k \bar{\mathbb{u}} \dot{\mathbb{u}} k \bar{\mathbb{u}} = 4 r \dot{\mathbb{u}}  \dot{ \bar{\mathbb{u}} } =  4 r \dot{ \bar{\mathbb{u}} }  \dot{\mathbb{u}}
であることから証明できる. \square

まとめると以下が示された.

(定理)
ゲージ  \Gamma = 0 の下でケプラー問題

\displaystyle \qquad \ddot{\mathbf{r} } = -\frac{\mu}{ |\mathbf{r}|^3} \mathbf{r}


\displaystyle \qquad \mathbb{u}'' - 4 a \mu H \mathbb{u}   = 0
と書ける.

楕円軌道の場合の解法

線形微分方程式に帰着されたので,解自体は簡単に求まる.問題は初期値に応じてうまく  a を決めることである. a s の定義の平方根の中に入っているため, a > 0 としなければならない.

 H < 0 となる初期値の場合, -4 a \mu H = 1 となるように  a を定めれば,微分方程式

\displaystyle \qquad  \mathbb{u}'' +  \mathbb{u} = 0
だから,解は

\displaystyle \qquad \mathbb{u} = \mathbb{p} \cos s + \mathbb{q} \sin s
と書ける.
 H = 0 となる初期値の場合,微分方程式

\displaystyle \qquad  \mathbb{u}'' = 0
だから,解は

\displaystyle \qquad \mathbb{u} = \mathbb{p} + \mathbb{q} s
と書ける.
 H > 0 となる初期値の場合, 4 a \mu H = 1 となるように  a を定めれば,微分方程式

\displaystyle \qquad  \mathbb{u}'' -  \mathbb{u} = 0
だから,解は

\displaystyle \qquad \mathbb{u} = \mathbb{p} \cosh s + \mathbb{q} \sinh s
と書ける.

これから \mathbf{r} を求めれば解は完全に分かる.ただし,ゲージが  \Gamma = 0 となるように四元数の初期値を定める必要がある.さらに,この四元数による表示では実際の \mathbf{r} は複雑な形になってしまうため,それほど嬉しさを感じられない.(解けることはこの表示で一目瞭然ではあるけども)

そこで, H < 0 の場合に上でお見せした解の表示

\displaystyle \qquad \mathbb{u} = \mathbb{p} \cos s + \mathbb{q} \sin s
よりも意味がはっきりとする表示を与える.

(定理)
四元数  \mathbb{p}, \mathbb{q} を任意に取って定まる  s の関数

\displaystyle \qquad \mathbb{u} = \mathbb{p} \cos s + \mathbb{q} \sin s


\displaystyle \qquad \mathbb{u} = \mathbb{w}  \left[ A \exp ( i ( s - s_p) ) (1 + j \gamma)  + B \exp ( - i (s - s_p)) \right] \exp (k \delta)
と書ける.ここで, A, B, \delta, \gamma, s_p は実数のパラメータで, \mathbb{w} は回転四元数である.

単純な計算で証明ができるがヒントなしではかなり難しいのでおまけの節で証明する.

さて,この表示

\displaystyle \qquad \mathbb{u} = \mathbb{w}  \left[ A \exp ( i ( s - s_p) ) (1 + j \gamma)  + B \exp ( - i (s - s_p)) \right] \exp (k \delta)
をとりあえず楕円表示とでも呼ぶことにして,この表示の意味を考えよう.

まず,ゲージ \Gamma = 0 が成り立たないとケプラー問題の解ではないため,この表示でゲージが0となるためのパラメータの条件を与えよう.


\displaystyle \qquad \mathbb{u}' k \mathbb{u} \\
\displaystyle \qquad  =
 \mathbb{w} \left[ A \exp ( i (s- s_p) ) i ( 1 + j \gamma) + B \exp ( -i (s-s_p) ) (-i)   \right] \\
\displaystyle \qquad \qquad \qquad \cdot k \left[ A ( 1 - j \gamma) \exp ( -i (s- s_p) ) + B \exp ( i (s-s_p) )    \right] \bar{\mathbf{w} } \\
\displaystyle \qquad =  \mathbb{w} \left[ -A^2 (1+\gamma^2)\exp(2 i(s-s_p) ) + B^2 \exp(-2 i (s-s_p) )+2AB \cos(s - s_p) \right] j \bar{ \mathbb{w} }  - 2 A \gamma
ここで,実数  \xi に対して  ke^{i \xi} = e^{-i \xi} k となることを用いている.一方

\displaystyle \qquad \mathbb{u} k \mathbb{u}' \\
\displaystyle \qquad  = - \overline{\mathbb{u}' k \mathbb{u} } \\
\displaystyle \qquad =  - \mathbb{w} (-j) \left[ -A^2 (1+\gamma^2)\exp( - 2 i(s-s_p) ) + B^2 \exp(2 i (s-s_p) )+2AB \cos(s - s_p) \right]  \bar{ \mathbb{w} }  + 2 A \gamma \\
\displaystyle \qquad =  \mathbb{w}  \left[ -A^2 (1+\gamma^2)\exp( 2 i(s-s_p) ) + B^2 \exp( -2 i (s-s_p) )+2AB \cos(s - s_p) \right] j \bar{ \mathbb{w} }  + 2 A \gamma
となるので,

\displaystyle \qquad \mathbb{u}' k \mathbb{u} - \mathbb{u} k \mathbb{u}' = -4A\gamma
となる.よって, \Gamma = 0 となるには  A\gamma = 0 とすればよい.

(命題)
楕円表示において  \gamma = 0 と置けば, \Gamma = 0 となる.

これにより,ケプラー問題の解が得られる. \mathbf{r} = \mathbb{u} k\bar{\mathbb{u} } の計算を見てみれば,真ん中にある計算で  e^{k \delta} k e^{-k \delta} = k となるため,実は  \delta \mathbf{r} では現れないパラメータである.よって, \delta = 0 としてよい.

最後に,

\displaystyle \qquad
 \frac{ \bar{\mathbb{u} }' \mathbb{u}' -2a}{r}
の値が  s = s_p

\displaystyle \qquad \frac{ (A-B)^2 -2a}{(A+B)^2}
となることが簡単な計算で分かる.この値が  -1 となるように  a を定めたのだから, A^2 + B^2 = a となっている.

以上をまとめると,楕円表示は
 
\displaystyle \qquad  \mathbb{u} = \mathbb{w}  \left[ A \exp ( i ( s - s_p) )  + B \exp ( - i (s - s_p)) \right]
となるが, \beta = B/A とおき,A をくくり出すと,
 
\displaystyle \qquad  \mathbb{u} = \mathbb{w}  \left[ \exp ( i ( s - s_p) )  + \beta \exp ( - i (s - s_p)) \right] \sqrt{\frac{a}{1 + \beta^2} }
これを使って  \mathbf{r} を計算すると,
 
\displaystyle \qquad \mathbf{r} = \mathbb{u} k \bar{\mathbb{u} } \\
\displaystyle \qquad \, = \mathbb{w} \left[ \exp ( i ( s - s_p) )  + \beta \exp ( - i (s - s_p) ) \right] k \frac{a}{1 + \beta^2} \left[ \exp ( -i ( s - s_p) )  + B \exp (  i (s - s_p) ) \right] \bar{\mathbb{w} } \\
\displaystyle \qquad \, = \mathbb{w} \left[ \exp ( i ( s - s_p) )  + \beta \exp ( - i (s - s_p) ) \right]^2 \frac{a k}{1 + \beta^2} \bar{\mathbb{w} } \\
\displaystyle \qquad \, = \mathbb{w} \left[ \exp (2 i ( s - s_p) )  + \beta^2 \exp ( - 2 i (s - s_p) ) +2 \beta \right] \frac{a k}{1 + \beta^2} \bar{\mathbb{w} } \\
\displaystyle \qquad \, = \mathbb{w} \left[- (1-\beta^2) \sin 2 (s -s_p) j +  \{(1+\beta^2) \cos 2(s-s_p) +2\beta \} k\right] \frac{a}{1 + \beta^2} \bar{\mathbb{w} } \\
となる.つまり, y-z 平面で
 
\displaystyle \qquad (y,z) = \left(-\frac{a}{1 + \beta^2} (1-\beta^2) \sin 2 (s -s_p) ,  \frac{a}{1 + \beta^2}\{(1+\beta^2) \cos 2(s-s_p) +2\beta \} \right)
と動くものを  \mathbb{w} で回転させたものが解になっている. x-y 平面ではなく  y -z 平面になっているところや, (\cos, \sin) ではなく  (\sin, \cos) のような解の表示になっているところは不満が残るが,論文では少し変わった四元数の記法を使っているためそれが解消されている.(だから本当は楕円表示もこの定式化にあったもっといい表現方法があるはずである.)

少なくともこの表示により,解が楕円軌道上で動くことやその形や離心率も計算することができる.

まとめ

この記事の目的は,二体問題がケプラー問題に帰結することとケプラー問題が解けることを確認することでした.ケプラー問題は初期値に応じて軌道が大きく変わるわけですが,その解法が変わるのが少し問題ではあります.

本当は論文にはない双曲線の場合をやりたかったのですが,なかなか難しいです.なにが問題かというと,上で導入した楕円表示のようなものを双曲線の場合にも作る必要があるところです.安直に  \cos, \sin \cosh, \sinh に変更してもうまくいきそうにありませんでした.線形微分方程式の全ての解が表せるだけのパラメータを持っていて,かつパラメータに意味があるように表示する必要があります.例えば,楕円表示の場合には  \gamma = 0 がゲージが0になることと対応していたのでした.答えから逆算すればいい表示が見つけられるかもしれません。

おまけ

疲れたので時間がある時に書きます.

解ける線形微分方程式の話

微分ガロア理論では初等関数が扱えます.その定義はわりとわかりやすいのですが,さらに微分ガロア理論的にはLiouville拡大の方が重要な関数のクラスを定めています。しかし,その定義は初見では分かりにくいため,その意味を解説します.

Liouville拡大

微分体の定義は昔の記事を参照してください.さっそくLiouville拡大を定義します.

(定義)
 K を定数体とする.微分体の拡大  K \subset LLiouville拡大であるとは, L K の定数体が同じで,単拡大の列

\displaystyle 
\qquad K = K_0 \subset K_1 \subset \dots \subset K_n = L,\\
\displaystyle
\qquad K_{i+1} = K_i (a_{i+1} ), \quad a_i \in K_{i+1}
が存在して,それぞれの  a_{i+1}

\displaystyle 
\quad \bullet \,  a_{i+1}' \in K_i
または

\displaystyle 
 \quad \bullet\, a_{i+1}'/a_{i+1} \in K_i
となることをいう.さらに,上の二つの条件に加えて
\quad \bullet\,   a_{i+1}K_i 上代数的
も許したものを広義Liouville拡大という.

ふつうのガロア理論では群の可解が冪根拡大に対応するが,微分ガロア理論では(ざっくりいうと)群の可解とLiouville拡大が対応する.だから,Liouville拡大が大切である.ここで

\displaystyle 
\quad \bullet\,  a_{i+1}' \in K_i
という条件は   a_{i+1}' = b_i \in K_i だったとすると, a_{i+1} = \int b_i に対応する.つまり,一つ前の微分体の積分を添加したことを意味する.一方,

\displaystyle 
\quad \bullet \,  a_{i+1}'/a_{i+1} \in K_i
という条件は   a_{i+1}'/ a_i  = b_i \in K_i だったとすると, a_{i+1}' = b_i a_{i+1}, すなわち, a_{i+1} = \exp ( \int b_i ) に対応する.つまり,一つ前の微分体の指数積分を添加したことに対応する.なぜこれら二つの操作なのか?指数積分ではなく指数ではだめなのかなどの疑問が湧き上がる.よくよく考えれば,積分と指数積分というのは線形微分方程式を解くときに使う操作であることが分かる.これを説明しよう.

解ける線形微分方程式

線形微分方程式で係数行列が上三角行列ならば,積分と指数積分を用いて解けることをみよう.簡単のため  2 連立の線形微分方程式を考える.
\displaystyle \qquad
\frac{d}{dt}
\left(
\begin{matrix}
x \\
y
\end{matrix}
\right)
=
\left(
\begin{matrix}
a_{11} (t) & a_{12} (t)\\
a_{21} (t) & a_{22} (t)
\end{matrix}
\right)
\left(
\begin{matrix}
x \\
y
\end{matrix}
\right)
線形微分方程式と聞くと解けるという印象を持つ人がいるだろうが,係数行列が t に依存していると一般には解けない.(解けない理由はおまけの節を参照せよ.)そこで, a_{21} (t) = 0 として,係数行列が上三角行列であると仮定しよう.すると,この方程式は以下のステップで解ける.

Step1

まず, y に関する方程式

\displaystyle
\qquad \frac{d}{dt} y = a_{22} (t) y
を解く.これは,変数分離

\displaystyle
\qquad \frac{d y}{dt} \big/ y = a_{22} (t)
できるから解ける.具体的には

\displaystyle
\qquad y = \exp \left( \int a_{22} (t) \right)
となる.つまり, 一階の斉次線形方程式を解くのには,指数積分を用いると解ける

Step2

次に, x の方程式を考える. y に関しては解けたので,

\displaystyle
\qquad \frac{d}{dt} x = a_{11} (t) x + a_{12} (t)  \exp \left( \int a_{22} (t) \right)
となる.これは非斉次方程式なので,定数変化法を使う必要がある.つまり,斉次方程式

\displaystyle
\qquad \frac{d}{dt} x = a_{11} (t) x
の解  \exp \left( \int a_{11} (t) \right) を用いて, x = \exp \left( \int a_{11} (t) \right) C(t) と置いて, C(t) を求めると良い.具体的に計算すると, C(t)

\displaystyle
\qquad \frac{d}{dt} C = a_{12} (t)  \exp \left( \int a_{22} (t) \right) \big/ \exp \left( \int a_{11} (t) \right)
となり,右辺は  t の関数なので,積分すれば解ける.よって,解が

\displaystyle
\qquad
x = \exp \left( \int a_{11} (t) \right) \int \left[ a_{12} (t)  \exp \left( \int a_{22} (t) \right) \big/ \exp \left( \int a_{11} (t) \right) \right]
となる.以上より, 一階の非斉次線形方程式を解くのには,積分と指数積分を用いると解ける


このように,線形微分方程式を解くときに積分と指数積分が基本的な操作だったことが分かる.実はこの観点は微分ガロア理論でも大事である.

微分ガロア理論での考え方.

微分ガロア理論では以下の定理が成り立つ.

(定理)
Picard-Vessiot拡大  K \subset L微分ガロア群を  G とすると以下が同値.

(i)  K \subset L は広義Liouville拡大

(ii)  G の単位成分  G^0 は可解



微分ガロア理論を知らない人のために,直感的に説明すると,Picard-Vessiot拡大とは微分方程式の解を全て添加したもののことで,ふつうのガロア理論でいうと方程式の分解体に対応する.また,微分ガロア群は線形代数群と呼ばれるものになる.簡単に言えば,行列の集まりのことである.線形代数群は位相が入っていて,単位元を含む連結成分を単位成分と呼び  G^0 と表している.



この定理での不満点は微分ガロア G 自体の可解性ではなく単位成分  G^0 が対応することである.また,Liouville拡大ではなく広義Liouville拡大が対応している.事情は複雑のように見えるが,この定理の証明の議論を追えば,意外と納得のいく議論の積み重ねでこの定理が成り立つということが分かる.

Step1

線形代数 G の可解性はよく調べられている.まず, G が三角化可能なら,可解である.一方, G が連結なとき,可解なら三角化可能であるというのがLie-Kolchinの定理である.つまり, G が連結ならば,可解と三角化可能が同値である.だから, G が連結でなくても  G^0 に対しては,可解と三角化可能が同値である.

Step2

次に,微分ガロア群が三角化可能なら,Picard-Vessiot拡大  K \subset L はLiouville拡大であることが分かる.この証明は,係数が三角行列の線形微分方程式積分と指数積分で書けることとほぼ同じ考え方で証明できる.もちろん,方程式の係数行列とガロア群は違うから議論も全く同じというわけではないが,積分と指数積分が現れる理由がほとんど同じである.

Step3

微分体に代数的な元を添加するというのは,ガロア群のコピーが有限個作られることに対応する.この操作でガロア群は大きくなるものの, G^0 は大きくならない.だから,代数的な元の添加を気にしないときには, G^0 を見ればいいということになる.

Step4

微分体に積分や指数積分を添加することは,一般には可解性を保ちながら大きくなることを意味する.正確に言えば,元の群を  G_i,添加した後のガロア群を  G_{i+1} とすれば,一般には, G_i / G_{i+1} が可換になる.ただし,積分や指数積分がたまたま代数的な場合があり,このときは  G_i / G_{i+1} が可換とはならないことがあるが,Step3に帰着する.

まとめ



上のStepを組み合わせて定理を直感的に証明しよう.Step2により, G が三角化可能なら拡大はLiouville拡大である.しかし,Step1で述べたように, G が連結でなければ可解だとしても三角化可能かは分からないので,一般には, G が可解でもLiouville拡大とは限らない.ただし,連結なら可解から三角化可能が言えるのであった.そこで  G^0 に注目することになるが,G^0 を使うときには代数的な元の添加は分からないので, G^0 の可解性から,拡大が広義Liouville拡大である(Liouville拡大かは分からない)ことが分かる.



次に逆を考える.Step4 によりLiouville拡大ならば一般には  G が可解であることが期待できる.ただし,Step4で注意したように,積分や指数積分がたまたま代数的ならそうはならない.しかし,Step3 より,代数的な元の添加は  G^0 の可解性を壊さないから Liouville拡大なら G^0 が可解であることが分かる.同じ理由からもう少し一般化できて,広義Liouville拡大なら G^0 が可解である.

おまけ



 v をベクトル,A を行列として線形微分方程式

\displaystyle
\qquad \frac{d}{dt} v = Av
を考える. A が定数のときは, v = \exp (At) v_0 と解ける.



間違った議論をする. A A(t) t に依存するときでも,

\displaystyle
\qquad \frac{d}{dt} \exp \left(\int A(t) dt \right) = \left(\int A(t) dt\right)' \exp \left(\int A(t) dt\right) = A (t) \exp \left(\int A(t) dt \right)
だから,一般に  v = exp \left(\int A(t) dt \right) v_0 と解ける.(?)



この議論はどこか間違えており正しくない.けっこう面白いと思うので興味がある人は是非考えて欲しい.



【ヒント】もし

\displaystyle
\qquad \left(\int A(t) dt \right) A(t) = A(t) \left( \int A(t) dt \right)
が成り立つなら,上の議論は正しい. A(t) が定数のときはこれが成り立つから,定数係数の線形微分方程式は解けると解釈することもできる.

対数関数の超越性

対数関数  \log x は有理関数を係数に持つ多項式の零点にならない.つまり,対数関数は超越関数である.

超越関数であることの証明方法はいくつかあると思うが,微分代数の基本的な命題から簡単に証明できることが気がついたので紹介する.どこか議論がおかしければ誰か教えてもらえるとありがたいです.

(命題)
 K \subset L を定数体が同じ微分体の拡大とする.このとき, a \in L K 上代数的で  a' \in K ならば, a \in K である.

(証明) a の最小多項式で最高次の係数が  1 のものを

\qquad P(X) = X^n + c_{n-1} Y^{n-1} + \dots + c_0, \quad c_j \in K
とおく.

 n = 1 のとき, P(a) = 0 より  a = -c_0 \in L となるので明らか.

 n > 1 のとき, P(a) = 0 の式を微分すると

\qquad (na' + c_{n-1}') a^{n-1} + \dots + c_0' = 0
となる. a' \in K より,左辺は高々  n-1 次の  K 係数の  a多項式となる. P の最小性より,この多項式多項式として  0 でなければいけないから,特に  na' + c_{n-1}' = 0 となる.よって,定数体を  C とすると,
 \displaystyle
\qquad a' = -\frac{c_{n-1}' }{n} \\
\displaystyle \qquad a = - \frac{c_{n-1} }{n} + d, d \in C
となる.よって, a \in K となる. \square


対数関数  \log x微分 1/x \in \mathbb{C} (x) である.よって,この命題により  \log x \mathbb{C} (x) 上代数的ならば, \log x 自体が  \mathbb{C} (x) でなければならない.つまり,有理関数でなければならない.しかし,対数関数は明らかに有理関数ではない.例えば,対数関数は無限多価関数であるが,有理関数は必ず一価である.よって対数関数は超越関数である.


このように,微分代数の命題を使うと, \log x微分が有理関数になるという特殊な性質が,超越的であることに効いていることが分かる.


(参考文献)
Schidlovskii, "Transcendental Numbers"

一般化戸田方程式について

積分な方程式のとして重要な戸田格子には様々な一般化があります.戸田格子の背後にある半単純リー代数の構造に着目し,戸田格子に類似する可積分微分方程式を得る方法を紹介します.この視点に立てば,通常の戸田格子はA_n型の半単純リー代数に対応するものであると捉え直すことができます.

この記事ではハミルトン系とリー代数の定義は既知とします.(性質は記事の中で復習する.)

戸田格子

線形バネの格子


戸田格子のモチベーションを説明するために,まずは簡単な線形バネの場合から説明を始めます.


バネでつながれた  n 個の質点を考えます.

f:id:tetobourbaki:20190812172123j:plain
バネでつながれた円周上の質点
質点は円状に配置されていて,隣り合う質点同士がバネでつながれているとします.バネ定数を  k とするとハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n-1} \frac{k}{2} (q_j - q_{j+1})^2 + \frac{k}{2} (q_n - q_1)^2
となります.記述を簡単にするために, q_{n+1} := q_1, q_0 := q_n と書くことにします.するとハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n} \frac{k}{2} (q_j - q_{j+1})^2
と書き直すことができます.このとき,ハミルトン系は

\displaystyle\qquad \frac{d q_j}{d t} = p_j \\
\displaystyle \qquad \frac{d p_j}{d t} = -k (q_j - q_{j+1}) + k(q_{j-1} - q_j) = k (  q_{j-1} - 2 q_{j} + q_{j+1})
と書くことができます.線形の連立方程式なので,この方程式は解くことができます.

戸田格子


バネの力が線形にかかる場合を考えましたが,非線形の場合で解けることはあるのでしょうか?戸田盛和先生は解が楕円関数を使って書き下すことができる非線形の方程式を導きました.
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n-1} \exp (q_j - q_{j+1}) + \exp (q_n - q_1) \\
\displaystyle \qquad \quad = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n} \exp (q_j - q_{j+1})
このハミルトニアンが定める微分方程式戸田格子と呼ぶことにします.最後の  \exp (q_n - q_1) の項がない場合も戸田格子と呼ばれます.


微分方程式の可積分性は微分方程式論の古典的な話題ですが,コワレフスカヤが1900頃に剛体の運動の可積分なケースを発見してから,次に見つかった可積分微分方程式が戸田格子であり,論文が出たのは1967年でした.可積分といっても解が書けること以外にもいくつかの良い性質を戸田格子は持っており,この研究以降さまざまな可積分系が発見されることとなりました.戸田格子の持ついい性質の一つとして,この記事ではLax形式で書けることを取り上げます.

Lax形式


戸田格子のハミルトン系を書き下すと以下のようになります.

\displaystyle\qquad \frac{d q_j}{d t} = p_j \\
\displaystyle \qquad \frac{d p_j}{d t} =\exp(q_{i+1} - q_i) - \exp ( q_i - q_{i+1})
ここで新たな変数  a_j, b_j を以下のように定義します.

\displaystyle \qquad a_j = \frac{1}{2} \exp \left( \frac{q_j - q_{j+1}}{2} \right)
\displaystyle \qquad b_j = \frac{1}{2} p_j
この変数の方程式に書き換えると,微分方程式

\displaystyle \qquad \frac{d a_j}{d t} = a_j ( b_j - b_{j+1} ) \\
\displaystyle \qquad \frac{d b_j}{d t} = 2 ( a_{j-1}^2 - a_j^2)
となります.綺麗にはなりましたが,この方程式のどこがいいのでしょうか?ここでさらに  a_j, b_j で定まる行列  L, A を定義します.

\displaystyle \qquad
 L = \left(
\begin{matrix}
b_1 & a_1 & 0 & \dots & 0 & a_n \\
a_1 & b_2 & a_2 & \dots & 0 & 0 \\
 0 & a_2 & b_3 & \dots & 0 & 0 \\
      &        &        & \ddots &    &   \\
0 & 0 & 0         & \dots& b_{n-1} & a_{n-1} \\
a_n & 0 & 0         & \dots& a_{n-1} & b_n 
\end{matrix}
\right) \\


\displaystyle \qquad A = \left(
\begin{matrix}
0     & a_1    & 0    & \dots   & 0 & -a_n \\
 - a_1 & 0      & a_2 & \dots   & 0 & 0 \\
 0    & - a_2 & 0    & \dots    & 0 & 0 \\
       &         &        & \ddots  &    &   \\
0     & 0     & 0         & \dots   & 0    & a_{n-1}  \\
a_n & 0     & 0         & \dots& -a_{n-1} & 0 
\end{matrix}
\right)
すると,微分方程式

\displaystyle
\qquad \frac{d L}{d t} = [ L, A]
と書くことができます.ここで  [ L, A] = LA - AL です.この形の微分方程式Lax形式と呼びます.分かりづらいかもしれませんが, n が小さい時に具体的に書いてみると様子がわかります.例えば,3 自由度系,つまり, n = 3 のとき,

\displaystyle \qquad
 L = \left(
\begin{matrix}
b_1 & a_1 & a_n  \\
a_1 & b_2 & a_2  \\
 a_3 & a_2 & b_3 
\end{matrix}
\right),
\qquad A = \left(
\begin{matrix}
0     & a_1    & -a_3 \\
 - a_1 & 0      & a_2  \\
 a_3    & - a_2 & 0  

\end{matrix}
\right)
を使って計算してみてください.


Lax形式でかけた場合には,微分方程式の保存量をたくさん得ることができます.というのも任意の自然数  k に対して

\displaystyle \qquad
\frac{d}{dt} \mathrm{Tr} L^k = 0
となるので  \mathrm{Tr} L^k が保存量になります.ただし,保存量の全てが  \mathrm{Tr} L^k と書けるわけではないですし, \mathrm{Tr} L^k 新しい保存量を次々と与えるとも限りません.しかし,戸田格子の場合にはこの手法で役に立つ保存量を得ることができます.これが戸田格子が可積分であることの根拠の一つを与えています.

一般化戸田方程式


この記事では,戸田格子の一般化の一つを考えていきます.戸田格子のハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n-1} \exp (q_j - q_{j+1}) + \exp (q_n - q_1) \\
でした.ここで, n 個の  n 次元ベクトル
 
\displaystyle \qquad \alpha_1 = (1, -1, 0 , \dots, 0)\\
\displaystyle \qquad \alpha_2 = (0, 1, -1, \dots, 0) \\
\qquad \qquad \vdots \\
\displaystyle \qquad \alpha_{n-1} = (0, \dots, 0, 1, -1) \\
\displaystyle \qquad \alpha_n = (-1, 0, \dots, 0, 1)
を用いれば,戸田格子のハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{k=1}^{n} \exp ( \alpha_k \cdot q ) \\
と書くことができます.ここで, \cdot内積を表しています.このように,あるベクトルの集合  \{ \alpha_k \} を用いて
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{k=1}^{n} \exp ( \alpha_k \cdot q ) \\
書ける方程式を一般化戸田方程式と呼ぶことにします*1.つまり, \{ \alpha_k \} が質点の繋がり方を表しています.


一般化戸田方程式は戸田格子のようにいい性質を持っているとは限りません.そこで,二つの方向から一般化戸田方程式を研究することができます.

問題1  \{ \alpha_k \} に条件を課せば,(何らかの意味で)可積分になることを示せ.

問題2 (何らかの意味で)可積分であるときに, \{ \alpha_k \} が満たすべき条件を与えよ.

つまり,可積分であるための十分条件を与えるのが問題1で,可積分であるための必要条件を与えるのが問題2です.どちらの研究もあるのですが,今回は問題1に対応するBogoyavlensky(1976)の結果を紹介します.

(定理)
 \{ \alpha_k \} が半単純リー代数の単純ルートであれば,一般化戸田方程式はラックス形式で書ける.

この記事の残りでは,この定理を説明していきます.まずはリー代数の知識を復習していきます.

リー代数

半単純リー代数


リー代数  \mathfrak{g} が半単純リー代数であるとは,単純リー代数の直和で書けることをいいます.単純リー代数とは自明でないイデアルを持たないリー代数のことでした.半単純リー代数の性質を使っていくだけなので,定義は気にしなくていいです.


リー代数  \mathfrak{g} の元  g \in \mathfrak{g} に対して,線形写像   \mathfrak{g} \to  \mathfrak{g} h \mapsto [g , h] が定まる.この写像 \mathrm{ad} (g) (h) := [g , h] と書き,随伴表現 と呼びます.つまり, \mathrm{ad} \colon \mathfrak{g} \to \mathrm{gl} (\mathfrak{g}) であり, \mathfrak{g} の基底を定めれば  \mathrm{ad} (g) は行列で書くことができます.


この準備の下でカルタン部分代数を定義します.半単純リー代数  \mathfrak{g} の部分リー代数  \mathfrak{h}カルタン部分代数であるとは以下の性質を満たすことをいう:

 (a.) 全ての元  h \in \mathfrak{h} に対して,随伴表現  \mathrm{ad} (h) は対角化可能である.

 (b.)  \mathfrak{h} は(a.)を満たす部分リー代数の中で極大である.

性質(b.)から部分リー代数は極大ではあるものの最大とは限らないので複数存在するかもしれません.しかし,半単純リー代数の二つのカルタン部分代数  \mathfrak{h}_1, \mathfrak{h}_2 に対して,同型写像  \phi \colon \mathfrak{g} \to \mathfrak{g} \phi(\mathfrak{h}_1) = \mathfrak{h}_2 となるものが存在するので,その意味で一意に定まると考えて良いです.(つまり,リー代数的に異なる意味を持つカルタン部分代数は存在しない.)さらにいい性質として,カルタン部分代数は可換になります.特に,(a.)の性質と組み合わせると, \mathrm{ad} (h)同時対角化可能であることまでわかります.

ルート分解


以降, \mathfrak{g}カルタン部分代数を  \mathfrak{h} とします.ルート分解により簡単に表示することができます.ルートとはカルタン代数の元に対して随伴表現の同時固有値を与える  \alpha \colon \mathfrak{h} \to \mathbb{C} です.厳密に言えば,ある  x \in \mathfrak{g} が存在して,任意の h \in \mathfrak{h} に対して,

\displaystyle \qquad \mathrm{ad} (h) (x) = \alpha(h) x
が成り立つ  \alpha がルートです.ルートは双対空間  \mathfrak{h}^* の元になっています.ルートの定義に現れる  x は同時固有ベクトルを意味する重要なベクトルです.そこで,

\displaystyle \qquad \mathfrak{g}_\alpha = \{ x \in \mathfrak{g} \mid \mathrm{ad} (h) (x) = \alpha(h) x, \forall h \in \mathfrak{h} \}
とします. \mathfrak{h} は可換だったので, \mathfrak{h} \subset \mathfrak{g}_0 となります.さらに極大性から, \mathfrak{h} = \mathfrak{g}_0 も分かります. 0 でないルートの集まりをルート系といい  \Delta と書くことにします.これを用いることで,リー代数

\displaystyle \qquad \mathfrak{g} = \mathfrak{h} \oplus \sum_{\alpha \in \Delta} \mathfrak{g}_\alpha
と分解することができます.この分解をルート分解といいます.以降の考察で必要になる重要な性質を挙げておくと

 \bullet  0 でないルートに対しては  \mathfrak{g}_{\alpha} の次元は  1
 \bullet  [ \mathfrak{g}_{\alpha}, \mathfrak{g}_{\beta}  ] \subset g_{\alpha + \beta} .特に, \alpha+\beta がルートでないならば, x \in \mathfrak{g}_\alpha, y \in \mathfrak{g}_{\beta} に対して  [ x, y ] = 0

コルート


ルートはカルタン部分代数の双対空間の元なので少し扱いづらいです.そこで内積を使って元の部分代数と同一視することを考えます.リー代数に対して, B(x, y) := \mathrm{Tr} ( \mathrm{ad} (x) \mathrm{ad} (y) ) で定まる双線型性形式  B \colon \mathfrak{g} \times \mathfrak{g}  \to \mathbb{C}カルタン・キリング形式といいます.これを部分代数に制限すると  B \colon \mathfrak{h} \times \mathfrak{h}  \to \mathbb{C} \mathfrak{g} が半単純の時には非退化になることが知られています.これを用いれば, \mathfrak{h} \mathfrak{h}^* を同一視することができます.つまり,ルートを  \mathfrak{h} の元と考えることができます.厳密に言えば,全ての  h \in \mathfrak{h} に対して

\displaystyle \qquad B( t(\alpha) , h ) = \alpha (h)
となる   t(\alpha) が一意に決まるので,これをルート  \alphaコルートといいます*2 .つまり,ルートをコルートだと思うことでカルタン部分代数  \mathfrak{h} に入っていると思うことができます.


これまではスカラー複素数体  \mathbb{C} としましたが,実の空間で考えて良いことが知られています.特に, B \mathfrak{h}内積と考えることができるので,ルートはユークリッド空間に埋め込まれていると考えていいです. \mathfrak{h} の次元をリー代数ランクといいます.例として2次元のリー代数を考えている場合,ルートは  2 次元の空間で書くことができます.行列  \mathrm{sl}_{n+1} (\mathbb{C} ) = \{ A \in \mathrm{Mat}_n (\mathbb{C} ) \mid \mathrm{Tr} (A) = 0 \} はランク  nリー代数ですが, n = 2 の場合のルートは以下のように配置されます.

f:id:tetobourbaki:20190812171840j:plain
\mathrm{sl} (3) のルート
 \mathfrak{h} 2 次元で, 6 個のルートがあり,ルートそれぞれに  1 次元の空間  \mathfrak{g}_{\alpha} があるのでルート分解により  \mathfrak{g} 8 次元のベクトル空間です.私は, \mathfrak{h} 空間のルートそれぞれに  1 次元の空間が張り付いているものがリー代数  \mathfrak{g} であるとイメージしています.


また,シンプレクティック行列  \mathrm{sp}_n (\mathbb{C}) := \{ A \in \mathrm{Mat}_{2n} (\mathrm{C} ) \mid A^T J + JA = 0\}はランク  nリー代数で,n=2 の場合は以下のようになります.

f:id:tetobourbaki:20190812172026j:plain
 \mathrm{sp}(2) のルート

単純ルートと半単純リー代数の分類


カルタン部分代数の次元を  m とします.このとき,ルート系  \Delta の部分集合  \{\alpha_k \}_{k=1}^m で以下の性質を満たすものが存在します:

(1)  \{\alpha_k \}_{k=1}^m \mathfrak{h}^* の基底である.
(2)任意のルートを  \alpha = \sum_{k=1}^m c_k \alpha_k のように基底の線型結合で書いたとき,係数は全て整数  c_k \in \mathbb{Z} であり,
 全ての k c_k \leq 0
または
 全ての  k c_k \geq 0
のどちらかが成り立つ.

この性質を持つ部分集合 \{\alpha_k \}_{k=1}^m単純ルートと呼びます.仮定より,単純ルートの元  \alpha, \beta に対して  \alpha - \beta は非ゼロルートにはなりません.あるルート  \omega \omega + \sum_{k=1}^n c_k \alpha_k, c_k \geq 0 がルートとなるのは全ての  k c_k = 0 の場合のみ,となる  \omega極大ルートといいます.


半単純リー代数は単純ルートの幾何的な関係(原点からの長さと角度)で完全に決まることが知られています.行列の集まりで定義される4つのリー代数  \mathrm{sl}_{n+1} (\mathbb{C} ) \mathrm{o}_{2n + 1} (\mathbb{C} ) \mathrm{sp}_{n} (\mathbb{C} ), \mathrm{o}_{2n} (\mathbb{C} ) はそれぞれ  A_n, B_n, C_n, D_n 型の単純ルートの配置から決定されます.また, E_6, E_7, E_8, F_4, G_2 型の単純ルートの配置も加えれば,半単純リー代数はこのいずれかのルートの配置に一致するということが知られています.あとでルートや単純ルートの配置を使うので,列挙しておきます. \mathbb{R}^n の標準基底を  e_1, \dots, e_n と表すことにします.

A_n 型)
 \bullet  \mathfrak{h}^*  \mathbb{R}^{n+1} e_1 + e_2 + \dots + e_n に直行する平面
 \bullet ルート系  \Delta = \{\pm ( e_i - e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} \}.極大ルート  e_1 - e_n

 B_n 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{n}
 \bullet ルート系  \Delta = \{\pm e_i, \pm ( e_i \pm e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} , e_n \}.極大ルート  e_1 + e_2

C_n 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{n}
 \bullet ルート系  \Delta = \{\pm 2e_i, \pm ( e_i \pm e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} , 2e_n \}.極大ルート  2 e_1

 D_n 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{n}
 \bullet ルート系  \Delta = \{ \pm ( e_i \pm e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} , e_{n-1} + e_n \}.極大ルート  e_1 + e_2

 E_8 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{8}
 \bullet ルート系  \Delta = \{\pm ( e_i \pm e_j ), i < j, \frac{1}{2} \sum_{k=1}^8 (-1)^{m(i) } e_i , \sum_{k=1}^8 m(i) \text{は偶数}  \}
 \bullet 単純ルート  \{\frac{1}{2}(e_1 + e_8 - \sum{k=1}^7 e_i, e_1 + e_2, e_2 - e_1, e_3- e_2, \dots, e_7 - e_6 \}.極大ルート  e_7 + e_8

 E_7 型)
 E_8 e_7 + e_8 と直交するものをとったもの.ただし,極大ルートは  e_8 - e_7

 E_6 型)
 E_8 e_7 + e_8 e_6 + e_8 に直交するものをとったもの.ただし,極大ルートは  \frac{1}{2} (e_1 + e_2 + e_3 + e_4 + e_5 - e_6 - e_7 - e_8)

 G_2 型)
 \bullet  \mathfrak{h}^* \mathbb{R}^{3} e_1 + e_2 +e_3 に直行する平面
 \bullet ルート系  \Delta = \{ \pm ( e_i \pm e_j ), i < j, \pm (2 e_i - e_j - e_k), i \neq j \neq k \}
 \bullet 単純ルート  \{e_1 - e_2, - 2e_1 + e_2 + e_3\}.極大ルート  2e_3 - e_2 - e_1

定理の意味と証明


Bogoyavlenskiの定理の意味を説明し,証明を与えましょう.

半単純リー代数  \mathfrak{g} とそのルート分解

\displaystyle \qquad \mathfrak{g} = \mathfrak{h} \oplus \sum_{\alpha \in \Delta} \mathfrak{g}_\alpha
を考えます.ランクを  n とし, \mathfrak{h} の基底を h_1, \dots, h_n とします. \mathfrak{g}_\alpha1 次元なので,その基底を e_{\alpha} で表します.このとき, [ \mathfrak{g}_{\alpha}, \mathfrak{g}_{\beta}  ] \subset g_{\alpha + \beta} やルートの定義などからリー括弧が以下のように計算できます.

 
\bullet \displaystyle  [ e_{\alpha}, e_{\beta} ] = N_{\alpha, \beta} e_{\alpha, \beta} \\
\bullet \displaystyle [ e_{\alpha}, e_{-\alpha} ] = B(e_{\alpha}, e_{-\alpha}) t_{\alpha} \\
\bullet \displaystyle [ h_k, e_{\alpha} ] = \alpha (h_k) e_{\alpha} \\
 \bullet \displaystyle [ h_j, h_k ] = 0
ここで, N_{\alpha, \beta} はある定数.ルート分解によりこの  N_{\alpha, \beta} が定まれば, \mathfrak{g}リー代数の構造が完全に決定できたことになります.


ここからが本題です.ルート系の部分集合  R := \{\alpha_1, \dots, \alpha_m \}
  i \neq j に対して, \alpha_i - \alpha_j が非ゼロルートにならない
となるようにとります.すると, N_{\alpha, \beta} = 0 となり, [ e_{\alpha}, e_{\beta} ] = 0 となります.単純ルートで  R =\{\alpha_1, \dots, \alpha_n \} と定めれば, R はこの性質を満たします.さらに,この  R に極大ルートのマイナスを追加した  R =\{\alpha_1, \dots, \alpha_n, -\omega \} を考えてもこの性質を満たします.


Bogoyavlenskyの定理は正確には以下のような主張です.

(定理)
 \mathfrak{g} をランク  n の半単純リー代数とし,h_1, \dots, h_nカルタン部分代数の基底とする.また,ルート系の部分集合  R := \{\alpha_1, \dots, \alpha_m \}
  i \neq j に対して, \alpha_i - \alpha_j が非ゼロルートにならない
を満たすとする.最後に B( e_{\alpha_i}, e_{-\alpha_i} ) = 1 となるように  \mathfrak{g}_{\alpha_i} の基底  e_{\alpha_i} をとる.

このとき, t_{\alpha_i} = \sum_{j=1}^n d_{ij} h_j と書けたとすると,ハミルトニアン

\qquad \displaystyle H = \frac{1}{2} \sum_{k,l} B(h_k, h_l) p_k p_l + \sum_{k=1}^m \exp (2 \sum_{j = 1}^n d_{kj} q_j )
を持つハミルトン系はLax形式で書ける.特に, h_1, \dots, h_nカルタン・キリング形式  B で定まる内積の正規直交基底にとると,Lax形式で書ける一般化戸田方程式が得られる.

ここで, t_{\alpha_i} = \sum_{j=1}^n d_{ij} h_j とは(コ)ルートを基底で表示しているということです.つまり,ルートの成分表示における成分  d_{ij} で,一般化戸田方程式の質点の繋がり方が決まります.

(証明)変数変換  x_k = \exp (\sum_{j = 1}^n d_{kj} q_j ) を考えると,ハミルトン系は

\displaystyle \qquad \frac{d x_k}{dt} = x_k \sum_{ i , j } d_{kj} p_i B(h_i, h_j ) \\
\displaystyle \qquad \frac{d p_k}{dt} = -2 \sum_{j=1}^m x_j^2 d_{jk}
と書けることがわかる.ここで, \mathfrak{g}の元を

\displaystyle \qquad L := \sum_{k=1}^m x_k (e_{\alpha_k} + e_{-\alpha_k} ) + \sum_{j=1}^n p_j h_j \\
\displaystyle \qquad A := \sum_{k=1}^m x_k (e_{\alpha_k} - e_{-\alpha_k} )
と定めれば,微分方程式
 
\displaystyle \qquad \dot{L} = [L, A ]
と書けることがわかる.このリー括弧の計算では
 
\bullet \displaystyle  [ e_{\alpha_i}, e_{\alpha_j} ] = 0\\
\bullet \displaystyle [ e_{\alpha_i}, e_{-\alpha_i} ] =  t_{\alpha_i} \\
\bullet \displaystyle [ h_k, e_{\alpha_i} ] = \alpha_i (h_k) e_{\alpha_i} \\
 \bullet \displaystyle [ h_j, h_k ] = 0
用いるだけで証明ができる.最後に,半単純リー代数は同じ型を持つ行列の集合で定義されたリー代数と同型なので,
 
\displaystyle \qquad \dot{L} = [L, A]
のリー括弧が行列のリー括弧で書ける. \square


前節の最後に単純ルートや極大ルートがどのように書けるかを書きましたが,それを用いれば以下のような一般化戸田方程式を得ることができます.記述を簡単にするために
 
\displaystyle \qquad V_n = \sum_{i=1}^n \exp (q_i - q_{i+1})
とおくと,

\displaystyle \qquad H_{A_n} = \frac{1}{2} |p|^2 + V_n + \exp(q_{n+1} - q_1) \\
\displaystyle \qquad H_{B_n} = \frac{1}{2} |p|^2 + V_{n-1} + \exp(q_{n} ) \exp(- q_1 - q_2) \\
\displaystyle \qquad H_{C_n} = \frac{1}{2} |p|^2 + V_{n-1} + \exp(2 q_n) + \exp(-2 q_n) \\
\displaystyle \qquad H_{D_n} = \frac{1}{2} |p|^2 + V_{n-1} + \exp(q_{n-1} + q_n) + \exp(-q_1 - q_2) \\
\displaystyle \qquad H_{A_n} = \frac{1}{2} |p|^2 + \exp (q_1 - q_2) + \exp(-2 q_1 + q_2 + q_3) + \exp(q_1 + q_2 - 2 q_3)
ここで,R として単純ルートに極大ルートを加えたもので考えていますが,ポテンシャルの最後の項を除いたものは R として単純ルートをとった場合に対応します.


細かいことを言えば,定理を使うだけでは説明できない部分もいくつかあるのですが(例えば,A_nG_2q p の個数が違う),細かい注意はラックス形式を具体的に計算しながら見ていきます.

具体例での計算

暇があるときに書きます.

最後に

今回は,可積分であるための十分条件から一般化戸田方程式を説明しましたが,可積分であるための \{\alpha_k \} の必要条件を与える研究にも面白いものがあります.特に以下の論文が基本的です.
 Kozlov, Treshchev, Polynomial integrals of Hamiltonian systems with exponential interaction, 1990.
関連する話題には自分の専門に関係した話もあるので,機会があれば一般の人も参加できるような勉強会・研究集会で一度話したいと思っています.そのような場で発表できる機会があればご連絡いただけると嬉しいです.

参考文献

 Bogoyavlensky, On perturbation of the periodic Toda lattice, 1976.
 大貫,吉田,岩波講座 現代の物理学1 力学.
 佐藤,リー代数入門.

*1:一般化戸田方程式の定義はまちまち.特に可積分なものをそう呼ぶかもしれない

*2:異なる意味でコルートという用語を使うことも多いので注意.

可約な場合の超幾何方程式の解について


本記事では以下の定理を示す.

(定理)
 \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく. \pm \alpha \pm \beta \pm \gamma の 1 つが奇数ならば

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
は初等関数とその積分で書ける.

これは方程式が可約のとき,方程式が解けることを意味する.特殊な場合として,可約な場合の超幾何方程式も解ける.もっと言えば,超幾何方程式に帰着させてこの定理は証明される.証明を追えば,解の求め方も知ることができる.


参考文献は
[1] 河野実彦,微分方程式と数式処理
[2] 福原,大橋,初等関数で表せるRiemannのP函数の決定について
[3] Kimura, On Riemann's Equations which are Solvable by Quadratures
である.木村の定理やSchwartzによる代数解のリストについて書いた文章はネットにも結構あるが,それよりも簡単な場合の可約な場合についての解説がなかなかないと思ったのでまとめておく.


一つ注意として,文献 [1] [2] は初等関数と積分を用いて表されるものを単に初等関数と呼んでいるが,初等関数のクラスでは積分は許さないことが多い.実際,\int e^{-x^2} dx が初等関数で書けないことは有名であるが,初等関数に積分を許すと,これが意味をなさないことになる.

基礎知識


有理関数を係数に持つ  2 階の線形微分方程式を考える.特に,3 点を確定特異点に持つフックス型の微分方程式を考える.簡単のため,特異点の一つは  \infty とする.ここで用いた用語の解説は省略するが,(1) 特異点ごとに特性指数と呼ばれる 2 つの数が定まる (2) 特異点3 つの場合それらの確定特異点で方程式が完全に決定する,の 2 つを受け入れていただければ,後の議論は理解できる.


例えば, x = a の特性指数を  \lambda, \lambda' x = b の特性指数を  \mu, \mu' x = \infty の特性指数を  \nu, \nu' とすれば,微分方程式

\displaystyle
\qquad
x'' = \frac{c_0 + c_1 t}{(t- a) ( t - b)} x' + \frac{d_0 + d_1 t + d_2 t^2}{(t-a)^2 (t-b)^2}, \\
\quad c_0 = - (\lambda + \lambda' - 1) b - (\mu + \mu' - 1) a, \quad c_1 = - (\nu + \nu' + 1) \\
\quad d_0 = (a-b) b \lambda \lambda' + (b-a) a \mu \mu' - ab \nu \nu', \\
\quad d_1 = (b-a) \lambda \lambda' + (a- b) \mu \mu' + (a+b) \nu \nu', \quad d_2 = - \nu \nu'
となる.(確定特異点と特性指数の定義が分かれば簡単に計算ができる.)決定された方程式を見れば分かるように,各特異点の特性指数の順序は交換しても良い.(例えば, \lambda \lambda' を変えてもよい.)特性指数で方程式が決まるので,この方程式の解の集合を

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
と表す.これをRiemannの  \wp 関数と呼ぶ.ただし,特性指数の和は必ず 1 になる,つまり  \lambda + \lambda' + \mu + \mu' + \nu + \nu' = 1 となるので全てを自由に取れるわけではない.独立変数の変換  \tau = (t - a)/(b-a) により,

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
=
\wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
\lambda & \mu & \nu &; \tau \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
となる.つまり,特異点 0, 1, \infty に固定してよい.さらに, y = (t- a)^{-\lambda} (t - b)^{\mu} x と従属変数の変換をすれば,
 \qquad 
\displaystyle
y =(t- a)^{-\lambda} (t - b)^{\mu} \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
=\wp \left\{
\begin{matrix}
a & b & \infty & \\
0 & 0 & \nu + \lambda + \mu&; t \\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \nu & 
\end{matrix}
\right\}
と変換することができる.(普通に変数変換すれば分かる.)つまり, t = a, b のそれぞれの特性指数の  1 つを  0 にすることができる.特性指数の和が 1 になることに注意すれば,微分方程式を決定する本質的な特性指数の個数は 3 つである.ここで,変換  y = (t- a)^{-\lambda} (t - b)^{\mu} x により,特性指数の差  \lambda' - \lambda, \mu' - \mu, \nu' - \nu も不変になっていることに注意せよ.ここで用いた独立変数と従属変数の変換を用い,定数を書き換えると,考えている全ての方程式は以下の  \wp 関数に帰着される.
 
\displaystyle
\qquad
\wp \left\{
\begin{matrix}
a & b & \infty & \\
0& 0 & a &; t \\
1 - c & c - a - b & b & 
\end{matrix}
\right\}
これが満たす方程式が超幾何方程式と呼ばれる以下の方程式である.

\displaystyle
\qquad
t ( 1-t) x'' + \{ c - ( a + b + 1) t \} y' - ab y = 0

可約性


 2 階の有理係数の線形微分方程式において, 0 でない解  x 1 階の有理係数の方程式  x' = r(t) x の解になっているとき,方程式は可約であるという.今考えているような 3 つの確定特異点を持つ 2 階の方程式に対しては以下の同値性が知られている.

(命題)

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
を解に持つ方程式を考える.また,特性指数の差を  \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく.このとき,以下が同値,
(1) 方程式は可約である.
(2) 以下の 8 つの数
  \qquad \alpha+ \beta + \gamma, -\alpha + \beta + \gamma,\alpha- \beta + \gamma, \alpha+ \beta - \gamma,\\
  \qquad -\alpha - \beta + \gamma,  -\alpha+ \beta - \gamma, \alpha- \beta - \gamma, -\alpha- \beta - \gamma
 のいずれかが奇数.
(3) 以下の 8 つの数
 \qquad \lambda + \mu + \nu, \lambda' + \mu + \nu,\lambda + \mu' + \nu,\lambda + \mu + \nu'\\
\qquad \lambda' + \mu' + \nu, \lambda' + \mu + \nu',\lambda + \mu' + \nu',\lambda' + \mu' + \nu'
 のいずれかが整数.

条件(3)で 8 つの数を見なければいけないのは,特性指数の順番を変えても方程式は変わらないことに由来する.このことは特性指数の差で言えば,正負を変えても方程式は変わらないことを意味し,(2) も 8つの数を見なければいけないことになる.

証明.(2) ならば (3) であること.奇数となる組みに対し, \lambda + \lambda' + \mu + \mu' + \nu + \nu' = 1 の式を加えれば (3) が示せる.

(3) ならば (2) であること.整数となるペアに対し, \frac{1}{2} (\lambda + \lambda' + \mu + \mu' + \nu + \nu') = \frac{1}{2} を引けば (2) が示せる.

(1)との同値性はそのうち示す. \square

定理の証明


補題を証明した後,示したかった定理を示す.

補題
 
\displaystyle \qquad  x = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu'& ;t \\
\lambda & \mu & \nu & 
\end{matrix}
\right\}
のとき、

\displaystyle \qquad  x' = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu' + 1& ;t \\
\lambda - 1 & \mu -1 & \nu + 1 & 
\end{matrix}
\right\}
となる.

証明.定数をおき直して,超幾何方程式の定数の取り方
 
\displaystyle \qquad  x = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \alpha& ;t \\
1-\gamma & \gamma - \alpha -\beta & \beta & 
\end{matrix}
\right\}
に対して証明する.このときの方程式は

\displaystyle
\qquad 
  t(1-t) x'' + \left\{ \gamma - ( \alpha + \beta + 1) t \right\} x' - \alpha \beta x= 0
である.これを微分すると,

\displaystyle
\qquad 
  t(1-t) x''' + \left\{ (1+\gamma) - [ \alpha+1 + \beta+1 + 1] t \right\} x'' - (\alpha+1) (\beta+1) x' = 0
となる.よって,
 
\displaystyle \qquad  x' = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \alpha + 1& ;t \\
 - \gamma & \gamma - \alpha -\beta - 1& \beta + 1& 
\end{matrix}
\right\}
となる. \square


補題

\displaystyle
\qquad 
\wp 
\left\{
\begin{matrix}
 a & b & \infty & \\
0 & 0 & 0& ;t \\
 \lambda & \mu& \nu& 
\end{matrix}
\right\}
=
\left\{ C_1 + C_2 \int^t  (s-a)^{\lambda - 1} (s-b)^{\mu - 1} ds \mid C_1, C_2 \in \mathbb{C} \right\}

証明.
\displaystyle
\qquad 
\wp 
\left\{
\begin{matrix}
 a & b & \infty & \\
0 & 0 & 0& ;t \\
 \lambda & \mu& \nu& 
\end{matrix}
\right\}
の満たす方程式は

\displaystyle 
\qquad
 x'' = \frac{ - ( \lambda - 1)b - ( \mu - 1) a - ( \nu + 1) t}{(t-a) (t - b)} x'
である.書き換えると

\displaystyle 
\qquad
 \frac{1}{x'} x'' = \frac{\lambda - 1}{t-a} + \frac{\mu - 1}{t-b}
となる.積分すると

\displaystyle
\qquad
\log x' = \log C_2 (t-a)^{\lambda - 1} (t-b)^{\mu - 1}
となるので、

\displaystyle
\qquad
 x' =  C_2 (t-a)^{\lambda - 1} (t-b)^{\mu - 1}
であり,積分すると

\displaystyle
\qquad
 x =  C_1 + C_2 \int^t (s-a)^{\lambda - 1} (s-b)^{\mu - 1} ds
となる. \square


(定理)
 \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく. \pm \alpha \pm \beta \pm \gamma の 1 つが奇数ならば

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
は初等関数とその積分を使って書ける.

証明.変数変換  \tau = (t-a)/(b-a) により特異点 0 1 になるので,

\displaystyle
\qquad
( t - a)^{-\lambda} (t-b)^{-\mu} \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\} \\
= \wp \left\{
\begin{matrix}
a & b & \infty & \\
0 & 0 & \nu + \lambda + \mu &; t \\
\lambda' - \lambda & \mu' - \mu  & \nu' + \lambda + \mu & 
\end{matrix}
\right\} \\
= \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu + \lambda + \mu &; \tau \\
\lambda' - \lambda & \mu' - \mu  & \nu' + \lambda + \mu & 
\end{matrix}
\right\}
となる.よって,

\qquad
\displaystyle
y(\tau) = \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu + \lambda + \mu &; \tau \\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \mu & 
\end{matrix}
\right\} 
=
\wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \rho &; \tau \\
\alpha & \beta& \gamma + \rho & 
\end{matrix}
\right\}, \\
\qquad \rho = \frac{1}{2} ( 1 - \alpha - \beta - \gamma)
が解ければよい.仮定により, \alpha + \beta + \gamma = 2n + 1, n \geq 0 としてよい.よって,

\displaystyle
\qquad  y = \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & -n &; \tau \\
\alpha & \beta& \gamma - n & 
\end{matrix}
\right\}
となり,補題により  n微分すれば,

\displaystyle
\qquad
y^{(n)} (\tau)=  \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & 0&; \tau \\
\alpha - n & \beta - n& \gamma & 
\end{matrix}
\right\}
=
C_1 + C_2 \int^\tau s^{\alpha - n - 1} (s - 1)^{\beta - n -1} ds
となるから,これを積分することで,y は初等関数の積分で書くことができる.以上より,

\qquad \displaystyle
x = ( t - a)^{\lambda} (t-b)^{\mu} y\left( \frac{t - a}{a - b} \right)
と書くことができる. \square


最後に注意として, C_1 + C_2 \int^t s^{\alpha - n - 1} (s - 1)^{\beta - n -1} ds n積分の全てが  y ではないことに注意する.実際, n積分すると積分定数が合計  n + 2 個出てきてしまい,それらが一次独立であれば  y2 階の微分方程式の解であることに矛盾する.ここで言っているのはあくまで  y が少なくとも  C_1 + C_2 \int^t s^{\alpha - n - 1} (s - 1)^{\beta - n -1} dsn積分として書けるということだけである.

なぜ素イデアルを点と見るのか

代数幾何について最近ちょっとしっくりきたのでまとめておきます.タイトルでは素イデアルを挙げていますが,そこに至るまでを詳しく書きます.いろんな説明の仕方があると思いますが,幅広く議論する気はありません.アファインの場合だけを考えますし層の議論が出てこないような話を書きます.普通スキームと呼ばれるものを多様体と呼んでしまっているのでご注意ください.

この記事では, k は体を表します.また,環とは  1 を持つ可換環とします.記法として,列  (a_1, \dots, a_n) \bar{a} と表します.よって,多変数多項式環 k[\bar{X}] と表します. k 代数を考えるとき, k代数的閉体の場合を考えることが多いですが,そうでない場合も出てくるので, k の仮定はできるだけその都度書きます.調べればすぐにわかる用語は説明していないことがあります.
(もう少し証明を書き加える予定)

参考文献.問題意識は以下の微分ガロア理論の本の付録に基づいている.
van der Put, Singer, "Galois Theory of Linear Differential Equations"
また,
西宮正宣,『代数学2 -発展編-』
も参考にしている.
代数や環については以下を参考にしている.
堀田良之,『可換環と体』
Milne, "Commutative Algebra"

全体像

この記事では以下の表が成り立つような描像を目指していく.

座標環
 k[\bar{X}]  {k}^N の元
有限生成  k 代数 極大イデアル
 k 代数 イデアル

結論を言えば、上の表の上から下に進むにあたって、一般に環を考えるとき,普通は有限生成ではないので素イデアルを点と考える必要があるということ.

多変数多項式の場合


 k [X_1, \dots, X_N] = k [ \bar{X} ] の場合を復習する.代数幾何学とは多項式の零点を考える学問である. k [ \bar{X} ] イデアル  I に対して,その零点の集まりを  \mathcal{V} (I) と表す:

\qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid \forall f \in I, \, f(\bar{a} ) = 0\}
 V代数的集合であるとは,あるイデアル  I を用いて  V = \mathcal{V} (I) と書けるものをいう.つまり,代数的集合が代数幾何学の対象である.代数的集合の集まりは  k^N の位相を定めることが知られている.定まる位相はZariski位相と呼ばれる.つまり以下が成り立つ.

命題( k^N のZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = k^N ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )


ある幾何学的対象があるとき,その上の関数を考えるというのは重要である.例えば,微積分学は  \mathcal{R}^N 上の滑らかな関数や解析関数を考える.代数幾何は代数的な考察を行うので, k^N 上では単に多項式環  k[\bar{X}] を考えればよい.では,代数的集合上の関数はどのように定めればいいのか?  V \subset k^N を代数的集合とは限らない部分集合とする.多項式  f \in k[\bar{X} はもちろん  V の関数を定めるが,定義域  V が小さい時には  V の外の  f の値は関係ないので k[ \bar{X} ] は大きすぎるように思える.以下のように多項式の集合  \mathcal{I} (V) を定める:

\qquad \displaystyle \mathcal{I} (V) := \{ f \in k[ \bar{X} ] \mid \forall \bar{a} \in V, \, f( \bar{a} ) = 0 \}
この  \mathcal{I} (V)イデアルとなる.すると以下の命題が成り立つ.

命題
 V \subset k^N とする. f, g \in k [\bar{X} ] に対して以下が同値である.

(i)  f, g V 上の関数として同じ.つまり,全ての  \bar{a} \in V f(\bar{a} ) = g(\bar{a} );

(ii)  f - g \in \mathcal{I} (V)

つまり, V 上の関数は  k [\bar{X} ] の元を  \mathcal{I} (V) で同一視した  k [ \bar{X} ] /\mathcal{I} (V) であるということが分かった. k [ \bar{X} ] / \mathcal{I} (V)  V座標環という.


Zariski位相は非常に粗いことが特徴的である. V \subset k^n既約であるとは,閉集合  U_1, U_2 を用いて  V = U_1 \cup U_2 と書けるなら  V = U_1 または  V = U_2 が成り立つことをいう.つまり,既約とは(共通部分を持っていてもよい)二つの閉集合に分解できないことをいう.こんなことはユークリッド空間の普通の位相ではほとんど起こらず役に立つ概念ではないが,Zariski位相が粗いために便利な概念である.


以上のことをまとめると,イデアル  I多項式の集まり)から代数的集合  \mathcal{V} (I) が定まった.一方,点の集まり V からはイデアル  \mathcal{I} (V) が定まる.このように,環のイデアルと点の集まりが対応している.実はこの対応により,イデアルと図形の性質が対応する.

定理

 \mathcal{V} \colon \{ k [\bar{X}] \text{のイデアル} \} \to \{ k^N \text{の部分集合} \}  \mathcal{I} \colon \{ k^N \mathrm{の部分集合} \}  \to \{ k [\bar{X}] \text{のイデアル}  \} に対して以下が成り立つ.

(i)  V \subset k^Nに対して, \mathcal{I} (V) は根基イデアルであり, V \subset \mathcal{V} (\mathcal{I} (V) )
イデアル  I \in k[\bar{X} ] に対して, \mathcal{V} (I) は代数的集合であり,  I \subset \mathcal{I} ( \mathcal{V} (I) );

(ii)  V が代数的集合ならば  V = \mathcal{V} (\mathcal{I} (V) ) であり, I が根基イデアルならば  I = \mathcal{I} ( \mathcal{V} (I) ).つまり,代数的集合と根基イデアル \mathcal{V}, \mathcal{I} により一対一に対応する.

(iii) 代数的集合  V が既約であることと,対応する根基イデアル  \mathcal{I} (V) が素イデアルであることは同値.

(iv)  k代数的閉体と仮定する.このとき,代数的集合  V が一点  V = \{ \bar{a} \} であることと,対応する根基イデアル  \mathcal{I} (V) が極大イデアルであることは同値.

この定理について補足.(i)の部分集合の関係式は  \mathcal{V}, \mathcal{I}ガロア接続を定めることを意味している.(iv) において特に極大イデアル  m \bar{a} \in k^N を用いて
 
\qquad m = (X_1 - a_1, \dots, X_N - a_N)
と書けることも分かる.この形のイデアル m_a := (X_1 - a_1, \dots, X_N - a_N) と表すこととする. k代数的閉体でなくても  m_a の形のイデアルは極大イデアルであり,対応する代数的集合  \mathcal{V} (m_a) は一点集合である.なので (iv) の主張は k代数的閉体ならば,極大イデアルが必ず  m_a の形に書けるということである.この主張はヒルベルトの零点定理の弱形と呼ばれる.


有限生成代数と極大イデアル

代数的閉体でない場合


目標では次に有限生成代数に行きたいところではあるが,極大イデアルを点と見る理由を十分に理解するために, k代数的閉体でない場合の多項式環  k[ \bar{X}] を考える.


前節の最後の定理の(iv)から, k代数的閉体の場合は点と極大イデアルは同一視して良い.一方,前節の最後に述べたことは, k代数的閉体の場合には素朴な点  \bar{a} は極大イデアル  m_a に対応するが,任意の極大イデアルは点に対応するとは限らない.つまり,極大イデアルの方が多いので,素朴な点  \bar{a} にこだわらず,極大イデアル自体を"点"と見た方がいいことが示唆される.


(補足.何を言っていいるかというと,「図形と代数の対応」がうまくいくには図形の点の定義を変えるということである. k代数的閉体の場合には実際に極大イデアルと点が対応するので,一般化して極大イデアルも点だと思おうとする,すると図形と代数が対応する, ということである.極大イデアルを点と呼ぶ「点らしさ」は「図形と代数の対応」を信じていることから来ているのであり,素朴な図形観に訴えかけるものではないと思う.だから,この分野に詳しくない人に向かって「数学者は極大イデアルを点と思う」と言ってしまうと,(詳しく説明しない限り)そこでいう"点"概念が代数幾何学者とそれ以外の人で大きくズレているためミスリーディングだと思う.*1


極大イデアルを点と考えることの意味を考える.可換環  R の極大イデアル \mathrm{mSpec} R と表す. k代数的閉体でなくても, k^N \subset \mathrm{mSpec} (k [\bar{X} ]) と考えることができるのであった.一方,任意の  \bar{a} \in \bar{k}^N に対して, \bar{X} \mapsto \bar{a} とする写像  \phi_{\bar{a}} \colon k [ \bar{X} ] \to \bar{k} を考えると,準同型定理より  k [ \bar{X} ]/ \mathrm{ker} \phi_{\bar{a}} \simeq \bar{k} となる.よって, \mathrm{ker} \phi_{\bar{a}} は極大イデアルである.よって写像  \tau \colon k^N \to \mathrm{mSpec} (k[ \bar{X} ] ) \colon \bar{a} \mapsto \mathrm{ker} \phi_{\bar{a} } を得る.この  \tau全射である.(なぜなら, m \in \mathrm{mSpec} (k[ \bar{X} ]  \bar{k} [ \bar{X} ] でのイデアルと考えれば,ある  \bar{a} \in \bar{k}^N m \subset \mathrm{ker} \phi_{\bar{a}} が分かる.極大性より  m = \mathrm{ker} \phi_{\bar{a}} となる. )つまり, \mathrm{mSpec} (k[ \bar{X} ] ) \subset \bar{k}^N と考えても良い.つまり,以上より, k^N \subset \mathrm{mSpec} (k[ \bar{X} ] ) \subset \bar{k}^N と考えられ,極大イデアルを点と見ても少なくとも  \bar{k}^N の元(と見ることはできる)ということが分かる.


これは一変数の場合でみるともっと分かりやすい. k \subset \mathrm{mSpec} (k[ X ] ) \subset \bar{k} の解釈として, k[X ]の元は  k に零点を持つとは限らないが  \mathrm{mSpec} (k[ X ] ) には零点を持つ.つまり,全ての多項式が零点を持つように空間を広げたものが   \mathrm{mSpec} (k[ X ] ) である.ちなみに,零点を持つだけでなく体になるようにしたものが  \bar{k} である.例えば,多項式  X^2 + 1 \in \mathbb{Q} [ X ]  \mathbb{Q} に零点を持たないが,極大イデアル  (X^2 + 1) \in \mathrm{mSpec} ( \mathbb{Q} [ X ] ) が"零点"になる. X^2 + 1 \bar{k} には  2 つ零点  \sqrt{-1}, -\sqrt{-1} があるので,代数的閉体における零点と極大イデアルが対応しているわけではない.(つまり, \tau^{-1} (m) には本当の零点がたくさん入っていることがある.)被約の仮定は別の場所でも重要になってくるが,被約だと思って読み進めよ.

有限生成代数の場合


問題を元に戻して,多項式環  k [\bar{X} ] ではなく一般化して有限生成  k 代数  A を考えることにする.


一般化してはいるが,それほど奇妙なものではなく,実はすでに出てきたものである.有限生成という仮定により有限個の元  f_1, \dots, f_N \in A が存在して  A = k [f_1, \dots, f_N ] と書ける.多項式環からの全射  \phi \colon k [ \bar{X} ] \to A \colon X_i \to f_i を考えることにより, A \simeq k [ \bar{X} ] / \mathrm{ker} \phi となる. I = \mathrm{ker} \phi とおけば, A多項式環イデアルで割ったものということである.特に, A が被約の場合には  I は根基イデアルとなり, A \mathcal{V} (I) の座標環である.さらに言えば, A が被約のときには, A は代数的集合  \mathcal{V} (I) と同一視して良い.


つまり,(被約)有限生成  k 代数  A とは  k[\bar{X} ] の代数的集合なのであるが,  k[\bar{X} ] の極大イデアルを点と見たように, A の点も  A の極大イデアルとして定義する. A の点を  \mathrm{mSpec} A としたときに,その位相をどのように定めればいいか?それを考えるために多項式環の場合を思い出す.多項式環では,代数的集合

\qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid \forall f \in I , \, f(\bar{a} ) = 0\}
の集まりで位相を定めるのであった.ここで, \bar{a} が定める極大イデアル  m_{\bar{a}} = (X_1 - a_1, \dots, X_N - a_N ) を用いれば,

\displaystyle \qquad f(\bar{a}) = 0 \Leftrightarrow f \in m_{\bar{a}}
となる.よって代数的集合の定義は

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid  I \subset m_a \}
と書ける.点と極大イデアルが対応しているので,極大イデアルの空間  \mathrm{mSpec} A の代数的集合も全く同様に

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ m \in \mathrm{mSpec} A \mid  I \subset m \}
と定義すればよい.もちろんこれで位相が定まる.  \mathrm{mSpec} Aアファイン代数多様体と呼ぶことにする.

命題( \mathrm{mSpec} AのZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = \mathrm{mSpec} A ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )

多項式環の場合と同様に考えれば,部分集合  V \subset \mathrm{mSpec} A に対してイデアルを定める写像  \mathcal{I} も考えるべきであろう:

\displaystyle \qquad \mathcal{I} (V) := \{ f \in A \mid \forall m \in V, \, f \in m \} = \bigcap_{m \in V} m


もう少し考察に進む前に,有限生成代数に対して成り立ついくつかの定理を復習する.

定理
 R_1 \subset R_2 は環の拡大で  R_2 が整域とする.このとき,R_2R_1 上整ならば, R_1 が体であることと  R_2 が体であることは同値.

証明は意外と簡単にできる.

定理(Zariskiの補題
 k \subset K を体の拡大とする.
このとき,K k 上有限生成ならば,K k 上代数的である.


 k \subset K を体の拡大とする. A k 代数で  K \subset A とする.
このとき, A が有限生成  k 代数ならば, K k 上代数的である.

証明. m \in \mathrm{mSpec} A とすると, K は逆元を持たないから  m \cap K = \emptyset であり  k \subset K \subset A/m となる. A/m k 上有限生成なのでZariskiの補題により A/m の元は代数的.よって,K の元も代数的. \square

定理(ヒルベルトの零点定理)
 A が有限生成 k 代数のとき,

\displaystyle \qquad \sqrt{ (I) } = \bigcup_{I \subset m \in \mathrm{mSpec} (A) } m
となる.特に, A が被約ならば,
 
\displaystyle \qquad \bigcup_{m \in \mathrm{mSpec} (A) } m = \sqrt{ (0) } = 0
である.

ヒルベルトの零点定理の意味を考える.イデアル  I に対して, \mathcal{I} (\mathcal{V} (I) ) を考えると
 \displaystyle
\qquad \mathcal{I} (\mathcal{V} (I) ) = \bigcap_{m \in \mathcal{V} (I) } m = \bigcap_{I \subset m \in \mathrm{mSpec} (A) } m
となるので, A が有限生成のときには,

\qquad \displaystyle \sqrt{ (I) } = \mathcal{I} (\mathcal{V} (I) )
となる.これがヒルベルトの零点定理の意味である.

準同型写像と射


幾何と代数が対応していると思えるためには,単に代数から幾何学的対象が定まるだけでなく,代数間の準同型写像から幾何学的対象の射が対応していなければならない.


 k 代数 A, B の間の準同型写像  \phi \colon A \to B があったとする.このとき,有限生成代数の間の準同型写像であれば,連続写像  \phi^* \colon \mathrm{mSpec} B \to \mathrm{mSpec} A \phi^* (m) = \phi^{-1} (m) と定義できる.これが有限生成を仮定する理由である.

命題
 k 代数 A, B準同型写像  \phi \colon A \to B 考える.B k 上有限生成のとき, m \in \mathrm{mSpec} B の引き戻し  \phi^{-1} (m) A の極大イデアルである.

証明.Bk 上有限生成なので, B/mk 上有限である.よって, \pi \colon B \to B/m とおいて, \pi \circ \phi \colon A \to B/m の像は  k 上有限であり体である.つまり, A/ \mathrm{ker} (\pi \circ \phi) \simeq A / \phi^{-1} (m) は体である.よって, \phi^{-1} (m) は極大イデアルである.

次に,この  \phi^*連続写像であることを見る.まず,位相的な準備をする. f \in A に対して開集合  D (f) := \mathrm{mSpec} (A) \setminus \mathcal{V} ( (f) ) = \{ m \in \mathrm{mSpec} (A)  \mid f \notin m\} が定まる.有限生成 k 代数  Aネーター環なので,任意のイデアル  I は有限生成である.すると開集合  Z = \mathrm{mSpec} (A) \setminus \mathcal{V} (I)

\displaystyle \qquad Z = D(f_1) \cup \dots \cup D (f_N)
と書ける.つまり,開集合は  D(f) の形の開集合の有限和で書くことができる.つまり, D(f) の集まりがZariski位相の基本開集合となっている. \phi \colon A \to B f \in B に対して,

\displaystyle \qquad (\phi^* )^{-1} ( D(f) ) = \{ m \in \mathrm{mSpec} (B) \mid \phi^* (m) \in D(f) \} \\
\qquad \qquad \qquad \, =  \{ m \in \mathrm{mSpec} (B) \mid f \notin \phi^{-1} (m)  \} \\
\qquad \qquad  \qquad \,=  \{ m \in \mathrm{mSpec} (B) \mid \phi( f) \notin (m)  \} \\
\qquad \qquad  \qquad \,= D (\phi (f))
となる.つまり, \phi^* は開集合の引き戻しを開集合に写すので連続写像である. \square


よって,有限生成代数とその間の準同型写像から,アファイン代数多様体とその間の連続写像を得ることができた.逆にアファイン代数多様体やその連続写像から有限生成代数と準同型写像が得られるなら完璧であるが実はこれは難しい.それを行うには層の議論が必要になる.層の議論をやるのは大変なので,ずいぶん簡単な状況を考えることでその逆操作のギャップがどこにあるかを見る.


まず,有限生成代数をアファイン代数多様体上の関数と見る方法を考える.有限生成代数  A に対して, X = \mathrm{mSpec} A とおく. f \in A を固定すると, m \in X に対して [ f ]_m \in A/m が対応づけられる. k代数的閉体の場合は  A/m \simeq k なので, X から  k への写像  \mathrm{map} (f) \colon X \to k が定義できる.のちの議論で必要になるので,細かい注意をすると, f(m) = a \in k というのは  f - a \cdot 1_A \in m ということである.次に, f, g\in A \mathrm{map} (f) = \mathrm{map} (g) とする.つまり,任意の  m \in X に対して  [f]_m = [g]_m とする.これは  f - g \in m なので, f - g \in \bigcap_{m \in X} m ということである.A が被約とすると, \bigcap_{m \in X} m = \sqrt{ (0) } = 0 なので, f = g となる.つまり, X から  k への写像の集合を  O(X) と表すと  \mathrm{map} \colon A \to O(X)単射である.つまり,A の元は写像として同じなら  A の元としても同じである.


以上のことをまとめると, k代数的閉体の時には  A X から  k への関数を定義し,A が被約ならその関数としての性質が A の元を特徴付ける.つまり,k代数的閉体かつ A が被約の時に, AO(X) の部分集合と見ることができる.逆に O(X) の元  \alpha A であるとは,ある  f \in A が存在して, \mathrm{map} (f) = \alpha となることとである.この準備の元で,アファイン多様体の間の射が代数の準同型写像を与えるための条件は以下のように与えられる.

命題
 k代数的閉体 A, B を被約な有限生成 k 代数とする.連続写像  \psi \colon \mathrm{mSpec} A \to \mathrm{mSpec} B に対して,以下が同値:

(i) ある  k 準同型  \phi\colon B \to A が存在して, \psi = \phi^* が成り立っている.

(ii) 任意の  g \in B に対して,関数  \mathrm{map} (g) \circ \psi \colon \mathrm{mSpec} A \to \mathrm{mSpec} B \to k A の元である.

証明.【(i)ならば (ii) の証明】. \psi (g) \in A なので  \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( \psi (g) ) を示せばよい.任意の  m \in \mathrm{mSpec} A に対して,
 \displaystyle
\qquad  \mathrm{map} (g) \circ \psi (m) = \mathrm{map} (g) (\psi (m) ) \\
\qquad \qquad  \qquad = [g ]_{\psi (m)} \\
\qquad \qquad \qquad = [g ]_{\psi^{-1} (m) } \\
ここで, [ g ]_{\psi^{-1} (m)} = a \in k とは  g - a\cdot 1_B \in \psi^{-1} (m) ということであり,これは  \psi (g) - a \cdot 1_A \in m を意味する.つまり, [ \psi (g) ]_m = a である.よって,
 \displaystyle
\qquad  \mathrm{map} (g) \circ \psi (m) = [ \psi (g) ]_m = \mathrm{map} (\psi (g) ) (m)
となる.以上より, \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( \psi (g) ) である.
【(ii)ならば(i)の証明】.仮定により任意の g \in B に対して,ある  f_g \in A が存在して, \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( f_g ) と書ける.この  f_g は一意である.実際,  \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( f_g' ) となる  f_g' もあったとしても, A O(X) の元として見ることができるので,  \mathrm{map} ( f_g ) = \mathrm{map} ( f_g' ) より  f_g = f'_g である.そこで  \psi \colon B \to A \psi (g) = f_g と定める.
 \psi が準同型であること)

 \displaystyle \qquad \mathrm{map}( \phi (a g + a ' g') ) (m)  = [a g + a' g' ]_{\psi (m)}  \\
\qquad \qquad \qquad \qquad \qquad= a [g ]_{\psi (m) } + a' [g' ]_{\psi (m)}  \\
\qquad \qquad \qquad \qquad \qquad=  (a \mathrm{map} (g)  + a' \mathrm{map} ( g' )  ) (m) \\
\qquad \qquad \qquad \qquad \qquad= \mathrm{map} ( a \phi (g) + a' \phi (g') ) (m)
より, \displaystyle \phi (a g + a' g' ) = a \phi (g) + a' \phi (g') となる.
同様に,

 \displaystyle \qquad \mathrm{map}( \phi (g g') ) (m)  =  \mathrm{map} (g g' ) \circ \psi (m) \\
\qquad \qquad \qquad \qquad  =  [g g']_{\psi (m)}  \\
\qquad \qquad \qquad \qquad =  [g]_{\psi (m)}  [g']_{\psi (m)}  \\
\qquad \qquad \qquad \qquad =  \mathrm{map} (\phi ( g) ) (m) \cdot \mathrm{map} (  \phi (g') ) (m)  \\
\qquad \qquad \qquad \qquad =  \mathrm{map} (\phi ( g)  \phi (g') ) (m)
より, \displaystyle \phi (g g') = \phi ( g)  \phi (g') となる.
 \phi = \psi^* となること)
全ての  m \in \mathrm{mSpec} A に対して  \psi (m) = \phi^{-1} (m) を示せばよい.
 \displaystyle
\qquad g \in \psi (m) \Leftrightarrow [g ]_{\phi (m) } = 0 \Leftrightarrow [\phi (g) ]_m = 0 \Leftrightarrow \phi (g) \in m \Rightarrow b \in \phi^{-1} (m)
よって, \psi (m) \subset \phi^{-1} (m) \psi (m) は極大イデアルなので, \psi (m) = \phi^{-1} (m) \square


まとめると,代数の議論(代数とその間の準同型写像)はアファイン多様体の議論(アファイン多様体とその間の連続写像)に写すことができるが,アファイン多様体の議論が代数の議論に写すことができるとは限らない.なので,アファイン多様体とその間の射にさらなる情報を加えたものを考えていくことが本当は必要であるが,少なくとも,代数の議論がアファイン多様体の議論に写すことができるという事実が成り立つことが全ての出発点になっている.

有限生成でない代数と素イデアル

有限生成でない場合


さて,有限生成でない代数の場合を考えよう.有限生成でない場合にはの,今の定義では,代数の議論がアファイン多様体の議論に写すことができない.つまり, \phi \colon A \to B m \in  \mathrm{mSpec} (B) に対して, \phi^{-1} (m) A の極大イデアルになるとは限らない.実際,単射  \iota \colon \mathbb{Z} \to \mathbb{Q} を考えたとき,\mathbb{Q} の極大イデアル (0) のみであるが,その引き戻しは  \iota^{-1} ( (0) ) = (0)  \mathbb{Z} では極大ではない.


そこで,代数の議論がアファイン多様体の議論に写るように,アファイン多様体の点の定義を変更する.つまり,極大イデアルではなく素イデアルを点と考えることにする.可換環  R に対して,その素イデアルの集まりを  \mathrm{Spec} R で表すことにする.すると,準同型写像  \phi \colon A \to B と素イデアル  m \in  \mathrm{Spec} (B) に対して, \phi^{-1} (m) A の素イデアルになることが確認できる.

命題
 A, B k 代数とする.準同型写像  \phi \colon A \to B と素イデアル  m \in  \mathrm{Spec} (B)に対して, \phi^{-1} (m) A の素イデアル

証明. B/m は整域である.よって, \pi \colon B \to B/m とおいて, \pi \circ \phi \colon A \to B/m の像は整域である.つまり, A/ \mathrm{ker} (\pi \circ \phi) \simeq A / \phi^{-1} (m) は整域である.よって, \phi^{-1} (m) A の素イデアルである. \square

実はすでにこの事実を使っている場所が一箇所あるのだが流れを重視してこの事実を説明していなかった.ともかく,  \mathrm{Spec} A を点と考えれば,代数の議論を多様体の議論に持っていけそうだ.  \mathrm{Spec} A の位相の定義は  \mathrm{mSpec} A の場合と全く同じである. Aイデアルに対して,代数的集合を

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ m \in \mathrm{Spec} A \mid  I \subset m \}
と定義すればよい.もちろんこれで位相が定まる.ここからは  \mathrm{Spec} Aアファイン代数多様体と呼ぶことにする.

命題( \mathrm{Spec} AのZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = \mathrm{Spec} A ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )

こうすれば状況は極大イデアルの場合と全く同じになる.

命題
 k 代数 A, B準同型写像  \phi \colon A \to B 考える. \phi^* \colon \mathrm{Spec B} \to \mathrm{Spec} A連続写像である.


このように,代数の議論をアファイン多様体の議論に持っていくためには,点は極大イデアルではなく素イデアルにする必要がある.これが,素イデアルを点と考える理由(の一つ)である.


ここで,素朴な点の代わりに極大イデアルを点と考えたときと一般化の仕方が違うことに注意しよう.例えば,多項式環  k [ \bar{X} ] では, k^N \subset \mathrm{mSpec} ( k [ \bar{X} ] ) \subset \bar{k}^N であり,特に  k代数的閉体の場合には点と極大イデアルが完全に一致したのであった.しかし,多項式環のところで述べたとおり,素イデアルに対応するのは既約な代数多様体である.つまり,素イデアルを点とみるのは,素朴な点に限らず点の集まりがなす図形をも"点"だと思うということである.特に,k代数的閉体であっても  \mathrm{Spec} A k^N よりも真に大きいものになる.素朴な点はいつでも既約なので,その意味では素イデアルは確かに一般化になっているのであるが,極大イデアルを点と思うときとは違い,素朴な点と素イデアルは一致しないのである.

イデアル空間の中での極大イデアル


これでこの記事の目標は達成されたのではあるが,最後に素イデアルを点と見たときの極大イデアルの意味を考えることにする.

命題
 A を有限生成 k 代数とする*2. このとき,位相空間 X の開集合のなす集合を  \mathcal{O} (X) と表すとき,写像
 \displaystyle
\qquad \tau \colon \mathcal{O} (\mathrm{Spec (A)} ) \to  \mathcal{O} (\mathrm{mSpec (A)} ) \colon U \to U \cap \mathrm{mSpec} (A)
全単射である.つまり, \mathrm{Spec (A)} の位相は  \mathrm{mSpec (A)} の位相で復元できる.

証明.  \square

証明はしないが,アファイン多様体とその間の射をちゃんと定義した k 上のアファインスキーム を使えば, k 代数の圏 ( k-alg) と k 上のスキームの圏 (Aff.Sch / k ) は双対圏である.

定理
( k-alg) と (Aff.Sch / k ) は双対圏である.特に,射の同型
 
\qquad \mathrm{Hom}_{k- \mathrm{alg} } (A, B) \simeq \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} B, \mathrm{Spec} A)
が存在する.

命題
 k代数的閉体とし, A を有限生成  k 代数とする.写像

\qquad \displaystyle \sigma \colon \mathrm{Hom}_{k-\mathrm{alg}} (A, k) \to \mathrm{mSpec} (A) \colon \alpha \to \mathrm{Ker} \alpha
全単射である.

証明.(単射性) \alpha \in \mathrm{Hom}_{k-\mathrm{alg}} (A, k) は前者なので, A / \mathrm{Ker} \alpha \simeq k となり  M := \mathrm{Ker} \alpha は極大イデアルである. f \in A とし, [f ]_M = a \in k とすると, f - a\cdot 1 \in M であり, \alpha を作用させれば, \alpha(f) = a が分かる.よって, \alpha(f) = [f ]_M である.これにより, \tau(\alpha) = \tau (\beta), つまり, \mathrm{Ker} \alpha = \mathrm{Ker} \beta = M ならば,任意の  f \in A \alpha (f) = \beta (f) となる.つまり, \alpha = \beta

全射性) M \in \mathrm{mSpec} A とする. R/M \simeq k より 写像  \alpha \colon R \to k が得られる.よって  \sigma全射である.  \square

この定理と命題により, k代数的閉体かつ A が有限生成であれば,

\qquad \displaystyle \mathrm{mSpec} A \simeq  \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} k, \mathrm{Spec} A)
が成り立つ.右辺は素イデアルで幾何を考えたときの射であり,このように素イデアルで考えても極大イデアルが復元できる.ここで  k を一般化することで他の視点で点を定義できる.

定義
k 代数 Ak 代数  R に対して,多様体 X = \mathrm{Spec} A  R X (R)

\qquad \displaystyle X (R) := \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} R, \mathrm{Spec} A) \simeq \mathrm{Hom}_{k-\mathrm{alg}} (A, R)
で定める.

上で述べたことは, X(k) \simeq \mathrm{mSpec} A と書くことができる.


最後に  k代数的閉体でないときの  R 点を具体例で見てみる.

 k = \mathbb{Q} として, k 代数  A = \mathbb{Q} [X] / (X^2 + 1) を考える. X = \mathrm{Spec} A とする. X( \mathbb{Q} ), X(\mathbb{R} )空集合である.なぜなら, \alpha \in X( \mathbb{Q} ) = \mathrm{Hom}_{k-\mathrm{alg}} (A, \mathbb{Q}) (または  X(\mathbb{R} ))とすると, X^2 + 1 = 0 より  \alpha(X)^2 + 1 = 0 となるが, \mathbb{Q}(または  \mathbb{R})にはそのような \alpha(X) が存在しない.一方, \alpha (X) = \sqrt{-1}, -\sqrt{-1} と定めればそのような準同型写像が存在するので  X (\mathbb{C}) 2 つの元を持つ.
(補足.体の素イデアル (0) だけなので, \mathrm{Spec} \mathbb{C} から  \mathrm{Spec} ( \mathbb{Q} [X] / (X^2 + 1) ) への連続写像 1 つだけであり,   \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} R, \mathrm{Spec} A) の元が  2 つというのは奇妙に思われるかもしれない.ここがちゃんと言っていないところで,多様体間の射は連続写像と空間の上の環の準同型写像のペアだからである.連続写像だけではだめな( \mathrm{Hom}_{k- \mathrm{alg} } (A, B) \simeq \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} B, \mathrm{Spec} A) が成り立たない )ことはこの例からも分かる.)

この記事を書いて思ったこと

ある程度目処をつけてからこの記事を書いたんだけども,書きながら色々気がついたことがあった.可換環 k 代数の違い,もっと言えば  k 代数の良さである. k 代数 A を考えているとき,体 k がその中に常に入っている.体は(環と比べれば) 単純なので,その内部の単純さが  A の性質に反映させることができる.有限生成の時には如実にそういう考え方が生きていた.では有限生成でない場合にはどうなのかという話があるが,有限生成でない代数の良さは今回は現れなかった.あと,今回の問題意識での層の価値(コホモロジーとかは置いといて)が分かってなかったけど,ちょっと分かってきた.これについてはまた記事を書くかもしれない.

*1:この点をちゃんと説明している記述が『プリンストン数学大全』のエレンバーグによる「数論幾何学」の項目にあったので引用しておこう。話のレベルがここでの話と少しズレがあるが私が文句言っている点についてちゃんと説明している。"(すべてではないが)いくつかの環が幾何的対象(多様体)から生じることが分かっている.そして,これらの多様体は,これらの特別な環の代数的な性質により記述できることが知っている.では単に,すべての環 RR の代数的性質で定まる幾何学を持つ「幾何的対象」であると考えればよいのではないだろうか?"

*2:有限生成でなくてもジャコブソン環であれば良い

単独高階微分方程式の連立一階微分方程式への変形について


単独高階線形微分方程式を一階の連立微分方程式に変形する方法は有名です.一方,逆に連立方程式を単独高階方程式に直せることが知られています.この事実は時々説明されることはあるものの証明が書かれていることはほとんどないです.


そこで巡回ベクトルを用いた証明のpdfを書きました.証明には微分加群を用いています.微分加群圏論的に微分ガロア理論を捉える時の基本的な対象でもあります.

drive.google.com