記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

一般化戸田方程式について

積分な方程式のとして重要な戸田格子には様々な一般化があります.戸田格子の背後にある半単純リー代数の構造に着目し,戸田格子に類似する可積分微分方程式を得る方法を紹介します.この視点に立てば,通常の戸田格子はA_n型の半単純リー代数に対応するものであると捉え直すことができます.

この記事ではハミルトン系とリー代数の定義は既知とします.(性質は記事の中で復習する.)

戸田格子

線形バネの格子


戸田格子のモチベーションを説明するために,まずは簡単な線形バネの場合から説明を始めます.


バネでつながれた  n 個の質点を考えます.

f:id:tetobourbaki:20190812172123j:plain
バネでつながれた円周上の質点
質点は円状に配置されていて,隣り合う質点同士がバネでつながれているとします.バネ定数を  k とするとハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n-1} \frac{k}{2} (q_j - q_{j+1})^2 + \frac{k}{2} (q_n - q_1)^2
となります.記述を簡単にするために, q_{n+1} := q_1, q_0 := q_n と書くことにします.するとハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n} \frac{k}{2} (q_j - q_{j+1})^2
と書き直すことができます.このとき,ハミルトン系は

\displaystyle\qquad \frac{d q_j}{d t} = p_j \\
\displaystyle \qquad \frac{d p_j}{d t} = -k (q_j - q_{j+1}) + k(q_{j-1} - q_j) = k (  q_{j-1} - 2 q_{j} + q_{j+1})
と書くことができます.線形の連立方程式なので,この方程式は解くことができます.

戸田格子


バネの力が線形にかかる場合を考えましたが,非線形の場合で解けることはあるのでしょうか?戸田盛和先生は解が楕円関数を使って書き下すことができる非線形の方程式を導きました.
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n-1} \exp (q_j - q_{j+1}) + \exp (q_n - q_1) \\
\displaystyle \qquad \quad = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n} \exp (q_j - q_{j+1})
このハミルトニアンが定める微分方程式戸田格子と呼ぶことにします.最後の  \exp (q_n - q_1) の項がない場合も戸田格子と呼ばれます.


微分方程式の可積分性は微分方程式論の古典的な話題ですが,コワレフスカヤが1900頃に剛体の運動の可積分なケースを発見してから,次に見つかった可積分微分方程式が戸田格子であり,論文が出たのは1967年でした.可積分といっても解が書けること以外にもいくつかの良い性質を戸田格子は持っており,この研究以降さまざまな可積分系が発見されることとなりました.戸田格子の持ついい性質の一つとして,この記事ではLax形式で書けることを取り上げます.

Lax形式


戸田格子のハミルトン系を書き下すと以下のようになります.

\displaystyle\qquad \frac{d q_j}{d t} = p_j \\
\displaystyle \qquad \frac{d p_j}{d t} =\exp(q_{i+1} - q_i) - \exp ( q_i - q_{i+1})
ここで新たな変数  a_j, b_j を以下のように定義します.

\displaystyle \qquad a_j = \frac{1}{2} \exp \left( \frac{q_j - q_{j+1}}{2} \right)
\displaystyle \qquad b_j = \frac{1}{2} p_j
この変数の方程式に書き換えると,微分方程式

\displaystyle \qquad \frac{d a_j}{d t} = a_j ( b_j - b_{j+1} ) \\
\displaystyle \qquad \frac{d b_j}{d t} = 2 ( a_{j-1}^2 - a_j^2)
となります.綺麗にはなりましたが,この方程式のどこがいいのでしょうか?ここでさらに  a_j, b_j で定まる行列  L, A を定義します.

\displaystyle \qquad
 L = \left(
\begin{matrix}
b_1 & a_1 & 0 & \dots & 0 & a_n \\
a_1 & b_2 & a_2 & \dots & 0 & 0 \\
 0 & a_2 & b_3 & \dots & 0 & 0 \\
      &        &        & \ddots &    &   \\
0 & 0 & 0         & \dots& b_{n-1} & a_{n-1} \\
a_n & 0 & 0         & \dots& a_{n-1} & b_n 
\end{matrix}
\right) \\


\displaystyle \qquad A = \left(
\begin{matrix}
0     & a_1    & 0    & \dots   & 0 & -a_n \\
 - a_1 & 0      & a_2 & \dots   & 0 & 0 \\
 0    & - a_2 & 0    & \dots    & 0 & 0 \\
       &         &        & \ddots  &    &   \\
0     & 0     & 0         & \dots   & 0    & a_{n-1}  \\
a_n & 0     & 0         & \dots& -a_{n-1} & 0 
\end{matrix}
\right)
すると,微分方程式

\displaystyle
\qquad \frac{d L}{d t} = [ L, A]
と書くことができます.ここで  [ L, A] = LA - AL です.この形の微分方程式Lax形式と呼びます.分かりづらいかもしれませんが, n が小さい時に具体的に書いてみると様子がわかります.例えば,3 自由度系,つまり, n = 3 のとき,

\displaystyle \qquad
 L = \left(
\begin{matrix}
b_1 & a_1 & a_n  \\
a_1 & b_2 & a_2  \\
 a_3 & a_2 & b_3 
\end{matrix}
\right),
\qquad A = \left(
\begin{matrix}
0     & a_1    & -a_3 \\
 - a_1 & 0      & a_2  \\
 a_3    & - a_2 & 0  

\end{matrix}
\right)
を使って計算してみてください.


Lax形式でかけた場合には,微分方程式の保存量をたくさん得ることができます.というのも任意の自然数  k に対して

\displaystyle \qquad
\frac{d}{dt} \mathrm{Tr} L^k = 0
となるので  \mathrm{Tr} L^k が保存量になります.ただし,保存量の全てが  \mathrm{Tr} L^k と書けるわけではないですし, \mathrm{Tr} L^k 新しい保存量を次々と与えるとも限りません.しかし,戸田格子の場合にはこの手法で役に立つ保存量を得ることができます.これが戸田格子が可積分であることの根拠の一つを与えています.

一般化戸田方程式


この記事では,戸田格子の一般化の一つを考えていきます.戸田格子のハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{j=1}^{n-1} \exp (q_j - q_{j+1}) + \exp (q_n - q_1) \\
でした.ここで, n 個の  n 次元ベクトル
 
\displaystyle \qquad \alpha_1 = (1, -1, 0 , \dots, 0)\\
\displaystyle \qquad \alpha_2 = (0, 1, -1, \dots, 0) \\
\qquad \qquad \vdots \\
\displaystyle \qquad \alpha_{n-1} = (0, \dots, 0, 1, -1) \\
\displaystyle \qquad \alpha_n = (-1, 0, \dots, 0, 1)
を用いれば,戸田格子のハミルトニアン
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{k=1}^{n} \exp ( \alpha_k \cdot q ) \\
と書くことができます.ここで, \cdot内積を表しています.このように,あるベクトルの集合  \{ \alpha_k \} を用いて
 \displaystyle
\qquad H = \frac{1}{2} \sum_{j=1}^n p_j^2 + \sum_{k=1}^{n} \exp ( \alpha_k \cdot q ) \\
書ける方程式を一般化戸田方程式と呼ぶことにします*1.つまり, \{ \alpha_k \} が質点の繋がり方を表しています.


一般化戸田方程式は戸田格子のようにいい性質を持っているとは限りません.そこで,二つの方向から一般化戸田方程式を研究することができます.

問題1  \{ \alpha_k \} に条件を課せば,(何らかの意味で)可積分になることを示せ.

問題2 (何らかの意味で)可積分であるときに, \{ \alpha_k \} が満たすべき条件を与えよ.

つまり,可積分であるための十分条件を与えるのが問題1で,可積分であるための必要条件を与えるのが問題2です.どちらの研究もあるのですが,今回は問題1に対応するBogoyavlensky(1976)の結果を紹介します.

(定理)
 \{ \alpha_k \} が半単純リー代数の単純ルートであれば,一般化戸田方程式はラックス形式で書ける.

この記事の残りでは,この定理を説明していきます.まずはリー代数の知識を復習していきます.

リー代数

半単純リー代数


リー代数  \mathfrak{g} が半単純リー代数であるとは,単純リー代数の直和で書けることをいいます.単純リー代数とは自明でないイデアルを持たないリー代数のことでした.半単純リー代数の性質を使っていくだけなので,定義は気にしなくていいです.


リー代数  \mathfrak{g} の元  g \in \mathfrak{g} に対して,線形写像   \mathfrak{g} \to  \mathfrak{g} h \mapsto [g , h] が定まる.この写像 \mathrm{ad} (g) (h) := [g , h] と書き,随伴表現 と呼びます.つまり, \mathrm{ad} \colon \mathfrak{g} \to \mathrm{gl} (\mathfrak{g}) であり, \mathfrak{g} の基底を定めれば  \mathrm{ad} (g) は行列で書くことができます.


この準備の下でカルタン部分代数を定義します.半単純リー代数  \mathfrak{g} の部分リー代数  \mathfrak{h}カルタン部分代数であるとは以下の性質を満たすことをいう:

 (a.) 全ての元  h \in \mathfrak{h} に対して,随伴表現  \mathrm{ad} (h) は対角化可能である.

 (b.)  \mathfrak{h} は(a.)を満たす部分リー代数の中で極大である.

性質(b.)から部分リー代数は極大ではあるものの最大とは限らないので複数存在するかもしれません.しかし,半単純リー代数の二つのカルタン部分代数  \mathfrak{h}_1, \mathfrak{h}_2 に対して,同型写像  \phi \colon \mathfrak{g} \to \mathfrak{g} \phi(\mathfrak{h}_1) = \mathfrak{h}_2 となるものが存在するので,その意味で一意に定まると考えて良いです.(つまり,リー代数的に異なる意味を持つカルタン部分代数は存在しない.)さらにいい性質として,カルタン部分代数は可換になります.特に,(a.)の性質と組み合わせると, \mathrm{ad} (h)同時対角化可能であることまでわかります.

ルート分解


以降, \mathfrak{g}カルタン部分代数を  \mathfrak{h} とします.ルート分解により簡単に表示することができます.ルートとはカルタン代数の元に対して随伴表現の同時固有値を与える  \alpha \colon \mathfrak{h} \to \mathbb{C} です.厳密に言えば,ある  x \in \mathfrak{g} が存在して,任意の h \in \mathfrak{h} に対して,

\displaystyle \qquad \mathrm{ad} (h) (x) = \alpha(h) x
が成り立つ  \alpha がルートです.ルートは双対空間  \mathfrak{h}^* の元になっています.ルートの定義に現れる  x は同時固有ベクトルを意味する重要なベクトルです.そこで,

\displaystyle \qquad \mathfrak{g}_\alpha = \{ x \in \mathfrak{g} \mid \mathrm{ad} (h) (x) = \alpha(h) x, \forall h \in \mathfrak{h} \}
とします. \mathfrak{h} は可換だったので, \mathfrak{h} \subset \mathfrak{g}_0 となります.さらに極大性から, \mathfrak{h} = \mathfrak{g}_0 も分かります. 0 でないルートの集まりをルート系といい  \Delta と書くことにします.これを用いることで,リー代数

\displaystyle \qquad \mathfrak{g} = \mathfrak{h} \oplus \sum_{\alpha \in \Delta} \mathfrak{g}_\alpha
と分解することができます.この分解をルート分解といいます.以降の考察で必要になる重要な性質を挙げておくと

 \bullet  0 でないルートに対しては  \mathfrak{g}_{\alpha} の次元は  1
 \bullet  [ \mathfrak{g}_{\alpha}, \mathfrak{g}_{\beta}  ] \subset g_{\alpha + \beta} .特に, \alpha+\beta がルートでないならば, x \in \mathfrak{g}_\alpha, y \in \mathfrak{g}_{\beta} に対して  [ x, y ] = 0

コルート


ルートはカルタン部分代数の双対空間の元なので少し扱いづらいです.そこで内積を使って元の部分代数と同一視することを考えます.リー代数に対して, B(x, y) := \mathrm{Tr} ( \mathrm{ad} (x) \mathrm{ad} (y) ) で定まる双線型性形式  B \colon \mathfrak{g} \times \mathfrak{g}  \to \mathbb{C}カルタン・キリング形式といいます.これを部分代数に制限すると  B \colon \mathfrak{h} \times \mathfrak{h}  \to \mathbb{C} \mathfrak{g} が半単純の時には非退化になることが知られています.これを用いれば, \mathfrak{h} \mathfrak{h}^* を同一視することができます.つまり,ルートを  \mathfrak{h} の元と考えることができます.厳密に言えば,全ての  h \in \mathfrak{h} に対して

\displaystyle \qquad B( t(\alpha) , h ) = \alpha (h)
となる   t(\alpha) が一意に決まるので,これをルート  \alphaコルートといいます*2 .つまり,ルートをコルートだと思うことでカルタン部分代数  \mathfrak{h} に入っていると思うことができます.


これまではスカラー複素数体  \mathbb{C} としましたが,実の空間で考えて良いことが知られています.特に, B \mathfrak{h}内積と考えることができるので,ルートはユークリッド空間に埋め込まれていると考えていいです. \mathfrak{h} の次元をリー代数ランクといいます.例として2次元のリー代数を考えている場合,ルートは  2 次元の空間で書くことができます.行列  \mathrm{sl}_{n+1} (\mathbb{C} ) = \{ A \in \mathrm{Mat}_n (\mathbb{C} ) \mid \mathrm{Tr} (A) = 0 \} はランク  nリー代数ですが, n = 2 の場合のルートは以下のように配置されます.

f:id:tetobourbaki:20190812171840j:plain
\mathrm{sl} (3) のルート
 \mathfrak{h} 2 次元で, 6 個のルートがあり,ルートそれぞれに  1 次元の空間  \mathfrak{g}_{\alpha} があるのでルート分解により  \mathfrak{g} 8 次元のベクトル空間です.私は, \mathfrak{h} 空間のルートそれぞれに  1 次元の空間が張り付いているものがリー代数  \mathfrak{g} であるとイメージしています.


また,シンプレクティック行列  \mathrm{sp}_n (\mathbb{C}) := \{ A \in \mathrm{Mat}_{2n} (\mathrm{C} ) \mid A^T J + JA = 0\}はランク  nリー代数で,n=2 の場合は以下のようになります.

f:id:tetobourbaki:20190812172026j:plain
 \mathrm{sp}(2) のルート

単純ルートと半単純リー代数の分類


カルタン部分代数の次元を  m とします.このとき,ルート系  \Delta の部分集合  \{\alpha_k \}_{k=1}^m で以下の性質を満たすものが存在します:

(1)  \{\alpha_k \}_{k=1}^m \mathfrak{h}^* の基底である.
(2)任意のルートを  \alpha = \sum_{k=1}^m c_k \alpha_k のように基底の線型結合で書いたとき,係数は全て整数  c_k \in \mathbb{Z} であり,
 全ての k c_k \leq 0
または
 全ての  k c_k \geq 0
のどちらかが成り立つ.

この性質を持つ部分集合 \{\alpha_k \}_{k=1}^m単純ルートと呼びます.仮定より,単純ルートの元  \alpha, \beta に対して  \alpha - \beta は非ゼロルートにはなりません.あるルート  \omega \omega + \sum_{k=1}^n c_k \alpha_k, c_k \geq 0 がルートとなるのは全ての  k c_k = 0 の場合のみ,となる  \omega極大ルートといいます.


半単純リー代数は単純ルートの幾何的な関係(原点からの長さと角度)で完全に決まることが知られています.行列の集まりで定義される4つのリー代数  \mathrm{sl}_{n+1} (\mathbb{C} ) \mathrm{o}_{2n + 1} (\mathbb{C} ) \mathrm{sp}_{n} (\mathbb{C} ), \mathrm{o}_{2n} (\mathbb{C} ) はそれぞれ  A_n, B_n, C_n, D_n 型の単純ルートの配置から決定されます.また, E_6, E_7, E_8, F_4, G_2 型の単純ルートの配置も加えれば,半単純リー代数はこのいずれかのルートの配置に一致するということが知られています.あとでルートや単純ルートの配置を使うので,列挙しておきます. \mathbb{R}^n の標準基底を  e_1, \dots, e_n と表すことにします.

A_n 型)
 \bullet  \mathfrak{h}^*  \mathbb{R}^{n+1} e_1 + e_2 + \dots + e_n に直行する平面
 \bullet ルート系  \Delta = \{\pm ( e_i - e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} \}.極大ルート  e_1 - e_n

 B_n 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{n}
 \bullet ルート系  \Delta = \{\pm e_i, \pm ( e_i \pm e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} , e_n \}.極大ルート  e_1 + e_2

C_n 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{n}
 \bullet ルート系  \Delta = \{\pm 2e_i, \pm ( e_i \pm e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} , 2e_n \}.極大ルート  2 e_1

 D_n 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{n}
 \bullet ルート系  \Delta = \{ \pm ( e_i \pm e_j ), i < j \}
 \bullet 単純ルート  \{e_1 - e_2, e_2 - e_3, \dots, e_{n-1} - e_{n} , e_{n-1} + e_n \}.極大ルート  e_1 + e_2

 E_8 型)
 \bullet  \mathfrak{h}^* =  \mathbb{R}^{8}
 \bullet ルート系  \Delta = \{\pm ( e_i \pm e_j ), i < j, \frac{1}{2} \sum_{k=1}^8 (-1)^{m(i) } e_i , \sum_{k=1}^8 m(i) \text{は偶数}  \}
 \bullet 単純ルート  \{\frac{1}{2}(e_1 + e_8 - \sum{k=1}^7 e_i, e_1 + e_2, e_2 - e_1, e_3- e_2, \dots, e_7 - e_6 \}.極大ルート  e_7 + e_8

 E_7 型)
 E_8 e_7 + e_8 と直交するものをとったもの.ただし,極大ルートは  e_8 - e_7

 E_6 型)
 E_8 e_7 + e_8 e_6 + e_8 に直交するものをとったもの.ただし,極大ルートは  \frac{1}{2} (e_1 + e_2 + e_3 + e_4 + e_5 - e_6 - e_7 - e_8)

 G_2 型)
 \bullet  \mathfrak{h}^* \mathbb{R}^{3} e_1 + e_2 +e_3 に直行する平面
 \bullet ルート系  \Delta = \{ \pm ( e_i \pm e_j ), i < j, \pm (2 e_i - e_j - e_k), i \neq j \neq k \}
 \bullet 単純ルート  \{e_1 - e_2, - 2e_1 + e_2 + e_3\}.極大ルート  2e_3 - e_2 - e_1

定理の意味と証明


Bogoyavlenskiの定理の意味を説明し,証明を与えましょう.

半単純リー代数  \mathfrak{g} とそのルート分解

\displaystyle \qquad \mathfrak{g} = \mathfrak{h} \oplus \sum_{\alpha \in \Delta} \mathfrak{g}_\alpha
を考えます.ランクを  n とし, \mathfrak{h} の基底を h_1, \dots, h_n とします. \mathfrak{g}_\alpha1 次元なので,その基底を e_{\alpha} で表します.このとき, [ \mathfrak{g}_{\alpha}, \mathfrak{g}_{\beta}  ] \subset g_{\alpha + \beta} やルートの定義などからリー括弧が以下のように計算できます.

 
\bullet \displaystyle  [ e_{\alpha}, e_{\beta} ] = N_{\alpha, \beta} e_{\alpha, \beta} \\
\bullet \displaystyle [ e_{\alpha}, e_{-\alpha} ] = B(e_{\alpha}, e_{-\alpha}) t_{\alpha} \\
\bullet \displaystyle [ h_k, e_{\alpha} ] = \alpha (h_k) e_{\alpha} \\
 \bullet \displaystyle [ h_j, h_k ] = 0
ここで, N_{\alpha, \beta} はある定数.ルート分解によりこの  N_{\alpha, \beta} が定まれば, \mathfrak{g}リー代数の構造が完全に決定できたことになります.


ここからが本題です.ルート系の部分集合  R := \{\alpha_1, \dots, \alpha_m \}
  i \neq j に対して, \alpha_i - \alpha_j が非ゼロルートにならない
となるようにとります.すると, N_{\alpha, \beta} = 0 となり, [ e_{\alpha}, e_{\beta} ] = 0 となります.単純ルートで  R =\{\alpha_1, \dots, \alpha_n \} と定めれば, R はこの性質を満たします.さらに,この  R に極大ルートのマイナスを追加した  R =\{\alpha_1, \dots, \alpha_n, -\omega \} を考えてもこの性質を満たします.


Bogoyavlenskyの定理は正確には以下のような主張です.

(定理)
 \mathfrak{g} をランク  n の半単純リー代数とし,h_1, \dots, h_nカルタン部分代数の基底とする.また,ルート系の部分集合  R := \{\alpha_1, \dots, \alpha_m \}
  i \neq j に対して, \alpha_i - \alpha_j が非ゼロルートにならない
を満たすとする.最後に B( e_{\alpha_i}, e_{-\alpha_i} ) = 1 となるように  \mathfrak{g}_{\alpha_i} の基底  e_{\alpha_i} をとる.

このとき, t_{\alpha_i} = \sum_{j=1}^n d_{ij} h_j と書けたとすると,ハミルトニアン

\qquad \displaystyle H = \frac{1}{2} \sum_{k,l} B(h_k, h_l) p_k p_l + \sum_{k=1}^m \exp (2 \sum_{j = 1}^n d_{kj} q_j )
を持つハミルトン系はLax形式で書ける.特に, h_1, \dots, h_nカルタン・キリング形式  B で定まる内積の正規直交基底にとると,Lax形式で書ける一般化戸田方程式が得られる.

ここで, t_{\alpha_i} = \sum_{j=1}^n d_{ij} h_j とは(コ)ルートを基底で表示しているということです.つまり,ルートの成分表示における成分  d_{ij} で,一般化戸田方程式の質点の繋がり方が決まります.

(証明)変数変換  x_k = \exp (\sum_{j = 1}^n d_{kj} q_j ) を考えると,ハミルトン系は

\displaystyle \qquad \frac{d x_k}{dt} = x_k \sum_{ i , j } d_{kj} p_i B(h_i, h_j ) \\
\displaystyle \qquad \frac{d p_k}{dt} = -2 \sum_{j=1}^m x_j^2 d_{jk}
と書けることがわかる.ここで, \mathfrak{g}の元を

\displaystyle \qquad L := \sum_{k=1}^m x_k (e_{\alpha_k} + e_{-\alpha_k} ) + \sum_{j=1}^n p_j h_j \\
\displaystyle \qquad A := \sum_{k=1}^m x_k (e_{\alpha_k} - e_{-\alpha_k} )
と定めれば,微分方程式
 
\displaystyle \qquad \dot{L} = [L, A ]
と書けることがわかる.このリー括弧の計算では
 
\bullet \displaystyle  [ e_{\alpha_i}, e_{\alpha_j} ] = 0\\
\bullet \displaystyle [ e_{\alpha_i}, e_{-\alpha_i} ] =  t_{\alpha_i} \\
\bullet \displaystyle [ h_k, e_{\alpha_i} ] = \alpha_i (h_k) e_{\alpha_i} \\
 \bullet \displaystyle [ h_j, h_k ] = 0
用いるだけで証明ができる.最後に,半単純リー代数は同じ型を持つ行列の集合で定義されたリー代数と同型なので,
 
\displaystyle \qquad \dot{L} = [L, A]
のリー括弧が行列のリー括弧で書ける. \square


前節の最後に単純ルートや極大ルートがどのように書けるかを書きましたが,それを用いれば以下のような一般化戸田方程式を得ることができます.記述を簡単にするために
 
\displaystyle \qquad V_n = \sum_{i=1}^n \exp (q_i - q_{i+1})
とおくと,

\displaystyle \qquad H_{A_n} = \frac{1}{2} |p|^2 + V_n + \exp(q_{n+1} - q_1) \\
\displaystyle \qquad H_{B_n} = \frac{1}{2} |p|^2 + V_{n-1} + \exp(q_{n} ) \exp(- q_1 - q_2) \\
\displaystyle \qquad H_{C_n} = \frac{1}{2} |p|^2 + V_{n-1} + \exp(2 q_n) + \exp(-2 q_n) \\
\displaystyle \qquad H_{D_n} = \frac{1}{2} |p|^2 + V_{n-1} + \exp(q_{n-1} + q_n) + \exp(-q_1 - q_2) \\
\displaystyle \qquad H_{A_n} = \frac{1}{2} |p|^2 + \exp (q_1 - q_2) + \exp(-2 q_1 + q_2 + q_3) + \exp(q_1 + q_2 - 2 q_3)
ここで,R として単純ルートに極大ルートを加えたもので考えていますが,ポテンシャルの最後の項を除いたものは R として単純ルートをとった場合に対応します.


細かいことを言えば,定理を使うだけでは説明できない部分もいくつかあるのですが(例えば,A_nG_2q p の個数が違う),細かい注意はラックス形式を具体的に計算しながら見ていきます.

具体例での計算

暇があるときに書きます.

最後に

今回は,可積分であるための十分条件から一般化戸田方程式を説明しましたが,可積分であるための \{\alpha_k \} の必要条件を与える研究にも面白いものがあります.特に以下の論文が基本的です.
 Kozlov, Treshchev, Polynomial integrals of Hamiltonian systems with exponential interaction, 1990.
関連する話題には自分の専門に関係した話もあるので,機会があれば一般の人も参加できるような勉強会・研究集会で一度話したいと思っています.そのような場で発表できる機会があればご連絡いただけると嬉しいです.

参考文献

 Bogoyavlensky, On perturbation of the periodic Toda lattice, 1976.
 大貫,吉田,岩波講座 現代の物理学1 力学.
 佐藤,リー代数入門.

*1:一般化戸田方程式の定義はまちまち.特に可積分なものをそう呼ぶかもしれない

*2:異なる意味でコルートという用語を使うことも多いので注意.

可約な場合の超幾何方程式の解について


本記事では以下の定理を示す.

(定理)
 \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく. \pm \alpha \pm \beta \pm \gamma の 1 つが奇数ならば

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
は初等関数とその積分で書ける.

これは方程式が可約のとき,方程式が解けることを意味する.特殊な場合として,可約な場合の超幾何方程式も解ける.もっと言えば,超幾何方程式に帰着させてこの定理は証明される.証明を追えば,解の求め方も知ることができる.


参考文献は
[1] 河野実彦,微分方程式と数式処理
[2] 福原,大橋,初等関数で表せるRiemannのP函数の決定について
[3] Kimura, On Riemann's Equations which are Solvable by Quadratures
である.木村の定理やSchwartzによる代数解のリストについて書いた文章はネットにも結構あるが,それよりも簡単な場合の可約な場合についての解説がなかなかないと思ったのでまとめておく.


一つ注意として,文献 [1] [2] は初等関数と積分を用いて表されるものを単に初等関数と呼んでいるが,初等関数のクラスでは積分は許さないことが多い.実際,\int e^{-x^2} dx が初等関数で書けないことは有名であるが,初等関数に積分を許すと,これが意味をなさないことになる.

基礎知識


有理関数を係数に持つ  2 階の線形微分方程式を考える.特に,3 点を確定特異点に持つフックス型の微分方程式を考える.簡単のため,特異点の一つは  \infty とする.ここで用いた用語の解説は省略するが,(1) 特異点ごとに特性指数と呼ばれる 2 つの数が定まる (2) 特異点3 つの場合それらの確定特異点で方程式が完全に決定する,の 2 つを受け入れていただければ,後の議論は理解できる.


例えば, x = a の特性指数を  \lambda, \lambda' x = b の特性指数を  \mu, \mu' x = \infty の特性指数を  \nu, \nu' とすれば,微分方程式

\displaystyle
\qquad
x'' = \frac{c_0 + c_1 t}{(t- a) ( t - b)} x' + \frac{d_0 + d_1 t + d_2 t^2}{(t-a)^2 (t-b)^2}, \\
\quad c_0 = - (\lambda + \lambda' - 1) b - (\mu + \mu' - 1) a, \quad c_1 = - (\nu + \nu' + 1) \\
\quad d_0 = (a-b) b \lambda \lambda' + (b-a) a \mu \mu' - ab \nu \nu', \\
\quad d_1 = (b-a) \lambda \lambda' + (a- b) \mu \mu' + (a+b) \nu \nu', \quad d_2 = - \nu \nu'
となる.(確定特異点と特性指数の定義が分かれば簡単に計算ができる.)決定された方程式を見れば分かるように,各特異点の特性指数の順序は交換しても良い.(例えば, \lambda \lambda' を変えてもよい.)特性指数で方程式が決まるので,この方程式の解の集合を

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
と表す.これをRiemannの  \wp 関数と呼ぶ.ただし,特性指数の和は必ず 1 になる,つまり  \lambda + \lambda' + \mu + \mu' + \nu + \nu' = 1 となるので全てを自由に取れるわけではない.独立変数の変換  \tau = (t - a)/(b-a) により,

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
=
\wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
\lambda & \mu & \nu &; \tau \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
となる.つまり,特異点 0, 1, \infty に固定してよい.さらに, y = (t- a)^{-\lambda} (t - b)^{\mu} x と従属変数の変換をすれば,
 \qquad 
\displaystyle
y =(t- a)^{-\lambda} (t - b)^{\mu} \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
=\wp \left\{
\begin{matrix}
a & b & \infty & \\
0 & 0 & \nu + \lambda + \mu&; t \\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \nu & 
\end{matrix}
\right\}
と変換することができる.(普通に変数変換すれば分かる.)つまり, t = a, b のそれぞれの特性指数の  1 つを  0 にすることができる.特性指数の和が 1 になることに注意すれば,微分方程式を決定する本質的な特性指数の個数は 3 つである.ここで,変換  y = (t- a)^{-\lambda} (t - b)^{\mu} x により,特性指数の差  \lambda' - \lambda, \mu' - \mu, \nu' - \nu も不変になっていることに注意せよ.ここで用いた独立変数と従属変数の変換を用い,定数を書き換えると,考えている全ての方程式は以下の  \wp 関数に帰着される.
 
\displaystyle
\qquad
\wp \left\{
\begin{matrix}
a & b & \infty & \\
0& 0 & a &; t \\
1 - c & c - a - b & b & 
\end{matrix}
\right\}
これが満たす方程式が超幾何方程式と呼ばれる以下の方程式である.

\displaystyle
\qquad
t ( 1-t) x'' + \{ c - ( a + b + 1) t \} y' - ab y = 0

可約性


 2 階の有理係数の線形微分方程式において, 0 でない解  x 1 階の有理係数の方程式  x' = r(t) x の解になっているとき,方程式は可約であるという.今考えているような 3 つの確定特異点を持つ 2 階の方程式に対しては以下の同値性が知られている.

(命題)

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
を解に持つ方程式を考える.また,特性指数の差を  \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく.このとき,以下が同値,
(1) 方程式は可約である.
(2) 以下の 8 つの数
  \qquad \alpha+ \beta + \gamma, -\alpha + \beta + \gamma,\alpha- \beta + \gamma, \alpha+ \beta - \gamma,\\
  \qquad -\alpha - \beta + \gamma,  -\alpha+ \beta - \gamma, \alpha- \beta - \gamma, -\alpha- \beta - \gamma
 のいずれかが奇数.
(3) 以下の 8 つの数
 \qquad \lambda + \mu + \nu, \lambda' + \mu + \nu,\lambda + \mu' + \nu,\lambda + \mu + \nu'\\
\qquad \lambda' + \mu' + \nu, \lambda' + \mu + \nu',\lambda + \mu' + \nu',\lambda' + \mu' + \nu'
 のいずれかが整数.

条件(3)で 8 つの数を見なければいけないのは,特性指数の順番を変えても方程式は変わらないことに由来する.このことは特性指数の差で言えば,正負を変えても方程式は変わらないことを意味し,(2) も 8つの数を見なければいけないことになる.

証明.(2) ならば (3) であること.奇数となる組みに対し, \lambda + \lambda' + \mu + \mu' + \nu + \nu' = 1 の式を加えれば (3) が示せる.

(3) ならば (2) であること.整数となるペアに対し, \frac{1}{2} (\lambda + \lambda' + \mu + \mu' + \nu + \nu') = \frac{1}{2} を引けば (2) が示せる.

(1)との同値性はそのうち示す. \square

定理の証明


補題を証明した後,示したかった定理を示す.

補題
 
\displaystyle \qquad  x = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu'& ;t \\
\lambda & \mu & \nu & 
\end{matrix}
\right\}
のとき、

\displaystyle \qquad  x' = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu' + 1& ;t \\
\lambda - 1 & \mu -1 & \nu + 1 & 
\end{matrix}
\right\}
となる.

証明.定数をおき直して,超幾何方程式の定数の取り方
 
\displaystyle \qquad  x = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \alpha& ;t \\
1-\gamma & \gamma - \alpha -\beta & \beta & 
\end{matrix}
\right\}
に対して証明する.このときの方程式は

\displaystyle
\qquad 
  t(1-t) x'' + \left\{ \gamma - ( \alpha + \beta + 1) t \right\} x' - \alpha \beta x= 0
である.これを微分すると,

\displaystyle
\qquad 
  t(1-t) x''' + \left\{ (1+\gamma) - [ \alpha+1 + \beta+1 + 1] t \right\} x'' - (\alpha+1) (\beta+1) x' = 0
となる.よって,
 
\displaystyle \qquad  x' = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \alpha + 1& ;t \\
 - \gamma & \gamma - \alpha -\beta - 1& \beta + 1& 
\end{matrix}
\right\}
となる. \square


補題

\displaystyle
\qquad 
\wp 
\left\{
\begin{matrix}
 a & b & \infty & \\
0 & 0 & 0& ;t \\
 \lambda & \mu& \nu& 
\end{matrix}
\right\}
=
\left\{ C_1 + C_2 \int^t  (s-a)^{\lambda - 1} (s-b)^{\mu - 1} ds \mid C_1, C_2 \in \mathbb{C} \right\}

証明.
\displaystyle
\qquad 
\wp 
\left\{
\begin{matrix}
 a & b & \infty & \\
0 & 0 & 0& ;t \\
 \lambda & \mu& \nu& 
\end{matrix}
\right\}
の満たす方程式は

\displaystyle 
\qquad
 x'' = \frac{ - ( \lambda - 1)b - ( \mu - 1) a - ( \nu + 1) t}{(t-a) (t - b)} x'
である.書き換えると

\displaystyle 
\qquad
 \frac{1}{x'} x'' = \frac{\lambda - 1}{t-a} + \frac{\mu - 1}{t-b}
となる.積分すると

\displaystyle
\qquad
\log x' = \log C_2 (t-a)^{\lambda - 1} (t-b)^{\mu - 1}
となるので、

\displaystyle
\qquad
 x' =  C_2 (t-a)^{\lambda - 1} (t-b)^{\mu - 1}
であり,積分すると

\displaystyle
\qquad
 x =  C_1 + C_2 \int^t (s-a)^{\lambda - 1} (s-b)^{\mu - 1} ds
となる. \square


(定理)
 \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく. \pm \alpha \pm \beta \pm \gamma の 1 つが奇数ならば

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
は初等関数とその積分を使って書ける.

証明.変数変換  \tau = (t-a)/(b-a) により特異点 0 1 になるので,

\displaystyle
\qquad
( t - a)^{-\lambda} (t-b)^{-\mu} \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\} \\
= \wp \left\{
\begin{matrix}
a & b & \infty & \\
0 & 0 & \nu + \lambda + \mu &; t \\
\lambda' - \lambda & \mu' - \mu  & \nu' + \lambda + \mu & 
\end{matrix}
\right\} \\
= \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu + \lambda + \mu &; \tau \\
\lambda' - \lambda & \mu' - \mu  & \nu' + \lambda + \mu & 
\end{matrix}
\right\}
となる.よって,

\qquad
\displaystyle
y(\tau) = \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu + \lambda + \mu &; \tau \\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \mu & 
\end{matrix}
\right\} 
=
\wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \rho &; \tau \\
\alpha & \beta& \gamma + \rho & 
\end{matrix}
\right\}, \\
\qquad \rho = \frac{1}{2} ( 1 - \alpha - \beta - \gamma)
が解ければよい.仮定により, \alpha + \beta + \gamma = 2n + 1, n \geq 0 としてよい.よって,

\displaystyle
\qquad  y = \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & -n &; \tau \\
\alpha & \beta& \gamma - n & 
\end{matrix}
\right\}
となり,補題により  n微分すれば,

\displaystyle
\qquad
y^{(n)} (\tau)=  \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & 0&; \tau \\
\alpha - n & \beta - n& \gamma & 
\end{matrix}
\right\}
=
C_1 + C_2 \int^\tau s^{\alpha - n - 1} (s - 1)^{\beta - n -1} ds
となるから,これを積分することで,y は初等関数の積分で書くことができる.以上より,

\qquad \displaystyle
x = ( t - a)^{\lambda} (t-b)^{\mu} y\left( \frac{t - a}{a - b} \right)
と書くことができる. \square


最後に注意として, C_1 + C_2 \int^t s^{\alpha - n - 1} (s - 1)^{\beta - n -1} ds n積分の全てが  y ではないことに注意する.実際, n積分すると積分定数が合計  n + 2 個出てきてしまい,それらが一次独立であれば  y2 階の微分方程式の解であることに矛盾する.ここで言っているのはあくまで  y が少なくとも  C_1 + C_2 \int^t s^{\alpha - n - 1} (s - 1)^{\beta - n -1} dsn積分として書けるということだけである.

なぜ素イデアルを点と見るのか

代数幾何について最近ちょっとしっくりきたのでまとめておきます.タイトルでは素イデアルを挙げていますが,そこに至るまでを詳しく書きます.いろんな説明の仕方があると思いますが,幅広く議論する気はありません.アファインの場合だけを考えますし層の議論が出てこないような話を書きます.普通スキームと呼ばれるものを多様体と呼んでしまっているのでご注意ください.

この記事では, k は体を表します.また,環とは  1 を持つ可換環とします.記法として,列  (a_1, \dots, a_n) \bar{a} と表します.よって,多変数多項式環 k[\bar{X}] と表します. k 代数を考えるとき, k代数的閉体の場合を考えることが多いですが,そうでない場合も出てくるので, k の仮定はできるだけその都度書きます.調べればすぐにわかる用語は説明していないことがあります.
(もう少し証明を書き加える予定)

参考文献.問題意識は以下の微分ガロア理論の本の付録に基づいている.
van der Put, Singer, "Galois Theory of Linear Differential Equations"
また,
西宮正宣,『代数学2 -発展編-』
も参考にしている.
代数や環については以下を参考にしている.
堀田良之,『可換環と体』
Milne, "Commutative Algebra"

全体像

この記事では以下の表が成り立つような描像を目指していく.

座標環
 k[\bar{X}]  {k}^N
有限生成  k 代数 極大イデアル
 k 代数 イデアル

よって,環を考えるとき,普通は有限生成ではないので素イデアルを点と考える.

多変数多項式の場合


 k [X_1, \dots, X_N] = k [ \bar{X} ] の場合を復習する.代数幾何学とは多項式の零点を考える学問である. k [ \bar{X} ] イデアル  I に対して,その零点の集まりを  \mathcal{V} (I) と表す:

\qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid \forall f \in I, \, f(\bar{a} ) = 0\}
 V代数的集合であるとは,あるイデアル  I を用いて  V = \mathcal{V} (I) と書けるものをいう.つまり,代数的集合が代数幾何学の対象である.代数的集合の集まりは  k^N の位相を定めることが知られている.定まる位相はZariski位相と呼ばれる.つまり以下が成り立つ.

命題( k^N のZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = k^N ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )


ある幾何学的対象があるとき,その上の関数を考えるというのは重要である.例えば,微積分学は  \mathcal{R}^N 上の滑らかな関数や解析関数を考える.代数幾何は代数的な考察を行うので, k^N 上では単に多項式環  k[\bar{X}] を考えればよい.では,代数的集合上の関数はどのように定めればいいのか?  V \subset k^N を代数的集合とは限らない部分集合とする.多項式  f \in k[\bar{X} はもちろん  V の関数を定めるが,定義域  V が小さい時には  V の外の  f の値は関係ないので k[ \bar{X} ] は大きすぎるように思える.以下のように多項式の集合  \mathcal{I} (V) を定める:

\qquad \displaystyle \mathcal{I} (V) := \{ f \in k[ \bar{X} ] \mid \forall \bar{a} \in V, \, f( \bar{a} ) = 0 \}
この  \mathcal{I} (V)イデアルとなる.すると以下の命題が成り立つ.

命題
 V \subset k^N とする. f, g \in k [\bar{X} ] に対して以下が同値である.

(i)  f, g V 上の関数として同じ.つまり,全ての  \bar{a} \in V f(\bar{a} ) = g(\bar{a} );

(ii)  f - g \in \mathcal{I} (V)

つまり, V 上の関数は  k [\bar{X} ] の元を  \mathcal{I} (V) で同一視した  k [ \bar{X} ] /\mathcal{I} (V) であるということが分かった. k [ \bar{X} ] / \mathcal{I} (V)  V座標環という.


Zariski位相は非常に粗いことが特徴的である. V \subset k^n既約であるとは,閉集合  U_1, U_2 を用いて  V = U_1 \cup U_2 と書けるなら  V = U_1 または  V = U_2 が成り立つことをいう.つまり,既約とは(共通部分を持っていてもよい)二つの閉集合に分解できないことをいう.こんなことはユークリッド空間の普通の位相ではほとんど起こらず役に立つ概念ではないが,Zariski位相が粗いために便利な概念である.


以上のことをまとめると,イデアル  I多項式の集まり)から代数的集合  \mathcal{V} (I) が定まった.一方,点の集まり V からはイデアル  \mathcal{I} (V) が定まる.このように,環のイデアルと点の集まりが対応している.実はこの対応により,イデアルと図形の性質が対応する.

定理

 \mathcal{V} \colon \{ k [\bar{X}] \text{のイデアル} \} \to \{ k^N \text{の部分集合} \}  \mathcal{I} \colon \{ k^N \mathrm{の部分集合} \}  \to \{ k [\bar{X}] \text{のイデアル}  \} に対して以下が成り立つ.

(i)  V \subset k^Nに対して, \mathcal{I} (V) は根基イデアルであり, V \subset \mathcal{V} (\mathcal{I} (V) )
イデアル  I \in k[\bar{X} ] に対して, \mathcal{V} (I) は代数的集合であり,  I \subset \mathcal{I} ( \mathcal{V} (I) );

(ii)  V が代数的集合ならば  V = \mathcal{V} (\mathcal{I} (V) ) であり, I が根基イデアルならば  I = \mathcal{I} ( \mathcal{V} (I) ).つまり,代数的集合と根基イデアル \mathcal{V}, \mathcal{I} により一対一に対応する.

(iii) 代数的集合  V が既約であることと,対応する根基イデアル  \mathcal{I} (V) が素イデアルであることは同値.

(iv)  k代数的閉体と仮定する.このとき,代数的集合  V が一点  V = \{ \bar{a} \} であることと,対応する根基イデアル  \mathcal{I} (V) が極大イデアルであることは同値.

この定理について補足.(i)の部分集合の関係式は  \mathcal{V}, \mathcal{I}ガロア接続を定めることを意味している.(iv) において特に極大イデアル  m \bar{a} \in k^N を用いて
 
\qquad m = (X_1 - a_1, \dots, X_N - a_N)
と書けることも分かる.この形のイデアル m_a := (X_1 - a_1, \dots, X_N - a_N) と表すこととする. k代数的閉体でなくても  m_a の形のイデアルは極大イデアルであり,対応する代数的集合  \mathcal{V} (m_a) は一点集合である.なので (iv) の主張は k代数的閉体ならば,極大イデアルが必ず  m_a の形に書けるということである.この主張はヒルベルトの零点定理の弱形と呼ばれる.


有限生成代数と極大イデアル

代数的閉体でない場合


目標では次に有限生成代数に行きたいところではあるが,極大イデアルを点と見る理由を十分に理解するために, k代数的閉体でない場合の多項式環  k[ \bar{X}] を考える.


前節の最後の定理の(iv)から, k代数的閉体の場合は点と極大イデアルは同一視して良い.一方,前節の最後に述べたことは, k代数的閉体の場合には素朴な点  \bar{a} は極大イデアル  m_a に対応するが,任意の極大イデアルは点に対応するとは限らない.つまり,極大イデアルの方が多いので,素朴な点  \bar{a} にこだわらず,極大イデアル自体を"点"と見た方がいいことが示唆される.


(補足.何を言っていいるかというと,「図形と代数の対応」がうまくいくには図形の点の定義を変えるということである. k代数的閉体の場合には実際に極大イデアルと点が対応するので,一般化して極大イデアルも点だと思おうとする,すると図形と代数が対応する, ということである.極大イデアルを点と呼ぶ「点らしさ」は「図形と代数の対応」を信じていることから来ているのであり,素朴な図形観に訴えかけるものではないと思う.だから,この分野に詳しくない人に向かって「数学者は極大イデアルを点と思う」と言ってしまうと,(詳しく説明しない限り)そこでいう"点"概念が代数幾何学者とそれ以外の人で大きくズレているためミスリーディングだと思う.*1


極大イデアルを点と考えることの意味を考える.可換環  R の極大イデアル \mathrm{mSpec} R と表す. k代数的閉体でなくても, k^N \subset \mathrm{mSpec} (k [\bar{X} ]) と考えることができるのであった.一方,任意の  \bar{a} \in \bar{k}^N に対して, \bar{X} \mapsto \bar{a} とする写像  \phi_{\bar{a}} \colon k [ \bar{X} ] \to \bar{k} を考えると,準同型定理より  k [ \bar{X} ]/ \mathrm{ker} \phi_{\bar{a}} \simeq \bar{k} となる.よって, \mathrm{ker} \phi_{\bar{a}} は極大イデアルである.よって写像  \tau \colon k^N \to \mathrm{mSpec} (k[ \bar{X} ] ) \colon \bar{a} \mapsto \mathrm{ker} \phi_{\bar{a} } を得る.この  \tau全射である.(なぜなら, m \in \mathrm{mSpec} (k[ \bar{X} ]  \bar{k} [ \bar{X} ] でのイデアルと考えれば,ある  \bar{a} \in \bar{k}^N m \subset \mathrm{ker} \phi_{\bar{a}} が分かる.極大性より  m = \mathrm{ker} \phi_{\bar{a}} となる. )つまり, \mathrm{mSpec} (k[ \bar{X} ] ) \subset \bar{k}^N と考えても良い.つまり,以上より, k^N \subset \mathrm{mSpec} (k[ \bar{X} ] ) \subset \bar{k}^N と考えられ,極大イデアルを点と見ても少なくとも  \bar{k}^N の元(と見ることはできる)ということが分かる.


これは一変数の場合でみるともっと分かりやすい. k \subset \mathrm{mSpec} (k[ X ] ) \subset \bar{k} の解釈として, k[X ]の元は  k に零点を持つとは限らないが  \mathrm{mSpec} (k[ X ] ) には零点を持つ.つまり,全ての多項式が零点を持つように空間を広げたものが   \mathrm{mSpec} (k[ X ] ) である.ちなみに,零点を持つだけでなく体になるようにしたものが  \bar{k} である.例えば,多項式  X^2 + 1 \in \mathbb{Q} [ X ]  \mathbb{Q} に零点を持たないが,極大イデアル  (X^2 + 1) \in \mathrm{mSpec} ( \mathbb{Q} [ X ] ) が"零点"になる. X^2 + 1 \bar{k} には  2 つ零点  \sqrt{-1}, -\sqrt{-1} があるので,代数的閉体における零点と極大イデアルが対応しているわけではない.(つまり, \tau^{-1} (m) には本当の零点がたくさん入っていることがある.)被約の仮定は別の場所でも重要になってくるが,被約だと思って読み進めよ.

有限生成代数の場合


問題を元に戻して,多項式環  k [\bar{X} ] ではなく一般化して有限生成  k 代数  A を考えることにする.


一般化してはいるが,それほど奇妙なものではなく,実はすでに出てきたものである.有限生成という仮定により有限個の元  f_1, \dots, f_N \in A が存在して  A = k [f_1, \dots, f_N ] と書ける.多項式環からの全射  \phi \colon k [ \bar{X} ] \to A \colon X_i \to f_i を考えることにより, A \simeq k [ \bar{X} ] / \mathrm{ker} \phi となる. I = \mathrm{ker} \phi とおけば, A多項式環イデアルで割ったものということである.特に, A が被約の場合には  I は根基イデアルとなり, A \mathcal{V} (I) の座標環である.さらに言えば, A が被約のときには, A は代数的集合  \mathcal{V} (I) と同一視して良い.


つまり,(被約)有限生成  k 代数  A とは  k[\bar{X} ] の代数的集合なのであるが,  k[\bar{X} ] の極大イデアルを点と見たように, A の点も  A の極大イデアルとして定義する. A の点を  \mathrm{mSpec} A としたときに,その位相をどのように定めればいいか?それを考えるために多項式環の場合を思い出す.多項式環では,代数的集合

\qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid \forall f \in I , \, f(\bar{a} ) = 0\}
の集まりで位相を定めるのであった.ここで, \bar{a} が定める極大イデアル  m_{\bar{a}} = (X_1 - a_1, \dots, X_N - a_N ) を用いれば,

\displaystyle \qquad f(\bar{a}) = 0 \Leftrightarrow f \in m_{\bar{a}}
となる.よって代数的集合の定義は

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid  I \subset m_a \}
と書ける.点と極大イデアルが対応しているので,極大イデアルの空間  \mathrm{mSpec} A の代数的集合も全く同様に

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ m \in \mathrm{mSpec} A \mid  I \subset m \}
と定義すればよい.もちろんこれで位相が定まる.  \mathrm{mSpec} Aアファイン代数多様体と呼ぶことにする.

命題( \mathrm{mSpec} AのZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = \mathrm{mSpec} A ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )

多項式環の場合と同様に考えれば,部分集合  V \subset \mathrm{mSpec} A に対してイデアルを定める写像  \mathcal{I} も考えるべきであろう:

\displaystyle \qquad \mathcal{I} (V) := \{ f \in A \mid \forall m \in V, \, f \in m \} = \bigcap_{m \in V} m


もう少し考察に進む前に,有限生成代数に対して成り立ついくつかの定理を復習する.

定理
 R_1 \subset R_2 は環の拡大で  R_2 が整域とする.このとき,R_2R_1 上整ならば, R_1 が体であることと  R_2 が体であることは同値.

証明は意外と簡単にできる.

定理(Zariskiの補題
 k \subset K を体の拡大とする.
このとき,K k 上有限生成ならば,K k 上代数的である.


 k \subset K を体の拡大とする. A k 代数で  K \subset A とする.
このとき, A が有限生成  k 代数ならば, K k 上代数的である.

証明. m \in \mathrm{mSpec} A とすると, K は逆元を持たないから  m \cap K = \emptyset であり  k \subset K \subset A/m となる. A/m k 上有限生成なのでZariskiの補題により A/m の元は代数的.よって,K の元も代数的. \square

定理(ヒルベルトの零点定理)
 A が有限生成 k 代数のとき,

\displaystyle \qquad \sqrt{ (I) } = \bigcup_{I \subset m \in \mathrm{mSpec} (A) } m
となる.特に, A が被約ならば,
 
\displaystyle \qquad \bigcup_{m \in \mathrm{mSpec} (A) } m = \sqrt{ (0) } = 0
である.

ヒルベルトの零点定理の意味を考える.イデアル  I に対して, \mathcal{I} (\mathcal{V} (I) ) を考えると
 \displaystyle
\qquad \mathcal{I} (\mathcal{V} (I) ) = \bigcap_{m \in \mathcal{V} (I) } m = \bigcap_{I \subset m \in \mathrm{mSpec} (A) } m
となるので, A が有限生成のときには,

\qquad \displaystyle \sqrt{ (I) } = \mathcal{I} (\mathcal{V} (I) )
となる.これがヒルベルトの零点定理の意味である.

準同型写像と射


幾何と代数が対応していると思えるためには,単に代数から幾何学的対象が定まるだけでなく,代数間の準同型写像から幾何学的対象の射が対応していなければならない.


 k 代数 A, B の間の準同型写像  \phi \colon A \to B があったとする.このとき,有限生成代数の間の準同型写像であれば,連続写像  \phi^* \colon \mathrm{mSpec} B \to \mathrm{mSpec} A \phi^* (m) = \phi^{-1} (m) と定義できる.これが有限生成を仮定する理由である.

命題
 k 代数 A, B準同型写像  \phi \colon A \to B 考える.B k 上有限生成のとき, m \in \mathrm{mSpec} B の引き戻し  \phi^{-1} (m) A の極大イデアルである.

証明.Bk 上有限生成なので, B/mk 上有限である.よって, \pi \colon B \to B/m とおいて, \pi \circ \phi \colon A \to B/m の像は  k 上有限であり体である.つまり, A/ \mathrm{ker} (\pi \circ \phi) \simeq A / \phi^{-1} (m) は体である.よって, \phi^{-1} (m) は極大イデアルである.

次に,この  \phi^*連続写像であることを見る.まず,位相的な準備をする. f \in A に対して開集合  D (f) := \mathrm{mSpec} (A) \setminus \mathcal{V} ( (f) ) = \{ m \in \mathrm{mSpec} (A)  \mid f \notin m\} が定まる.有限生成 k 代数  Aネーター環なので,任意のイデアル  I は有限生成である.すると開集合  Z = \mathrm{mSpec} (A) \setminus \mathcal{V} (I)

\displaystyle \qquad Z = D(f_1) \cup \dots \cup D (f_N)
と書ける.つまり,開集合は  D(f) の形の開集合の有限和で書くことができる.つまり, D(f) の集まりがZariski位相の基本開集合となっている. \phi \colon A \to B f \in B に対して,

\displaystyle \qquad (\phi^* )^{-1} ( D(f) ) = \{ m \in \mathrm{mSpec} (B) \mid \phi^* (m) \in D(f) \} \\
\qquad \qquad \qquad \, =  \{ m \in \mathrm{mSpec} (B) \mid f \notin \phi^{-1} (m)  \} \\
\qquad \qquad  \qquad \,=  \{ m \in \mathrm{mSpec} (B) \mid \phi( f) \notin (m)  \} \\
\qquad \qquad  \qquad \,= D (\phi (f))
となる.つまり, \phi^* は開集合の引き戻しを開集合に写すので連続写像である. \square


よって,有限生成代数とその間の準同型写像から,アファイン代数多様体とその間の連続写像を得ることができた.逆にアファイン代数多様体やその連続写像から有限生成代数と準同型写像が得られるなら完璧であるが実はこれは難しい.それを行うには層の議論が必要になる.層の議論をやるのは大変なので,ずいぶん簡単な状況を考えることでその逆操作のギャップがどこにあるかを見る.


まず,有限生成代数をアファイン代数多様体上の関数と見る方法を考える.有限生成代数  A に対して, X = \mathrm{mSpec} A とおく. f \in A を固定すると, m \in X に対して [ f ]_m \in A/m が対応づけられる. k代数的閉体の場合は  A/m \simeq k なので, X から  k への写像  \mathrm{map} (f) \colon X \to k が定義できる.のちの議論で必要になるので,細かい注意をすると, f(m) = a \in k というのは  f - a \cdot 1_A \in m ということである.次に, f, g\in A \mathrm{map} (f) = \mathrm{map} (g) とする.つまり,任意の  m \in X に対して  [f]_m = [g]_m とする.これは  f - g \in m なので, f - g \in \bigcap_{m \in X} m ということである.A が被約とすると, \bigcap_{m \in X} m = \sqrt{ (0) } = 0 なので, f = g となる.つまり, X から  k への写像の集合を  O(X) と表すと  \mathrm{map} \colon A \to O(X)単射である.つまり,A の元は写像として同じなら  A の元としても同じである.


以上のことをまとめると, k代数的閉体の時には  A X から  k への関数を定義し,A が被約ならその関数としての性質が A の元を特徴付ける.つまり,k代数的閉体かつ A が被約の時に, AO(X) の部分集合と見ることができる.逆に O(X) の元  \alpha A であるとは,ある  f \in A が存在して, \mathrm{map} (f) = \alpha となることとである.この準備の元で,アファイン多様体の間の射が代数の準同型写像を与えるための条件は以下のように与えられる.

命題
 k代数的閉体 A, B を被約な有限生成 k 代数とする.連続写像  \psi \colon \mathrm{mSpec} A \to \mathrm{mSpec} B に対して,以下が同値:

(i) ある  k 準同型  \phi\colon B \to A が存在して, \psi = \phi^* が成り立っている.

(ii) 任意の  g \in B に対して,関数  \mathrm{map} (g) \circ \psi \colon \mathrm{mSpec} A \to \mathrm{mSpec} B \to k A の元である.

証明.【(i)ならば (ii) の証明】. \psi (g) \in A なので  \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( \psi (g) ) を示せばよい.任意の  m \in \mathrm{mSpec} A に対して,
 \displaystyle
\qquad  \mathrm{map} (g) \circ \psi (m) = \mathrm{map} (g) (\psi (m) ) \\
\qquad \qquad  \qquad = [g ]_{\psi (m)} \\
\qquad \qquad \qquad = [g ]_{\psi^{-1} (m) } \\
ここで, [ g ]_{\psi^{-1} (m)} = a \in k とは  g - a\cdot 1_B \in \psi^{-1} (m) ということであり,これは  \psi (g) - a \cdot 1_A \in m を意味する.つまり, [ \psi (g) ]_m = a である.よって,
 \displaystyle
\qquad  \mathrm{map} (g) \circ \psi (m) = [ \psi (g) ]_m = \mathrm{map} (\psi (g) ) (m)
となる.以上より, \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( \psi (g) ) である.
【(ii)ならば(i)の証明】.仮定により任意の g \in B に対して,ある  f_g \in A が存在して, \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( f_g ) と書ける.この  f_g は一意である.実際,  \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( f_g' ) となる  f_g' もあったとしても, A O(X) の元として見ることができるので,  \mathrm{map} ( f_g ) = \mathrm{map} ( f_g' ) より  f_g = f'_g である.そこで  \psi \colon B \to A \psi (g) = f_g と定める.
 \psi が準同型であること)

 \displaystyle \qquad \mathrm{map}( \phi (a g + a ' g') ) (m)  = [a g + a' g' ]_{\psi (m)}  \\
\qquad \qquad \qquad \qquad \qquad= a [g ]_{\psi (m) } + a' [g' ]_{\psi (m)}  \\
\qquad \qquad \qquad \qquad \qquad=  (a \mathrm{map} (g)  + a' \mathrm{map} ( g' )  ) (m) \\
\qquad \qquad \qquad \qquad \qquad= \mathrm{map} ( a \phi (g) + a' \phi (g') ) (m)
より, \displaystyle \phi (a g + a' g' ) = a \phi (g) + a' \phi (g') となる.
同様に,

 \displaystyle \qquad \mathrm{map}( \phi (g g') ) (m)  =  \mathrm{map} (g g' ) \circ \psi (m) \\
\qquad \qquad \qquad \qquad  =  [g g']_{\psi (m)}  \\
\qquad \qquad \qquad \qquad =  [g]_{\psi (m)}  [g']_{\psi (m)}  \\
\qquad \qquad \qquad \qquad =  \mathrm{map} (\phi ( g) ) (m) \cdot \mathrm{map} (  \phi (g') ) (m)  \\
\qquad \qquad \qquad \qquad =  \mathrm{map} (\phi ( g)  \phi (g') ) (m)
より, \displaystyle \phi (g g') = \phi ( g)  \phi (g') となる.
 \phi = \psi^* となること)
全ての  m \in \mathrm{mSpec} A に対して  \psi (m) = \phi^{-1} (m) を示せばよい.
 \displaystyle
\qquad g \in \psi (m) \Leftrightarrow [g ]_{\phi (m) } = 0 \Leftrightarrow [\phi (g) ]_m = 0 \Leftrightarrow \phi (g) \in m \Rightarrow b \in \phi^{-1} (m)
よって, \psi (m) \subset \phi^{-1} (m) \psi (m) は極大イデアルなので, \psi (m) = \phi^{-1} (m) \square


まとめると,代数の議論(代数とその間の準同型写像)はアファイン多様体の議論(アファイン多様体とその間の連続写像)に写すことができるが,アファイン多様体の議論が代数の議論に写すことができるとは限らない.なので,アファイン多様体とその間の射にさらなる情報を加えたものを考えていくことが本当は必要であるが,少なくとも,代数の議論がアファイン多様体の議論に写すことができるという事実が成り立つことが全ての出発点になっている.

有限生成でない代数と素イデアル

有限生成でない場合


さて,有限生成でない代数の場合を考えよう.有限生成でない場合にはの,今の定義では,代数の議論がアファイン多様体の議論に写すことができない.つまり, \phi \colon A \to B m \in  \mathrm{mSpec} (B) に対して, \phi^{-1} (m) A の極大イデアルになるとは限らない.実際,単射  \iota \colon \mathbb{Z} \to \mathbb{Q} を考えたとき,\mathbb{Q} の極大イデアル (0) のみであるが,その引き戻しは  \iota^{-1} ( (0) ) = (0)  \mathbb{Z} では極大ではない.


そこで,代数の議論がアファイン多様体の議論に写るように,アファイン多様体の点の定義を変更する.つまり,極大イデアルではなく素イデアルを点と考えることにする.可換環  R に対して,その素イデアルの集まりを  \mathrm{Spec} R で表すことにする.すると,準同型写像  \phi \colon A \to B と素イデアル  m \in  \mathrm{Spec} (B) に対して, \phi^{-1} (m) A の素イデアルになることが確認できる.

命題
 A, B k 代数とする.準同型写像  \phi \colon A \to B と素イデアル  m \in  \mathrm{Spec} (B)に対して, \phi^{-1} (m) A の素イデアル

証明. B/m は整域である.よって, \pi \colon B \to B/m とおいて, \pi \circ \phi \colon A \to B/m の像は整域である.つまり, A/ \mathrm{ker} (\pi \circ \phi) \simeq A / \phi^{-1} (m) は整域である.よって, \phi^{-1} (m) A の素イデアルである. \square

実はすでにこの事実を使っている場所が一箇所あるのだが流れを重視してこの事実を説明していなかった.ともかく,  \mathrm{Spec} A を点と考えれば,代数の議論を多様体の議論に持っていけそうだ.  \mathrm{Spec} A の位相の定義は  \mathrm{mSpec} A の場合と全く同じである. Aイデアルに対して,代数的集合を

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ m \in \mathrm{Spec} A \mid  I \subset m \}
と定義すればよい.もちろんこれで位相が定まる.ここからは  \mathrm{Spec} Aアファイン代数多様体と呼ぶことにする.

命題( \mathrm{Spec} AのZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = \mathrm{Spec} A ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )

こうすれば状況は極大イデアルの場合と全く同じになる.

命題
 k 代数 A, B準同型写像  \phi \colon A \to B 考える. \phi^* \colon \mathrm{Spec B} \to \mathrm{Spec} A連続写像である.


このように,代数の議論をアファイン多様体の議論に持っていくためには,点は極大イデアルではなく素イデアルにする必要がある.これが,素イデアルを点と考える理由(の一つ)である.


ここで,素朴な点の代わりに極大イデアルを点と考えたときと一般化の仕方が違うことに注意しよう.例えば,多項式環  k [ \bar{X} ] では, k^N \subset \mathrm{mSpec} ( k [ \bar{X} ] ) \subset \bar{k}^N であり,特に  k代数的閉体の場合には点と極大イデアルが完全に一致したのであった.しかし,多項式環のところで述べたとおり,素イデアルに対応するのは既約な代数多様体である.つまり,素イデアルを点とみるのは,素朴な点に限らず点の集まりがなす図形をも"点"だと思うということである.特に,k代数的閉体であっても  \mathrm{Spec} A k^N よりも真に大きいものになる.素朴な点はいつでも既約なので,その意味では素イデアルは確かに一般化になっているのであるが,極大イデアルを点と思うときとは違い,素朴な点と素イデアルは一致しないのである.

イデアル空間の中での極大イデアル


これでこの記事の目標は達成されたのではあるが,最後に素イデアルを点と見たときの極大イデアルの意味を考えることにする.

命題
 A を有限生成 k 代数とする*2. このとき,位相空間 X の開集合のなす集合を  \mathcal{O} (X) と表すとき,写像
 \displaystyle
\qquad \tau \colon \mathcal{O} (\mathrm{Spec (A)} ) \to  \mathcal{O} (\mathrm{mSpec (A)} ) \colon U \to U \cap \mathrm{mSpec} (A)
全単射である.つまり, \mathrm{Spec (A)} の位相は  \mathrm{mSpec (A)} の位相で復元できる.

証明.  \square

証明はしないが,アファイン多様体とその間の射をちゃんと定義した k 上のアファインスキーム を使えば, k 代数の圏 ( k-alg) と k 上のスキームの圏 (Aff.Sch / k ) は双対圏である.

定理
( k-alg) と (Aff.Sch / k ) は双対圏である.特に,射の同型
 
\qquad \mathrm{Hom}_{k- \mathrm{alg} } (A, B) \simeq \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} B, \mathrm{Spec} A)
が存在する.

命題
 k代数的閉体とし, A を有限生成  k 代数とする.写像

\qquad \displaystyle \sigma \colon \mathrm{Hom}_{k-\mathrm{alg}} (A, k) \to \mathrm{mSpec} (A) \colon \alpha \to \mathrm{Ker} \alpha
全単射である.

証明.(単射性) \alpha \in \mathrm{Hom}_{k-\mathrm{alg}} (A, k) は前者なので, A / \mathrm{Ker} \alpha \simeq k となり  M := \mathrm{Ker} \alpha は極大イデアルである. f \in A とし, [f ]_M = a \in k とすると, f - a\cdot 1 \in M であり, \alpha を作用させれば, \alpha(f) = a が分かる.よって, \alpha(f) = [f ]_M である.これにより, \tau(\alpha) = \tau (\beta), つまり, \mathrm{Ker} \alpha = \mathrm{Ker} \beta = M ならば,任意の  f \in A \alpha (f) = \beta (f) となる.つまり, \alpha = \beta

全射性) M \in \mathrm{mSpec} A とする. R/M \simeq k より 写像  \alpha \colon R \to k が得られる.よって  \sigma全射である.  \square

この定理と命題により, k代数的閉体かつ A が有限生成であれば,

\qquad \displaystyle \mathrm{mSpec} A \simeq  \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} k, \mathrm{Spec} A)
が成り立つ.右辺は素イデアルで幾何を考えたときの射であり,このように素イデアルで考えても極大イデアルが復元できる.ここで  k を一般化することで他の視点で点を定義できる.

定義
k 代数 Ak 代数  R に対して,多様体 X = \mathrm{Spec} A  R X (R)

\qquad \displaystyle X (R) := \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} R, \mathrm{Spec} A) \simeq \mathrm{Hom}_{k-\mathrm{alg}} (A, R)
で定める.

上で述べたことは, X(k) \simeq \mathrm{mSpec} A と書くことができる.


最後に  k代数的閉体でないときの  R 点を具体例で見てみる.

 k = \mathbb{Q} として, k 代数  A = \mathbb{Q} [X] / (X^2 + 1) を考える. X = \mathrm{Spec} A とする. X( \mathbb{Q} ), X(\mathbb{R} )空集合である.なぜなら, \alpha \in X( \mathbb{Q} ) = \mathrm{Hom}_{k-\mathrm{alg}} (A, \mathbb{Q}) (または  X(\mathbb{R} ))とすると, X^2 + 1 = 0 より  \alpha(X)^2 + 1 = 0 となるが, \mathbb{Q}(または  \mathbb{R})にはそのような \alpha(X) が存在しない.一方, \alpha (X) = \sqrt{-1}, -\sqrt{-1} と定めればそのような準同型写像が存在するので  X (\mathbb{C}) 2 つの元を持つ.
(補足.体の素イデアル (0) だけなので, \mathrm{Spec} \mathbb{C} から  \mathrm{Spec} ( \mathbb{Q} [X] / (X^2 + 1) ) への連続写像 1 つだけであり,   \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} R, \mathrm{Spec} A) の元が  2 つというのは奇妙に思われるかもしれない.ここがちゃんと言っていないところで,多様体間の射は連続写像と空間の上の環の準同型写像のペアだからである.連続写像だけではだめな( \mathrm{Hom}_{k- \mathrm{alg} } (A, B) \simeq \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} B, \mathrm{Spec} A) が成り立たない )ことはこの例からも分かる.)

この記事を書いて思ったこと

ある程度目処をつけてからこの記事を書いたんだけども,書きながら色々気がついたことがあった.可換環 k 代数の違い,もっと言えば  k 代数の良さである. k 代数 A を考えているとき,体 k がその中に常に入っている.体は(環と比べれば) 単純なので,その内部の単純さが  A の性質に反映させることができる.有限生成の時には如実にそういう考え方が生きていた.では有限生成でない場合にはどうなのかという話があるが,有限生成でない代数の良さは今回は現れなかった.あと,今回の問題意識での層の価値(コホモロジーとかは置いといて)が分かってなかったけど,ちょっと分かってきた.これについてはまた記事を書くかもしれない.

*1:この点をちゃんと説明している記述が『プリンストン数学大全』のエレンバーグによる「数論幾何学」の項目にあったので引用しておこう。話のレベルがここでの話と少しズレがあるが私が文句言っている点についてちゃんと説明している。"(すべてではないが)いくつかの環が幾何的対象(多様体)から生じることが分かっている.そして,これらの多様体は,これらの特別な環の代数的な性質により記述できることが知っている.では単に,すべての環 RR の代数的性質で定まる幾何学を持つ「幾何的対象」であると考えればよいのではないだろうか?"

*2:有限生成でなくてもジャコブソン環であれば良い

単独高階微分方程式の連立一階微分方程式への変形について


単独高階線形微分方程式を一階の連立微分方程式に変形する方法は有名です.一方,逆に連立方程式を単独高階方程式に直せることが知られています.この事実は時々説明されることはあるものの証明が書かれていることはほとんどないです.


そこで巡回ベクトルを用いた証明のpdfを書きました.証明には微分加群を用いています.微分加群圏論的に微分ガロア理論を捉える時の基本的な対象でもあります.

drive.google.com

新年の抱負2019


新年あけましておめでとうございます。
今更ですね。
ちょっとごちゃごちゃしてたので、新年の抱負をこのタイミングで書いておきます。


去年の抱負は「趣味を楽しむ余裕を持ちながら、やるべきことをやっていく」でした。けっこう達成できたのではないかと思います。
たくさん新しいこともできましたし、面白いイベントもできましたしね。
ちなみに、去年のブログで書いていた今後ブログで書きたいことというのは全然できませんでした...まあ書きたい気持ちはありますが、単になかなか書き進められないだけなのでいいでしょう.飽きたわけではないです。


さて、2019年の抱負は「計画を立てて結果を出していく」です。気ままにいろんなことをやっていますが、やりたいことを全部やるにはちゃんと計画を立てなければ無理そうなので。


とりあえずやりたいのは
(1) gitで公表できるレベルのArduboyゲームを作る
(2) 科学哲学の同人誌的なもの
です。

理想的な物理理論としての電磁気学

この記事は以下の一連の記事の最終回ですが,今回の内容が目標だったので,できるだけこれまでの記事を読まなくても理解できるように説明していく.
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com

今回使う知識

これまで説明したことで,今回使うものを復習する.ただし, c = 1, \hbar = 1, \mu_0 = 1 として書き直している.以下ではアインシュタインの規約を用いている.

(電磁場のマクスウェル方程式
ポテンシャル  A^\mu = (\phi, A_x, A_y, A_z) に対して
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおくと,電磁場のラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
であり,そのオイラーラグランジュ方程式としてマクスウェル方程式

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} = j^{\nu}
を得る.任意の関数  \chi に対して定義されるゲージ変換

\qquad
\displaystyle
A^\mu \rightarrow A^\mu + \partial^\mu \chi
により,作用(ラグランジアン密度の積分)は不変である.

(自由空間におけるDirac方程式)
自由空間におけるDirac方程式のラグランジアン密度は

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
であり,Dirac方程式は

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
である.

ここで, \gamma^\mu は行列であり,また,ある行列  \beta を用いて

\qquad
\displaystyle
\bar{\psi} = \psi^{\dagger} \beta = {\psi^*}^{\mathrm{T} } \beta
としているが,これらの行列が具体的にどのようなものであるかは今回の内容に影響しない.

ゲージ共変性による電磁場の導入


上で述べたのは自由空間のDirac方程式である.つまり,外力が働かないときに,純粋に量子力学的な効果だけを見ている方程式である.電子に電場による外力がかかったときの方程式は,ハミルトニアン正準量子化で電磁場を含んだ方程式を導くことができるが,一旦電磁場のことを忘れて別の視点から電磁場が自然に現れることをみる.


Dirac方程式のラグランジアン密度

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
を考える.このとき,定数 \theta を用いて,

\qquad
\displaystyle
\psi \rightarrow e^{-i \theta} \psi
と変換しても,ラグランジアン密度は変化しない.なぜなら,真ん中の項の微分や行列は関係なくて実質  \bar{\psi}  \psi の形なので,上の変換で  \bar{\psi}  \psi \rightarrow \bar{\psi}  e^{i \theta} e^{-i \theta} \psi = \bar{\psi}  \psi となるからである.これを大域的なゲージ変換という.変換をさらに一般化して,定数  q (これは  1 でも良い)と関数  \chi を用いた変換

\qquad
\displaystyle
\psi \rightarrow e^{-i q \chi} \psi
ラグランジアン密度が不変になるようにするにはどうすればいいかを考える.このままでは,Dirac方程式の真ん中の項の微分があるため不変にならないのであるが,計算すると

\qquad
\displaystyle
\begin{align}
 \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi & \rightarrow \bar{\psi} e^{i q \chi} (i \gamma^\mu \partial_\mu - m) e^{-i q \chi} \psi \\
&=  \bar{\psi} e^{i q \chi} e^{-i q \chi} (i \gamma^\mu \partial_\mu - m) \psi + \bar{\psi} e^{i q \chi} i  \gamma^\mu   (- i q e^{-i q \chi} \partial_\mu \chi )  \psi \\
&=  \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi + \bar{\psi} q \gamma^\mu   (\partial_\mu \chi)  \psi
\end{align}
となるので, \bar{\psi} q \gamma^\mu   (\partial_\mu \chi)  \psi という余分な項が出てきてしまう.そこで,(電磁場のことはとりあえず忘れて) A^\mu という場で

\qquad
\displaystyle
A^\mu \rightarrow A^\mu + \partial^\mu \chi
と変化するものを考えて,Dirac方程式の  i \gamma^\mu \partial_\mu の項を  \gamma^\mu ( i \partial_\mu - q A_\mu) と書き換えたラグランジアン

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi
\end{align}
を考える.そうすると,上の変換で,

\qquad
\displaystyle
\begin{align}
 \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi & \rightarrow  \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi +  \bar{\psi}  \gamma^\mu (  q \partial_\mu \chi - q \partial_\mu \chi ) \psi \\
&= \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi
\end{align}
となり,ラグランジアンは不変になる.このような変換

\qquad
\displaystyle
\psi \rightarrow e^{-i q \chi} \psi
を局所的なゲージ変換という.それは, \chi が関数のため,時空間に依存して変化が変わるからである.ゲージ変換というときにはこの局所的なゲージ変換を指すことが多い.


上のラグランジアンでは,A^\mu の運動の情報が入っていないため,それを表すために,例えば
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおいて,ラグランジアン密度を

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu \\
&= \bar{\psi} i \gamma^\mu   \partial_\mu  - m) \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - ( j^{\mu} + q  \bar{\psi} \gamma^\mu \psi ) A_\mu
\end{align}
と考える.ここで  F_{\mu \nu} F^{\mu \nu} j^{\mu} A_\mu の添加のみを考えた理由は後で説明する.すると, \bar{\psi}オイラーラグランジュ方程式を考えれば,Dirac方程式を変形した

\qquad
\displaystyle
[ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi = 0
を得る.また, A^\muオイラーラグランジュ方程式を考えればマクスウェル方程式を変形した

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} =  j^{\mu} + q  \bar{\psi} \gamma^\mu \psi
を得る.


ここで,電磁場のポテンシャルのゲージ変換は  A^\mu \rightarrow A^\mu + \partial^\mu \chi となることを知っているので,上で必要となった  A^\mu は電磁場のポテンシャルではないかと期待できる.実際に,外部電磁場の中を電荷  q で運動する 1 粒子のハミルトニアンから方程式を計算すれば,

\qquad
\displaystyle
[ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi = 0
となることが分かる.電流  j^\mu はもちろん電子の動きを表しているため,電磁場の下で動く 1 粒子の影響が電流としても合わられるはずである.実際,マクスウェル方程式

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} =  j^{\mu} + q  \bar{\psi} \gamma^\mu \psi
となった.つまり,粒子  \psi からは  q  \bar{\psi} \gamma^\mu \psi の分が電流密度として反映される.


Dirac方程式の(局所的)ゲージ共変性から電磁場のポテンシャルと同じ変換がなされる場  A^\mu が現れることを導いたが,先歴史的には先に方程式があって,それがゲージ共変性をもっていたという流れのはずである.しかし,今回述べたように,電子の相互作用を表すために電磁場が必要となるという見方ができる.そのように見れば,相互作用する粒子一般に対して,電磁場のような相互作用を表すための場が必要になるという予想を立てることができる.


ただし,そのように見るには,本当にこの見方が電磁場においても正しいかということを考える必要がある.例えば, A^{\mu} の運動を表すために,なぜ  F_{\mu \nu} F^{\mu \nu} j^{\mu} A_\mu の項のみを考えて他の項は考えなかったのかを正当化しなければならない.まず,最終的なラグランジアン密度はゲージ不変でなければならない.F_{\mu \nu} F^{\mu \nu} A^\mu微分  \partial^\mu A^\nu で定義されており,偏微分の交換可能性からゲージ変換でも不変になるのであった.また, j^{\mu} A_\mu電荷の保存則  j^{\mu} \partial_\mu = 0 が作用の不変性を表すのであった.それ以外の項として例えば
 A_\mu A^\mu を考えると,ゲージ変換によって

\qquad
\displaystyle
\begin{align}
A_\mu A^\mu &\rightarrow (A_\mu + \partial_\mu \chi) ( A^\mu + \partial^\mu \chi) \\
&= A_\mu A^\mu + (\partial_\mu \chi ) A^\mu + A_\mu (\partial^\mu \chi) + (\partial_\mu \chi) (\partial^\mu \chi)
\end{align}
となり,一般にはゲージ変換で不変ではない.粒子の場合は,微分を取らないものの積は  m \bar{\psi} \psi の形で入っており,この項は質量を表していた.よって, A_\mu A^\mu のような微分を取らないものの積を質量項という.上で見たように,質量項があるとゲージ不変とはならないため,粒子の相互作用を表すために導入した場  A^\mu は質量を持たないと期待される.よって,ゲージ不変性を考えると  A^{\mu} の運動を表すために添加していい項は限られてくることが分かる.

粒子の相互作用を担う場を与える描像とその後の発展


前節の内容を一般化することで,相互作用する粒子に対して場が必要となる流れが定式化できたことになる.

(1) ある粒子のラグランジアンを考え,適当なゲージ変換を考える

(2) ゲージ変換のズレを消去するための項を生み出すような場を導入する

(3) ゲージ変換で不変になる程度に場の運動を表す項を添加する

もし現実がこの通りになっているのなら,相互作用を表す場は質量がないことが予想される.


さて,今回の内容がその後の素粒子理論の出発点となる.(以下は私が理解できているわけではありません)

(i) Dirac方程式は負のエネルギーの問題が出る.それは場を量子化する,つまり,A^\mu などの場を演算子と考えることで解決される.このような理論を量子場の理論という.(これまでの内容は古典場の理論.)電磁場の下でのDirac方程式を量子化すれば,量子電磁力学(QED)になる.相互作用を担う場は質量のないボーズ粒子によってなされることになる.例えば,光子の質量は 0である.

(ii) 上の流れ通りであれば,相互作用を担うボーズ粒子は質量がないはずであるが,実際にはそうではない.そこで,質量を得るための説明が必要となる.それがヒッグス機構であり,自発的対称性の破れからヒッグス場との相互作用により質量を得るという説明をする.

素粒子理論についての解説として
  ピーター・ウォイト『ストリング理論は科学か』
をオススメする.数式をほとんど使わなくても,かなり高度なことまで説明している.特に,最初に加速器実験についてかなり詳しく説明しており,この分野の感覚や実験で何が分かるのかといったことも教えてくれる.

共変微分

ゲージ変換の不変性を持たせるために場を導入したが,もう少し違う見方をする.ゲージ変換で不変になるために,微分   i \partial_\mu  i \partial_\mu - q A_\mu に書き換える必要があった.変更後はゲージ変換で不変になるような微分だと見ることができるので, \mathbb{D}_\mu = i \partial_\mu - q A_\mu とおき,これを共変微分と呼ぶ.つまりラグランジアンはゲージ変換で不変となる項のみで書かれているので明らかにゲージ不変になるという見方ができる.

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \bar{\psi} [ \gamma^\mu ( \mathbb{D}_\mu - m)] \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
\end{align}
実質的にはこれまでの説明と同じではあるが気持ちがずいぶん違う.これまでの説明は,不変になるように補正項を加えるというニュアンスであった.一方でこの説明は,登場するものが全てゲージ不変になるように,特に,微分を共変微分に書き換える,という説明である.その視点で見ると,電磁場とは,共変微分で普通の微分には現れないズレの項なのである.

理想的な物理理論としての電磁気学(4)

以下の記事の続きです.
tetobourbaki.hatenablog.com

一連の記事の目的としては,あとはゲージ変換やゲージ不変性について説明すれば終わりです.参考にしている牟田『電磁気学』では非相対論的な電子の場を使って議論をしているため,これと同じ説明をすると流れが悪くなってしまいます.そこで,この記事ではDirac方程式を説明することにします.ただし, c = 1,\, \hbar = 1 となる単位系をとることにします.

Dirac方程式


再度注意するが, c = 1,\, \hbar = 1 となる単位系を取って議論する.よって,\displaystyle \partial_0 = \frac{\partial}{\partial (ct)} = \frac{\partial}{\partial t} となっている.Dirac方程式を一から説明するのは大変なので,大きく端折る.シュレディンガー方程式特殊相対性理論と整合性があるように変形した以下のものが自由空間におけるDirac方程式である.

\qquad
\displaystyle
i \frac{\partial \psi}{\partial t} +i  \sum_{j=1}^3 \alpha^j \frac{\partial \psi}{\partial x^j} - m \beta \psi = 0
ここで,いくつも注意することがある.まず, \alpha^1, \alpha^2, \alpha^3, \beta 4 \times 4 の行列である.なので, \psi は 4成分のベクトルであり,Dirac方程式は 4連立の方程式になっている.次に, \alpha^1, \alpha^2, \alpha^3, \beta は以下の性質を満たす行列である.

\qquad
\displaystyle
\begin{align}
&\beta^2 = E_4 \\
&\alpha^j \beta + \beta \alpha^j = 0 \\
&\alpha^j \alpha^k + \alpha^k \alpha^j = 2 \delta^{kj} E_4
\end{align}
ここで,単位行列 E_n で表している.ここで,パウリ行列

\qquad
\displaystyle
\sigma_1 =
\left(
\begin{matrix}
0 & 1\\
1 & 0
\end{matrix}
\right), \quad
\sigma_2 = 
\left(
\begin{matrix}
0 & -i \\
i & 0
\end{matrix}
\right),
\quad
\sigma_3 = 
\left(
\begin{matrix}
1&0 \\
0& -1
\end{matrix}
\right)
を用いて,

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
0 & \sigma_k \\
\sigma_k & 0
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
E_2 & 0 \\
0 & -E_2
\end{matrix}
\right)
とおけば,満たすべき性質を満たしている. \alpha^1, \alpha^2, \alpha^3, \beta は他の取り方をとっても良い.


Dirac方程式に  \beta をかけて,\gamma^0 = \beta,  \gamma^{j} = \beta \alpha^j とおけば,

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
と書くことができる.次に,Dirac方程式をラグランジアン密度の場の方程式として書くことを考える.以前は実数の変数を考えていたが,\psi は複素値なので,実部と虚部を独立の変数と考えて変分法を使うことができる.*1しかし,それはちょっと面倒である.実は  \psi の実部と虚部の代わりに, \psi複素共役  \psi^* を独立の変数と考えて変分法を使っても良いことが知られている.そこで, \psi^{\dagger} = (\psi^*)^{\mathrm{T}}, \bar{\psi} = \psi^\dagger \beta とおき,ラグランジアン密度を

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \psi^\dagger ( i \partial_0 +  \alpha^{j} \partial_j - \beta m) \psi \\
&= \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
とおけば,( \psi^\dagger \bar{\psi} を変数としてオイラーラグランジュ方程式を計算すれば,)このラグランジアン密度からDirac方程式が得られる.

(自由空間におけるDirac方程式)
自由空間におけるDirac方程式のラグランジアン密度は

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
であり,Dirac方程式は

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
である.

Dirac方程式のローレンツ変換


ゲージ変換とは関係がないが,相対性理論との繋がりを知るために,ローレンツ変換との関係も述べておく.この節は飛ばしても次に進むことができる.計算を進めるために,上で述べたのと異なる行列  \alpha^1, \alpha^2, \alpha^3, \beta を取ろう.以下のような表示をカイラル表示という.

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right)
このとき,

\qquad
\displaystyle
\psi = \left(\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
とおけば,Dirac方程式は

\qquad \displaystyle
i \left(
\begin{matrix}
E_2 & 0 \\
0 & E_2
\end{matrix}
\right)
 \left(\begin{matrix}
\partial_0 \psi_{\mathrm{L}} \\
\partial_0 \psi_{\mathrm{R}}
\end{matrix}
\right)
+
 i
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
 \left(\begin{matrix}
\partial_j \psi_{\mathrm{L}} \\
\partial_j \psi_{\mathrm{R}}
\end{matrix}
\right)
 - m
 \left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right)
 \left(
\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
= 0
つまり,Dirac方程式は 2連立方程式
 \displaystyle
\qquad
\begin{align}
 i E_2 \partial_0 \psi_{\mathrm{L}} - i \sigma^j \partial_j \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\
 i E_2 \partial_0 \psi_{\mathrm{R}} + i \sigma^j \partial_j \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
で書ける.よって,

\displaystyle
\qquad
\sigma^{\mu} = (E_2, \sigma^1, \sigma^2, \sigma^3),\quad  \tilde{\sigma}^{\mu} = (E_2, -\sigma^1, -\sigma^2, -\sigma^3)
とおけば,Dirac方程式は

\displaystyle
\qquad
\begin{align}
 i \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\ 
 i \sigma^\mu \partial_\mu \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
と書ける.

Dirac方程式のカイラル表示)

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right),
\quad
\psi = \left(\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
とおけば,ラグランジュ密度が

\qquad
\displaystyle
\mathcal{L} = i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
であり,Dirac方程式が

\displaystyle
\qquad
\begin{align}
 i \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\ 
 i \sigma^\mu \partial_\mu \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
と書ける.


時空間  x^\mu が以下のようにローレンツ変換しているとする.

\qquad
\displaystyle
{x^{\mu} } ' = a^{\mu}_{\ \ \nu} x^{\nu}
このとき,

\qquad
\displaystyle
\partial_{\mu}  = a^{\nu}_{\ \ \mu} {\partial_{\mu}}'
に注意する.場  \psi_{\mathrm{L}}, \psi_{\mathrm{R}}

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
と変化すると仮定すると,ラグランジアンローレンツ変換で不変とすれば,

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= i { {\psi_{\mathrm{L} } }' }^\dagger \tilde{\sigma}^\mu {\partial_\mu}' {\psi_{\mathrm{L} }}'+ I { {\psi_{\mathrm{R} }}' }^\dagger \sigma^\mu {\partial_\mu}' {\psi_{\mathrm{R} } }' - m ({{\psi_{\mathrm{L} } }' }^{\dagger} { \psi_{\mathrm{R}} }' + { {\psi_{\mathrm{R} } }' }^{\dagger} {\psi_{\mathrm{L} } }' ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \mathbb{M}^{\dagger} \tilde{\sigma}^\mu {\partial_\mu}' \mathbb{M} \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \mathbb{N}^{\dagger} \sigma^\mu {\partial_\mu}' \mathbb{N} \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \mathbb{M}^{\dagger} \mathbb{N}  \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \mathbb{N}^{\dagger} \mathbb{M} \psi_{\mathrm{L} } ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} {\partial_\mu}'  \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \mathbb{N}^{\dagger} \sigma^\mu  \mathbb{N} {\partial_\mu}' \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \mathbb{M}^{\dagger} \mathbb{N}  \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \mathbb{N}^{\dagger} \mathbb{M} \psi_{\mathrm{L} } ) \\
\mathcal{L} &=  i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\nu a^{\mu}_{\ \ \nu} {\partial_\mu}' \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\nu a^{\mu}_{\ \ \nu} {\partial_\mu}' \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
\end{align}
となるから,

\qquad 
\displaystyle
\begin{align}
& \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} = a^{\mu}_{\ \ \nu} { \tilde{\sigma} }^\mu \\
& \mathbb{N}^{\dagger} \sigma^\mu \mathbb{N} = a^{\mu}_{\ \ \nu} {\sigma}^\mu \\
& \mathbb{M}^{\dagger} \mathbb{N} = E_2 \\
& \mathbb{N}^{\dagger} \mathbb{M} = E_2
\end{align}
となっている必要がある.任意のローレンツ変換に対して,上のような行列  \mathbb{M}, \mathbb{N} が存在することが知られている.つまり,ラグランジアンが不変になるためには,場  \psi_{\mathrm{L}}, \psi_{\mathrm{R}}

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
と変換する必要があることがわかった.

Dirac方程式のローレンツ変換
カイラル表示したDirac 方程式のラグランジュ密度

\qquad
\displaystyle
\mathcal{L} = i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
ローレンツ変換

\qquad
\displaystyle
{x^{\mu} } ' = a^{\mu}_{\ \ \nu} x^{\nu}
に対して

\qquad 
\displaystyle
\begin{align}
& \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} = a^{\mu}_{\ \ \nu} { \tilde{\sigma} }^\mu \\
& \mathbb{N}^{\dagger} \sigma^\mu \mathbb{N} = a^{\mu}_{\ \ \nu} {\sigma}^\mu \\
& \mathbb{M}^{\dagger} \mathbb{N} = E_2 \\
& \mathbb{N}^{\dagger} \mathbb{M} = E_2
\end{align}
を満たす場の変換

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
によって不変である.

電磁気の場合と同じように,ローレンツ不変になるように物理量の変換を自分で決めるという仕組みになっている.

*1:本当はラグランジアンがエルミートで変分が実数値でなければいけないが,この問題を今回は無視する.