記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

可約な場合の超幾何方程式の解について


本記事では以下の定理を示す.

(定理)
 \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく. \pm \alpha \pm \beta \pm \gamma の 1 つが奇数ならば

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
は初等関数とその積分で書ける.

これは方程式が可約のとき,方程式が解けることを意味する.特殊な場合として,可約な場合の超幾何方程式も解ける.もっと言えば,超幾何方程式に帰着させてこの定理は証明される.証明を追えば,解の求め方も知ることができる.


参考文献は
[1] 河野実彦,微分方程式と数式処理
[2] 福原,大橋,初等関数で表せるRiemannのP函数の決定について
[3] Kimura, On Riemann's Equations which are Solvable by Quadratures
である.木村の定理やSchwartzによる代数解のリストについて書いた文章はネットにも結構あるが,それよりも簡単な場合の可約な場合についての解説がなかなかないと思ったのでまとめておく.


一つ注意として,文献 [1] [2] は初等関数と積分を用いて表されるものを単に初等関数と呼んでいるが,初等関数のクラスでは積分は許さないことが多い.実際,\int e^{-x^2} dx が初等関数で書けないことは有名であるが,初等関数に積分を許すと,これが意味をなさないことになる.

基礎知識


有理関数を係数に持つ  2 階の線形微分方程式を考える.特に,3 点を確定特異点に持つフックス型の微分方程式を考える.簡単のため,特異点の一つは  \infty とする.ここで用いた用語の解説は省略するが,(1) 特異点ごとに特性指数と呼ばれる 2 つの数が定まる (2) 特異点3 つの場合それらの確定特異点で方程式が完全に決定する,の 2 つを受け入れていただければ,後の議論は理解できる.


例えば, x = a の特性指数を  \lambda, \lambda' x = b の特性指数を  \mu, \mu' x = \infty の特性指数を  \nu, \nu' とすれば,微分方程式

\displaystyle
\qquad
x'' = \frac{c_0 + c_1 t}{(t- a) ( t - b)} x' + \frac{d_0 + d_1 t + d_2 t^2}{(t-a)^2 (t-b)^2}, \\
\quad c_0 = - (\lambda + \lambda' - 1) b - (\mu + \mu' - 1) a, \quad c_1 = - (\nu + \nu' + 1) \\
\quad d_0 = (a-b) b \lambda \lambda' + (b-a) a \mu \mu' - ab \nu \nu', \\
\quad d_1 = (b-a) \lambda \lambda' + (a- b) \mu \mu' + (a+b) \nu \nu', \quad d_2 = - \nu \nu'
となる.(確定特異点と特性指数の定義が分かれば簡単に計算ができる.)決定された方程式を見れば分かるように,各特異点の特性指数の順序は交換しても良い.(例えば, \lambda \lambda' を変えてもよい.)特性指数で方程式が決まるので,この方程式の解の集合を

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
と表す.これをRiemannの  \wp 関数と呼ぶ.ただし,特性指数の和は必ず 1 になる,つまり  \lambda + \lambda' + \mu + \mu' + \nu + \nu' = 1 となるので全てを自由に取れるわけではない.独立変数の変換  \tau = (t - a)/(b-a) により,

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
=
\wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
\lambda & \mu & \nu &; \tau \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
となる.つまり,特異点 0, 1, \infty に固定してよい.さらに, y = (t- a)^{-\lambda} (t - b)^{\mu} x と従属変数の変換をすれば,
 \qquad 
\displaystyle
y =(t- a)^{-\lambda} (t - b)^{\mu} \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
=\wp \left\{
\begin{matrix}
a & b & \infty & \\
0 & 0 & \nu + \lambda + \mu&; t \\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \nu & 
\end{matrix}
\right\}
と変換することができる.(普通に変数変換すれば分かる.)つまり, t = a, b のそれぞれの特性指数の  1 つを  0 にすることができる.特性指数の和が 1 になることに注意すれば,微分方程式を決定する本質的な特性指数の個数は 3 つである.ここで,変換  y = (t- a)^{-\lambda} (t - b)^{\mu} x により,特性指数の差  \lambda' - \lambda, \mu' - \mu, \nu' - \nu も不変になっていることに注意せよ.ここで用いた独立変数と従属変数の変換を用い,定数を書き換えると,考えている全ての方程式は以下の  \wp 関数に帰着される.
 
\displaystyle
\qquad
\wp \left\{
\begin{matrix}
a & b & \infty & \\
0& 0 & a &; t \\
1 - c & c - a - b & b & 
\end{matrix}
\right\}
これが満たす方程式が超幾何方程式と呼ばれる以下の方程式である.

\displaystyle
\qquad
t ( 1-t) x'' + \{ c - ( a + b + 1) t \} y' - ab y = 0

可約性


 2 階の有理係数の線形微分方程式において, 0 でない解  x 1 階の有理係数の方程式  x' = r(t) x の解になっているとき,方程式は可約であるという.今考えているような 3 つの確定特異点を持つ 2 階の方程式に対しては以下の同値性が知られている.

(命題)

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
を解に持つ方程式を考える.また,特性指数の差を  \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく.このとき,以下が同値,
(1) 方程式は可約である.
(2) 以下の 8 つの数
  \qquad \alpha+ \beta + \gamma, -\alpha + \beta + \gamma,\alpha- \beta + \gamma, \alpha+ \beta - \gamma,\\
  \qquad -\alpha - \beta + \gamma,  -\alpha+ \beta - \gamma, \alpha- \beta - \gamma, -\alpha- \beta - \gamma
 のいずれかが奇数.
(3) 以下の 8 つの数
 \qquad \lambda + \mu + \nu, \lambda' + \mu + \nu,\lambda + \mu' + \nu,\lambda + \mu + \nu'\\
\qquad \lambda' + \mu' + \nu, \lambda' + \mu + \nu',\lambda + \mu' + \nu',\lambda' + \mu' + \nu'
 のいずれかが整数.

条件(3)で 8 つの数を見なければいけないのは,特性指数の順番を変えても方程式は変わらないことに由来する.このことは特性指数の差で言えば,正負を変えても方程式は変わらないことを意味し,(2) も 8つの数を見なければいけないことになる.

証明.(2) ならば (3) であること.奇数となる組みに対し, \lambda + \lambda' + \mu + \mu' + \nu + \nu' = 1 の式を加えれば (3) が示せる.

(3) ならば (2) であること.整数となるペアに対し, \frac{1}{2} (\lambda + \lambda' + \mu + \mu' + \nu + \nu') = \frac{1}{2} を引けば (2) が示せる.

(1)との同値性はそのうち示す. \square

定理の証明


補題を証明した後,示したかった定理を示す.

補題
 
\displaystyle \qquad  x = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu'& ;t \\
\lambda & \mu & \nu & 
\end{matrix}
\right\}
のとき、

\displaystyle \qquad  x' = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu' + 1& ;t \\
\lambda - 1 & \mu -1 & \nu + 1 & 
\end{matrix}
\right\}
となる.

証明.定数をおき直して,超幾何方程式の定数の取り方
 
\displaystyle \qquad  x = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \alpha& ;t \\
1-\gamma & \gamma - \alpha -\beta & \beta & 
\end{matrix}
\right\}
に対して証明する.このときの方程式は

\displaystyle
\qquad 
  t(1-t) x'' + \left\{ \gamma - ( \alpha + \beta + 1) t \right\} x' - \alpha \beta x= 0
である.これを微分すると,

\displaystyle
\qquad 
  t(1-t) x''' + \left\{ (1+\gamma) - [ \alpha+1 + \beta+1 + 1] t \right\} x'' - (\alpha+1) (\beta+1) x' = 0
となる.よって,
 
\displaystyle \qquad  x' = \wp
\left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \alpha + 1& ;t \\
 - \gamma & \gamma - \alpha -\beta - 1& \beta + 1& 
\end{matrix}
\right\}
となる. \square


補題

\displaystyle
\qquad 
\wp 
\left\{
\begin{matrix}
 a & b & \infty & \\
0 & 0 & 0& ;t \\
 \lambda & \mu& \nu& 
\end{matrix}
\right\}
=
\left\{ C_1 + C_2 \int^t  (s-a)^{\lambda - 1} (s-b)^{\mu - 1} ds \mid C_1, C_2 \in \mathbb{C} \right\}

証明.
\displaystyle
\qquad 
\wp 
\left\{
\begin{matrix}
 a & b & \infty & \\
0 & 0 & 0& ;t \\
 \lambda & \mu& \nu& 
\end{matrix}
\right\}
の満たす方程式は

\displaystyle 
\qquad
 x'' = \frac{ - ( \lambda - 1)b - ( \mu - 1) a - ( \nu + 1) t}{(t-a) (t - b)} x'
である.書き換えると

\displaystyle 
\qquad
 \frac{1}{x'} x'' = \frac{\lambda - 1}{t-a} + \frac{\mu - 1}{t-b}
となる.積分すると

\displaystyle
\qquad
\log x' = \log C_2 (t-a)^{\lambda - 1} (t-b)^{\mu - 1}
となるので、

\displaystyle
\qquad
 x' =  C_2 (t-a)^{\lambda - 1} (t-b)^{\mu - 1}
であり,積分すると

\displaystyle
\qquad
 x =  C_1 + C_2 \int^t (s-a)^{\lambda - 1} (s-b)^{\mu - 1} ds
となる. \square


(定理)
 \alpha = \lambda' - \lambda, \beta = \mu' - \mu, \gamma = \nu' - \nu とおく. \pm \alpha \pm \beta \pm \gamma の 1 つが奇数ならば

\displaystyle
\qquad
x = \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\}
は初等関数とその積分を使って書ける.

証明.変数変換  \tau = (t-a)/(b-a) により特異点 0 1 になるので,

\displaystyle
\qquad
( t - a)^{-\lambda} (t-b)^{-\mu} \wp \left\{
\begin{matrix}
a & b & \infty & \\
\lambda & \mu & \nu &; t \\
\lambda' & \mu' & \nu' & 
\end{matrix}
\right\} \\
= \wp \left\{
\begin{matrix}
a & b & \infty & \\
0 & 0 & \nu + \lambda + \mu &; t \\
\lambda' - \lambda & \mu' - \mu  & \nu' + \lambda + \mu & 
\end{matrix}
\right\} \\
= \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu + \lambda + \mu &; \tau \\
\lambda' - \lambda & \mu' - \mu  & \nu' + \lambda + \mu & 
\end{matrix}
\right\}
となる.よって,

\qquad
\displaystyle
y(\tau) = \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \nu + \lambda + \mu &; \tau \\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \mu & 
\end{matrix}
\right\} 
=
\wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & \rho &; \tau \\
\alpha & \beta& \gamma + \rho & 
\end{matrix}
\right\}, \\
\qquad \rho = \frac{1}{2} ( 1 - \alpha - \beta - \gamma)
が解ければよい.仮定により, \alpha + \beta + \gamma = 2n + 1, n \geq 0 としてよい.よって,

\displaystyle
\qquad  y = \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & -n &; \tau \\
\alpha & \beta& \gamma - n & 
\end{matrix}
\right\}
となり,補題により  n微分すれば,

\displaystyle
\qquad
y^{(n)} (\tau)=  \wp \left\{
\begin{matrix}
0 & 1 & \infty & \\
0 & 0 & 0&; \tau \\
\alpha - n & \beta - n& \gamma & 
\end{matrix}
\right\}
=
C_1 + C_2 \int^\tau s^{\alpha - n - 1} (s - 1)^{\beta - n -1} ds
となるから,これを積分することで,y は初等関数の積分で書くことができる.以上より,

\qquad \displaystyle
x = ( t - a)^{\lambda} (t-b)^{\mu} y\left( \frac{t - a}{a - b} \right)
と書くことができる. \square


最後に注意として, C_1 + C_2 \int^t s^{\alpha - n - 1} (s - 1)^{\beta - n -1} ds n積分の全てが  y ではないことに注意する.実際, n積分すると積分定数が合計  n + 2 個出てきてしまい,それらが一次独立であれば  y2 階の微分方程式の解であることに矛盾する.ここで言っているのはあくまで  y が少なくとも  C_1 + C_2 \int^t s^{\alpha - n - 1} (s - 1)^{\beta - n -1} dsn積分として書けるということだけである.

なぜ素イデアルを点と見るのか

代数幾何について最近ちょっとしっくりきたのでまとめておきます.タイトルでは素イデアルを挙げていますが,そこに至るまでを詳しく書きます.いろんな説明の仕方があると思いますが,幅広く議論する気はありません.アファインの場合だけを考えますし層の議論が出てこないような話を書きます.普通スキームと呼ばれるものを多様体と呼んでしまっているのでご注意ください.

この記事では, k は体を表します.また,環とは  1 を持つ可換環とします.記法として,列  (a_1, \dots, a_n) \bar{a} と表します.よって,多変数多項式環 k[\bar{X}] と表します. k 代数を考えるとき, k代数的閉体の場合を考えることが多いですが,そうでない場合も出てくるので, k の仮定はできるだけその都度書きます.調べればすぐにわかる用語は説明していないことがあります.
(もう少し証明を書き加える予定)

参考文献.問題意識は以下の微分ガロア理論の本の付録に基づいている.
van der Put, Singer, "Galois Theory of Linear Differential Equations"
また,
西宮正宣,『代数学2 -発展編-』
も参考にしている.
代数や環については以下を参考にしている.
堀田良之,『可換環と体』
Milne, "Commutative Algebra"

全体像

この記事では以下の表が成り立つような描像を目指していく.

座標環
 k[\bar{X}]  {k}^N
有限生成  k 代数 極大イデアル
 k 代数 イデアル

よって,環を考えるとき,普通は有限生成ではないので素イデアルを点と考える.

多変数多項式の場合


 k [X_1, \dots, X_N] = k [ \bar{X} ] の場合を復習する.代数幾何学とは多項式の零点を考える学問である. k [ \bar{X} ] イデアル  I に対して,その零点の集まりを  \mathcal{V} (I) と表す:

\qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid \forall f \in I, \, f(\bar{a} ) = 0\}
 V代数的集合であるとは,あるイデアル  I を用いて  V = \mathcal{V} (I) と書けるものをいう.つまり,代数的集合が代数幾何学の対象である.代数的集合の集まりは  k^N の位相を定めることが知られている.定まる位相はZariski位相と呼ばれる.つまり以下が成り立つ.

命題( k^N のZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = k^N ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )


ある幾何学的対象があるとき,その上の関数を考えるというのは重要である.例えば,微積分学は  \mathcal{R}^N 上の滑らかな関数や解析関数を考える.代数幾何は代数的な考察を行うので, k^N 上では単に多項式環  k[\bar{X}] を考えればよい.では,代数的集合上の関数はどのように定めればいいのか?  V \subset k^N を代数的集合とは限らない部分集合とする.多項式  f \in k[\bar{X} はもちろん  V の関数を定めるが,定義域  V が小さい時には  V の外の  f の値は関係ないので k[ \bar{X} ] は大きすぎるように思える.以下のように多項式の集合  \mathcal{I} (V) を定める:

\qquad \displaystyle \mathcal{I} (V) := \{ f \in k[ \bar{X} ] \mid \forall \bar{a} \in V, \, f( \bar{a} ) = 0 \}
この  \mathcal{I} (V)イデアルとなる.すると以下の命題が成り立つ.

命題
 V \subset k^N とする. f, g \in k [\bar{X} ] に対して以下が同値である.

(i)  f, g V 上の関数として同じ.つまり,全ての  \bar{a} \in V f(\bar{a} ) = g(\bar{a} );

(ii)  f - g \in \mathcal{I} (V)

つまり, V 上の関数は  k [\bar{X} ] の元を  \mathcal{I} (V) で同一視した  k [ \bar{X} ] /\mathcal{I} (V) であるということが分かった. k [ \bar{X} ] / \mathcal{I} (V)  V座標環という.


Zariski位相は非常に粗いことが特徴的である. V \subset k^n既約であるとは,閉集合  U_1, U_2 を用いて  V = U_1 \cup U_2 と書けるなら  V = U_1 または  V = U_2 が成り立つことをいう.つまり,既約とは(共通部分を持っていてもよい)二つの閉集合に分解できないことをいう.こんなことはユークリッド空間の普通の位相ではほとんど起こらず役に立つ概念ではないが,Zariski位相が粗いために便利な概念である.


以上のことをまとめると,イデアル  I多項式の集まり)から代数的集合  \mathcal{V} (I) が定まった.一方,点の集まり V からはイデアル  \mathcal{I} (V) が定まる.このように,環のイデアルと点の集まりが対応している.実はこの対応により,イデアルと図形の性質が対応する.

定理

 \mathcal{V} \colon \{ k [\bar{X}] \text{のイデアル} \} \to \{ k^N \text{の部分集合} \}  \mathcal{I} \colon \{ k^N \mathrm{の部分集合} \}  \to \{ k [\bar{X}] \text{のイデアル}  \} に対して以下が成り立つ.

(i)  V \subset k^Nに対して, \mathcal{I} (V) は根基イデアルであり, V \subset \mathcal{V} (\mathcal{I} (V) )
イデアル  I \in k[\bar{X} ] に対して, \mathcal{V} (I) は代数的集合であり,  I \subset \mathcal{I} ( \mathcal{V} (I) );

(ii)  V が代数的集合ならば  V = \mathcal{V} (\mathcal{I} (V) ) であり, I が根基イデアルならば  I = \mathcal{I} ( \mathcal{V} (I) ).つまり,代数的集合と根基イデアル \mathcal{V}, \mathcal{I} により一対一に対応する.

(iii) 代数的集合  V が既約であることと,対応する根基イデアル  \mathcal{I} (V) が素イデアルであることは同値.

(iv)  k代数的閉体と仮定する.このとき,代数的集合  V が一点  V = \{ \bar{a} \} であることと,対応する根基イデアル  \mathcal{I} (V) が極大イデアルであることは同値.

この定理について補足.(i)の部分集合の関係式は  \mathcal{V}, \mathcal{I}ガロア接続を定めることを意味している.(iv) において特に極大イデアル  m \bar{a} \in k^N を用いて
 
\qquad m = (X_1 - a_1, \dots, X_N - a_N)
と書けることも分かる.この形のイデアル m_a := (X_1 - a_1, \dots, X_N - a_N) と表すこととする. k代数的閉体でなくても  m_a の形のイデアルは極大イデアルであり,対応する代数的集合  \mathcal{V} (m_a) は一点集合である.なので (iv) の主張は k代数的閉体ならば,極大イデアルが必ず  m_a の形に書けるということである.この主張はヒルベルトの零点定理の弱形と呼ばれる.


有限生成代数と極大イデアル

代数的閉体でない場合


目標では次に有限生成代数に行きたいところではあるが,極大イデアルを点と見る理由を十分に理解するために, k代数的閉体でない場合の多項式環  k[ \bar{X}] を考える.


前節の最後の定理の(iv)から, k代数的閉体の場合は点と極大イデアルは同一視して良い.一方,前節の最後に述べたことは, k代数的閉体の場合には素朴な点  \bar{a} は極大イデアル  m_a に対応するが,任意の極大イデアルは点に対応するとは限らない.つまり,極大イデアルの方が多いので,素朴な点  \bar{a} にこだわらず,極大イデアル自体を"点"と見た方がいいことが示唆される.


(補足.何を言っていいるかというと,「図形と代数の対応」がうまくいくには図形の点の定義を変えるということである. k代数的閉体の場合には実際に極大イデアルと点が対応するので,一般化して極大イデアルも点だと思おうとする,すると図形と代数が対応する, ということである.極大イデアルを点と呼ぶ「点らしさ」は「図形と代数の対応」を信じていることから来ているのであり,素朴な図形観に訴えかけるものではないと思う.だから,この分野に詳しくない人に向かって「数学者は極大イデアルを点と思う」と言ってしまうと,(詳しく説明しない限り)そこでいう"点"概念が代数幾何学者とそれ以外の人で大きくズレているためミスリーディングだと思う.*1


極大イデアルを点と考えることの意味を考える.可換環  R の極大イデアル \mathrm{mSpec} R と表す. k代数的閉体でなくても, k^N \subset \mathrm{mSpec} (k [\bar{X} ]) と考えることができるのであった.一方,任意の  \bar{a} \in \bar{k}^N に対して, \bar{X} \mapsto \bar{a} とする写像  \phi_{\bar{a}} \colon k [ \bar{X} ] \to \bar{k} を考えると,準同型定理より  k [ \bar{X} ]/ \mathrm{ker} \phi_{\bar{a}} \simeq \bar{k} となる.よって, \mathrm{ker} \phi_{\bar{a}} は極大イデアルである.よって写像  \tau \colon k^N \to \mathrm{mSpec} (k[ \bar{X} ] ) \colon \bar{a} \mapsto \mathrm{ker} \phi_{\bar{a} } を得る.この  \tau全射である.(なぜなら, m \in \mathrm{mSpec} (k[ \bar{X} ]  \bar{k} [ \bar{X} ] でのイデアルと考えれば,ある  \bar{a} \in \bar{k}^N m \subset \mathrm{ker} \phi_{\bar{a}} が分かる.極大性より  m = \mathrm{ker} \phi_{\bar{a}} となる. )つまり, \mathrm{mSpec} (k[ \bar{X} ] ) \subset \bar{k}^N と考えても良い.つまり,以上より, k^N \subset \mathrm{mSpec} (k[ \bar{X} ] ) \subset \bar{k}^N と考えられ,極大イデアルを点と見ても少なくとも  \bar{k}^N の元(と見ることはできる)ということが分かる.


これは一変数の場合でみるともっと分かりやすい. k \subset \mathrm{mSpec} (k[ X ] ) \subset \bar{k} の解釈として, k[X ]の元は  k に零点を持つとは限らないが  \mathrm{mSpec} (k[ X ] ) には零点を持つ.つまり,全ての多項式が零点を持つように空間を広げたものが   \mathrm{mSpec} (k[ X ] ) である.ちなみに,零点を持つだけでなく体になるようにしたものが  \bar{k} である.例えば,多項式  X^2 + 1 \in \mathbb{Q} [ X ]  \mathbb{Q} に零点を持たないが,極大イデアル  (X^2 + 1) \in \mathrm{mSpec} ( \mathbb{Q} [ X ] ) が"零点"になる. X^2 + 1 \bar{k} には  2 つ零点  \sqrt{-1}, -\sqrt{-1} があるので,代数的閉体における零点と極大イデアルが対応しているわけではない.(つまり, \tau^{-1} (m) には本当の零点がたくさん入っていることがある.)被約の仮定は別の場所でも重要になってくるが,被約だと思って読み進めよ.

有限生成代数の場合


問題を元に戻して,多項式環  k [\bar{X} ] ではなく一般化して有限生成  k 代数  A を考えることにする.


一般化してはいるが,それほど奇妙なものではなく,実はすでに出てきたものである.有限生成という仮定により有限個の元  f_1, \dots, f_N \in A が存在して  A = k [f_1, \dots, f_N ] と書ける.多項式環からの全射  \phi \colon k [ \bar{X} ] \to A \colon X_i \to f_i を考えることにより, A \simeq k [ \bar{X} ] / \mathrm{ker} \phi となる. I = \mathrm{ker} \phi とおけば, A多項式環イデアルで割ったものということである.特に, A が被約の場合には  I は根基イデアルとなり, A \mathcal{V} (I) の座標環である.さらに言えば, A が被約のときには, A は代数的集合  \mathcal{V} (I) と同一視して良い.


つまり,(被約)有限生成  k 代数  A とは  k[\bar{X} ] の代数的集合なのであるが,  k[\bar{X} ] の極大イデアルを点と見たように, A の点も  A の極大イデアルとして定義する. A の点を  \mathrm{mSpec} A としたときに,その位相をどのように定めればいいか?それを考えるために多項式環の場合を思い出す.多項式環では,代数的集合

\qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid \forall f \in I , \, f(\bar{a} ) = 0\}
の集まりで位相を定めるのであった.ここで, \bar{a} が定める極大イデアル  m_{\bar{a}} = (X_1 - a_1, \dots, X_N - a_N ) を用いれば,

\displaystyle \qquad f(\bar{a}) = 0 \Leftrightarrow f \in m_{\bar{a}}
となる.よって代数的集合の定義は

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ \bar{a} \in k^N \mid  I \subset m_a \}
と書ける.点と極大イデアルが対応しているので,極大イデアルの空間  \mathrm{mSpec} A の代数的集合も全く同様に

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ m \in \mathrm{mSpec} A \mid  I \subset m \}
と定義すればよい.もちろんこれで位相が定まる.  \mathrm{mSpec} Aアファイン代数多様体と呼ぶことにする.

命題( \mathrm{mSpec} AのZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = \mathrm{mSpec} A ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )

多項式環の場合と同様に考えれば,部分集合  V \subset \mathrm{mSpec} A に対してイデアルを定める写像  \mathcal{I} も考えるべきであろう:

\displaystyle \qquad \mathcal{I} (V) := \{ f \in A \mid \forall m \in V, \, f \in m \} = \bigcap_{m \in V} m


もう少し考察に進む前に,有限生成代数に対して成り立ついくつかの定理を復習する.

定理
 R_1 \subset R_2 は環の拡大で  R_2 が整域とする.このとき,R_2R_1 上整ならば, R_1 が体であることと  R_2 が体であることは同値.

証明は意外と簡単にできる.

定理(Zariskiの補題
 k \subset K を体の拡大とする.
このとき,K k 上有限生成ならば,K k 上代数的である.


 k \subset K を体の拡大とする. A k 代数で  K \subset A とする.
このとき, A が有限生成  k 代数ならば, K k 上代数的である.

証明. m \in \mathrm{mSpec} A とすると, K は逆元を持たないから  m \cap K = \emptyset であり  k \subset K \subset A/m となる. A/m k 上有限生成なのでZariskiの補題により A/m の元は代数的.よって,K の元も代数的. \square

定理(ヒルベルトの零点定理)
 A が有限生成 k 代数のとき,

\displaystyle \qquad \sqrt{ (I) } = \bigcup_{I \subset m \in \mathrm{mSpec} (A) } m
となる.特に, A が被約ならば,
 
\displaystyle \qquad \bigcup_{m \in \mathrm{mSpec} (A) } m = \sqrt{ (0) } = 0
である.

ヒルベルトの零点定理の意味を考える.イデアル  I に対して, \mathcal{I} (\mathcal{V} (I) ) を考えると
 \displaystyle
\qquad \mathcal{I} (\mathcal{V} (I) ) = \bigcap_{m \in \mathcal{V} (I) } m = \bigcap_{I \subset m \in \mathrm{mSpec} (A) } m
となるので, A が有限生成のときには,

\qquad \displaystyle \sqrt{ (I) } = \mathcal{I} (\mathcal{V} (I) )
となる.これがヒルベルトの零点定理の意味である.

準同型写像と射


幾何と代数が対応していると思えるためには,単に代数から幾何学的対象が定まるだけでなく,代数間の準同型写像から幾何学的対象の射が対応していなければならない.


 k 代数 A, B の間の準同型写像  \phi \colon A \to B があったとする.このとき,有限生成代数の間の準同型写像であれば,連続写像  \phi^* \colon \mathrm{mSpec} B \to \mathrm{mSpec} A \phi^* (m) = \phi^{-1} (m) と定義できる.これが有限生成を仮定する理由である.

命題
 k 代数 A, B準同型写像  \phi \colon A \to B 考える.B k 上有限生成のとき, m \in \mathrm{mSpec} B の引き戻し  \phi^{-1} (m) A の極大イデアルである.

証明.Bk 上有限生成なので, B/mk 上有限である.よって, \pi \colon B \to B/m とおいて, \pi \circ \phi \colon A \to B/m の像は  k 上有限であり体である.つまり, A/ \mathrm{ker} (\pi \circ \phi) \simeq A / \phi^{-1} (m) は体である.よって, \phi^{-1} (m) は極大イデアルである.

次に,この  \phi^*連続写像であることを見る.まず,位相的な準備をする. f \in A に対して開集合  D (f) := \mathrm{mSpec} (A) \setminus \mathcal{V} ( (f) ) = \{ m \in \mathrm{mSpec} (A)  \mid f \notin m\} が定まる.有限生成 k 代数  Aネーター環なので,任意のイデアル  I は有限生成である.すると開集合  Z = \mathrm{mSpec} (A) \setminus \mathcal{V} (I)

\displaystyle \qquad Z = D(f_1) \cup \dots \cup D (f_N)
と書ける.つまり,開集合は  D(f) の形の開集合の有限和で書くことができる.つまり, D(f) の集まりがZariski位相の基本開集合となっている. \phi \colon A \to B f \in B に対して,

\displaystyle \qquad (\phi^* )^{-1} ( D(f) ) = \{ m \in \mathrm{mSpec} (B) \mid \phi^* (m) \in D(f) \} \\
\qquad \qquad \qquad \, =  \{ m \in \mathrm{mSpec} (B) \mid f \notin \phi^{-1} (m)  \} \\
\qquad \qquad  \qquad \,=  \{ m \in \mathrm{mSpec} (B) \mid \phi( f) \notin (m)  \} \\
\qquad \qquad  \qquad \,= D (\phi (f))
となる.つまり, \phi^* は開集合の引き戻しを開集合に写すので連続写像である. \square


よって,有限生成代数とその間の準同型写像から,アファイン代数多様体とその間の連続写像を得ることができた.逆にアファイン代数多様体やその連続写像から有限生成代数と準同型写像が得られるなら完璧であるが実はこれは難しい.それを行うには層の議論が必要になる.層の議論をやるのは大変なので,ずいぶん簡単な状況を考えることでその逆操作のギャップがどこにあるかを見る.


まず,有限生成代数をアファイン代数多様体上の関数と見る方法を考える.有限生成代数  A に対して, X = \mathrm{mSpec} A とおく. f \in A を固定すると, m \in X に対して [ f ]_m \in A/m が対応づけられる. k代数的閉体の場合は  A/m \simeq k なので, X から  k への写像  \mathrm{map} (f) \colon X \to k が定義できる.のちの議論で必要になるので,細かい注意をすると, f(m) = a \in k というのは  f - a \cdot 1_A \in m ということである.次に, f, g\in A \mathrm{map} (f) = \mathrm{map} (g) とする.つまり,任意の  m \in X に対して  [f]_m = [g]_m とする.これは  f - g \in m なので, f - g \in \bigcap_{m \in X} m ということである.A が被約とすると, \bigcap_{m \in X} m = \sqrt{ (0) } = 0 なので, f = g となる.つまり, X から  k への写像の集合を  O(X) と表すと  \mathrm{map} \colon A \to O(X)単射である.つまり,A の元は写像として同じなら  A の元としても同じである.


以上のことをまとめると, k代数的閉体の時には  A X から  k への関数を定義し,A が被約ならその関数としての性質が A の元を特徴付ける.つまり,k代数的閉体かつ A が被約の時に, AO(X) の部分集合と見ることができる.逆に O(X) の元  \alpha A であるとは,ある  f \in A が存在して, \mathrm{map} (f) = \alpha となることとである.この準備の元で,アファイン多様体の間の射が代数の準同型写像を与えるための条件は以下のように与えられる.

命題
 k代数的閉体 A, B を被約な有限生成 k 代数とする.連続写像  \psi \colon \mathrm{mSpec} A \to \mathrm{mSpec} B に対して,以下が同値:

(i) ある  k 準同型  \phi\colon B \to A が存在して, \psi = \phi^* が成り立っている.

(ii) 任意の  g \in B に対して,関数  \mathrm{map} (g) \circ \psi \colon \mathrm{mSpec} A \to \mathrm{mSpec} B \to k A の元である.

証明.【(i)ならば (ii) の証明】. \psi (g) \in A なので  \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( \psi (g) ) を示せばよい.任意の  m \in \mathrm{mSpec} A に対して,
 \displaystyle
\qquad  \mathrm{map} (g) \circ \psi (m) = \mathrm{map} (g) (\psi (m) ) \\
\qquad \qquad  \qquad = [g ]_{\psi (m)} \\
\qquad \qquad \qquad = [g ]_{\psi^{-1} (m) } \\
ここで, [ g ]_{\psi^{-1} (m)} = a \in k とは  g - a\cdot 1_B \in \psi^{-1} (m) ということであり,これは  \psi (g) - a \cdot 1_A \in m を意味する.つまり, [ \psi (g) ]_m = a である.よって,
 \displaystyle
\qquad  \mathrm{map} (g) \circ \psi (m) = [ \psi (g) ]_m = \mathrm{map} (\psi (g) ) (m)
となる.以上より, \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( \psi (g) ) である.
【(ii)ならば(i)の証明】.仮定により任意の g \in B に対して,ある  f_g \in A が存在して, \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( f_g ) と書ける.この  f_g は一意である.実際,  \mathrm{map} (g) \circ \psi  =  \mathrm{map} ( f_g' ) となる  f_g' もあったとしても, A O(X) の元として見ることができるので,  \mathrm{map} ( f_g ) = \mathrm{map} ( f_g' ) より  f_g = f'_g である.そこで  \psi \colon B \to A \psi (g) = f_g と定める.
 \psi が準同型であること)

 \displaystyle \qquad \mathrm{map}( \phi (a g + a ' g') ) (m)  = [a g + a' g' ]_{\psi (m)}  \\
\qquad \qquad \qquad \qquad \qquad= a [g ]_{\psi (m) } + a' [g' ]_{\psi (m)}  \\
\qquad \qquad \qquad \qquad \qquad=  (a \mathrm{map} (g)  + a' \mathrm{map} ( g' )  ) (m) \\
\qquad \qquad \qquad \qquad \qquad= \mathrm{map} ( a \phi (g) + a' \phi (g') ) (m)
より, \displaystyle \phi (a g + a' g' ) = a \phi (g) + a' \phi (g') となる.
同様に,

 \displaystyle \qquad \mathrm{map}( \phi (g g') ) (m)  =  \mathrm{map} (g g' ) \circ \psi (m) \\
\qquad \qquad \qquad \qquad  =  [g g']_{\psi (m)}  \\
\qquad \qquad \qquad \qquad =  [g]_{\psi (m)}  [g']_{\psi (m)}  \\
\qquad \qquad \qquad \qquad =  \mathrm{map} (\phi ( g) ) (m) \cdot \mathrm{map} (  \phi (g') ) (m)  \\
\qquad \qquad \qquad \qquad =  \mathrm{map} (\phi ( g)  \phi (g') ) (m)
より, \displaystyle \phi (g g') = \phi ( g)  \phi (g') となる.
 \phi = \psi^* となること)
全ての  m \in \mathrm{mSpec} A に対して  \psi (m) = \phi^{-1} (m) を示せばよい.
 \displaystyle
\qquad g \in \psi (m) \Leftrightarrow [g ]_{\phi (m) } = 0 \Leftrightarrow [\phi (g) ]_m = 0 \Leftrightarrow \phi (g) \in m \Rightarrow b \in \phi^{-1} (m)
よって, \psi (m) \subset \phi^{-1} (m) \psi (m) は極大イデアルなので, \psi (m) = \phi^{-1} (m) \square


まとめると,代数の議論(代数とその間の準同型写像)はアファイン多様体の議論(アファイン多様体とその間の連続写像)に写すことができるが,アファイン多様体の議論が代数の議論に写すことができるとは限らない.なので,アファイン多様体とその間の射にさらなる情報を加えたものを考えていくことが本当は必要であるが,少なくとも,代数の議論がアファイン多様体の議論に写すことができるという事実が成り立つことが全ての出発点になっている.

有限生成でない代数と素イデアル

有限生成でない場合


さて,有限生成でない代数の場合を考えよう.有限生成でない場合にはの,今の定義では,代数の議論がアファイン多様体の議論に写すことができない.つまり, \phi \colon A \to B m \in  \mathrm{mSpec} (B) に対して, \phi^{-1} (m) A の極大イデアルになるとは限らない.実際,単射  \iota \colon \mathbb{Z} \to \mathbb{Q} を考えたとき,\mathbb{Q} の極大イデアル (0) のみであるが,その引き戻しは  \iota^{-1} ( (0) ) = (0)  \mathbb{Z} では極大ではない.


そこで,代数の議論がアファイン多様体の議論に写るように,アファイン多様体の点の定義を変更する.つまり,極大イデアルではなく素イデアルを点と考えることにする.可換環  R に対して,その素イデアルの集まりを  \mathrm{Spec} R で表すことにする.すると,準同型写像  \phi \colon A \to B と素イデアル  m \in  \mathrm{Spec} (B) に対して, \phi^{-1} (m) A の素イデアルになることが確認できる.

命題
 A, B k 代数とする.準同型写像  \phi \colon A \to B と素イデアル  m \in  \mathrm{Spec} (B)に対して, \phi^{-1} (m) A の素イデアル

証明. B/m は整域である.よって, \pi \colon B \to B/m とおいて, \pi \circ \phi \colon A \to B/m の像は整域である.つまり, A/ \mathrm{ker} (\pi \circ \phi) \simeq A / \phi^{-1} (m) は整域である.よって, \phi^{-1} (m) A の素イデアルである. \square

実はすでにこの事実を使っている場所が一箇所あるのだが流れを重視してこの事実を説明していなかった.ともかく,  \mathrm{Spec} A を点と考えれば,代数の議論を多様体の議論に持っていけそうだ.  \mathrm{Spec} A の位相の定義は  \mathrm{mSpec} A の場合と全く同じである. Aイデアルに対して,代数的集合を

\displaystyle \qquad \displaystyle \mathcal{V} ( I ) := \{ m \in \mathrm{Spec} A \mid  I \subset m \}
と定義すればよい.もちろんこれで位相が定まる.ここからは  \mathrm{Spec} Aアファイン代数多様体と呼ぶことにする.

命題( \mathrm{Spec} AのZariski位相)

(i)  \mathcal{V} ( (1) ) = \emptyset, \quad \mathcal{V} ( (0) ) = \mathrm{Spec} A ;

(ii)  \mathcal{V} (I) \cup \mathcal{V} (J) =  \mathcal{V} (I \cdot J) ;

(iii)  \bigcap_{\alpha} \mathcal{V} (I_\alpha ) = \mathcal{V} ( \sum_{\alpha} I_{\alpha} )

こうすれば状況は極大イデアルの場合と全く同じになる.

命題
 k 代数 A, B準同型写像  \phi \colon A \to B 考える. \phi^* \colon \mathrm{Spec B} \to \mathrm{Spec} A連続写像である.


このように,代数の議論をアファイン多様体の議論に持っていくためには,点は極大イデアルではなく素イデアルにする必要がある.これが,素イデアルを点と考える理由(の一つ)である.


ここで,素朴な点の代わりに極大イデアルを点と考えたときと一般化の仕方が違うことに注意しよう.例えば,多項式環  k [ \bar{X} ] では, k^N \subset \mathrm{mSpec} ( k [ \bar{X} ] ) \subset \bar{k}^N であり,特に  k代数的閉体の場合には点と極大イデアルが完全に一致したのであった.しかし,多項式環のところで述べたとおり,素イデアルに対応するのは既約な代数多様体である.つまり,素イデアルを点とみるのは,素朴な点に限らず点の集まりがなす図形をも"点"だと思うということである.特に,k代数的閉体であっても  \mathrm{Spec} A k^N よりも真に大きいものになる.素朴な点はいつでも既約なので,その意味では素イデアルは確かに一般化になっているのであるが,極大イデアルを点と思うときとは違い,素朴な点と素イデアルは一致しないのである.

イデアル空間の中での極大イデアル


これでこの記事の目標は達成されたのではあるが,最後に素イデアルを点と見たときの極大イデアルの意味を考えることにする.

命題
 A を有限生成 k 代数とする*2. このとき,位相空間 X の開集合のなす集合を  \mathcal{O} (X) と表すとき,写像
 \displaystyle
\qquad \tau \colon \mathcal{O} (\mathrm{Spec (A)} ) \to  \mathcal{O} (\mathrm{mSpec (A)} ) \colon U \to U \cap \mathrm{mSpec} (A)
全単射である.つまり, \mathrm{Spec (A)} の位相は  \mathrm{mSpec (A)} の位相で復元できる.

証明.  \square

証明はしないが,アファイン多様体とその間の射をちゃんと定義した k 上のアファインスキーム を使えば, k 代数の圏 ( k-alg) と k 上のスキームの圏 (Aff.Sch / k ) は双対圏である.

定理
( k-alg) と (Aff.Sch / k ) は双対圏である.特に,射の同型
 
\qquad \mathrm{Hom}_{k- \mathrm{alg} } (A, B) \simeq \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} B, \mathrm{Spec} A)
が存在する.

命題
 k代数的閉体とし, A を有限生成  k 代数とする.写像

\qquad \displaystyle \sigma \colon \mathrm{Hom}_{k-\mathrm{alg}} (A, k) \to \mathrm{mSpec} (A) \colon \alpha \to \mathrm{Ker} \alpha
全単射である.

証明.(単射性) \alpha \in \mathrm{Hom}_{k-\mathrm{alg}} (A, k) は前者なので, A / \mathrm{Ker} \alpha \simeq k となり  M := \mathrm{Ker} \alpha は極大イデアルである. f \in A とし, [f ]_M = a \in k とすると, f - a\cdot 1 \in M であり, \alpha を作用させれば, \alpha(f) = a が分かる.よって, \alpha(f) = [f ]_M である.これにより, \tau(\alpha) = \tau (\beta), つまり, \mathrm{Ker} \alpha = \mathrm{Ker} \beta = M ならば,任意の  f \in A \alpha (f) = \beta (f) となる.つまり, \alpha = \beta

全射性) M \in \mathrm{mSpec} A とする. R/M \simeq k より 写像  \alpha \colon R \to k が得られる.よって  \sigma全射である.  \square

この定理と命題により, k代数的閉体かつ A が有限生成であれば,

\qquad \displaystyle \mathrm{mSpec} A \simeq  \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} k, \mathrm{Spec} A)
が成り立つ.右辺は素イデアルで幾何を考えたときの射であり,このように素イデアルで考えても極大イデアルが復元できる.ここで  k を一般化することで他の視点で点を定義できる.

定義
k 代数 Ak 代数  R に対して,多様体 X = \mathrm{Spec} A  R X (R)

\qquad \displaystyle X (R) := \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} R, \mathrm{Spec} A) \simeq \mathrm{Hom}_{k-\mathrm{alg}} (A, R)
で定める.

上で述べたことは, X(k) \simeq \mathrm{mSpec} A と書くことができる.


最後に  k代数的閉体でないときの  R 点を具体例で見てみる.

 k = \mathbb{Q} として, k 代数  A = \mathbb{Q} [X] / (X^2 + 1) を考える. X = \mathrm{Spec} A とする. X( \mathbb{Q} ), X(\mathbb{R} )空集合である.なぜなら, \alpha \in X( \mathbb{Q} ) = \mathrm{Hom}_{k-\mathrm{alg}} (A, \mathbb{Q}) (または  X(\mathbb{R} ))とすると, X^2 + 1 = 0 より  \alpha(X)^2 + 1 = 0 となるが, \mathbb{Q}(または  \mathbb{R})にはそのような \alpha(X) が存在しない.一方, \alpha (X) = \sqrt{-1}, -\sqrt{-1} と定めればそのような準同型写像が存在するので  X (\mathbb{C}) 2 つの元を持つ.
(補足.体の素イデアル (0) だけなので, \mathrm{Spec} \mathbb{C} から  \mathrm{Spec} ( \mathbb{Q} [X] / (X^2 + 1) ) への連続写像 1 つだけであり,   \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} R, \mathrm{Spec} A) の元が  2 つというのは奇妙に思われるかもしれない.ここがちゃんと言っていないところで,多様体間の射は連続写像と空間の上の環の準同型写像のペアだからである.連続写像だけではだめな( \mathrm{Hom}_{k- \mathrm{alg} } (A, B) \simeq \mathrm{Hom}_{\mathrm{Aff.Sch/} k } (\mathrm{Spec} B, \mathrm{Spec} A) が成り立たない )ことはこの例からも分かる.)

この記事を書いて思ったこと

ある程度目処をつけてからこの記事を書いたんだけども,書きながら色々気がついたことがあった.可換環 k 代数の違い,もっと言えば  k 代数の良さである. k 代数 A を考えているとき,体 k がその中に常に入っている.体は(環と比べれば) 単純なので,その内部の単純さが  A の性質に反映させることができる.有限生成の時には如実にそういう考え方が生きていた.では有限生成でない場合にはどうなのかという話があるが,有限生成でない代数の良さは今回は現れなかった.あと,今回の問題意識での層の価値(コホモロジーとかは置いといて)が分かってなかったけど,ちょっと分かってきた.これについてはまた記事を書くかもしれない.

*1:この点をちゃんと説明している記述が『プリンストン数学大全』のエレンバーグによる「数論幾何学」の項目にあったので引用しておこう。話のレベルがここでの話と少しズレがあるが私が文句言っている点についてちゃんと説明している。"(すべてではないが)いくつかの環が幾何的対象(多様体)から生じることが分かっている.そして,これらの多様体は,これらの特別な環の代数的な性質により記述できることが知っている.では単に,すべての環 RR の代数的性質で定まる幾何学を持つ「幾何的対象」であると考えればよいのではないだろうか?"

*2:有限生成でなくてもジャコブソン環であれば良い

単独高階微分方程式の連立一階微分方程式への変形について


単独高階線形微分方程式を一階の連立微分方程式に変形する方法は有名です.一方,逆に連立方程式を単独高階方程式に直せることが知られています.この事実は時々説明されることはあるものの証明が書かれていることはほとんどないです.


そこで巡回ベクトルを用いた証明のpdfを書きました.証明には微分加群を用いています.微分加群圏論的に微分ガロア理論を捉える時の基本的な対象でもあります.

drive.google.com

新年の抱負2019


新年あけましておめでとうございます。
今更ですね。
ちょっとごちゃごちゃしてたので、新年の抱負をこのタイミングで書いておきます。


去年の抱負は「趣味を楽しむ余裕を持ちながら、やるべきことをやっていく」でした。けっこう達成できたのではないかと思います。
たくさん新しいこともできましたし、面白いイベントもできましたしね。
ちなみに、去年のブログで書いていた今後ブログで書きたいことというのは全然できませんでした...まあ書きたい気持ちはありますが、単になかなか書き進められないだけなのでいいでしょう.飽きたわけではないです。


さて、2019年の抱負は「計画を立てて結果を出していく」です。気ままにいろんなことをやっていますが、やりたいことを全部やるにはちゃんと計画を立てなければ無理そうなので。


とりあえずやりたいのは
(1) gitで公表できるレベルのArduboyゲームを作る
(2) 科学哲学の同人誌的なもの
です。

理想的な物理理論としての電磁気学

この記事は以下の一連の記事の最終回ですが,今回の内容が目標だったので,できるだけこれまでの記事を読まなくても理解できるように説明していく.
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com

今回使う知識

これまで説明したことで,今回使うものを復習する.ただし, c = 1, \hbar = 1, \mu_0 = 1 として書き直している.以下ではアインシュタインの規約を用いている.

(電磁場のマクスウェル方程式
ポテンシャル  A^\mu = (\phi, A_x, A_y, A_z) に対して
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおくと,電磁場のラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
であり,そのオイラーラグランジュ方程式としてマクスウェル方程式

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} = j^{\nu}
を得る.任意の関数  \chi に対して定義されるゲージ変換

\qquad
\displaystyle
A^\mu \rightarrow A^\mu + \partial^\mu \chi
により,作用(ラグランジアン密度の積分)は不変である.

(自由空間におけるDirac方程式)
自由空間におけるDirac方程式のラグランジアン密度は

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
であり,Dirac方程式は

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
である.

ここで, \gamma^\mu は行列であり,また,ある行列  \beta を用いて

\qquad
\displaystyle
\bar{\psi} = \psi^{\dagger} \beta = {\psi^*}^{\mathrm{T} } \beta
としているが,これらの行列が具体的にどのようなものであるかは今回の内容に影響しない.

ゲージ共変性による電磁場の導入


上で述べたのは自由空間のDirac方程式である.つまり,外力が働かないときに,純粋に量子力学的な効果だけを見ている方程式である.電子に電場による外力がかかったときの方程式は,ハミルトニアン正準量子化で電磁場を含んだ方程式を導くことができるが,一旦電磁場のことを忘れて別の視点から電磁場が自然に現れることをみる.


Dirac方程式のラグランジアン密度

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
を考える.このとき,定数 \theta を用いて,

\qquad
\displaystyle
\psi \rightarrow e^{-i \theta} \psi
と変換しても,ラグランジアン密度は変化しない.なぜなら,真ん中の項の微分や行列は関係なくて実質  \bar{\psi}  \psi の形なので,上の変換で  \bar{\psi}  \psi \rightarrow \bar{\psi}  e^{i \theta} e^{-i \theta} \psi = \bar{\psi}  \psi となるからである.これを大域的なゲージ変換という.変換をさらに一般化して,定数  q (これは  1 でも良い)と関数  \chi を用いた変換

\qquad
\displaystyle
\psi \rightarrow e^{-i q \chi} \psi
ラグランジアン密度が不変になるようにするにはどうすればいいかを考える.このままでは,Dirac方程式の真ん中の項の微分があるため不変にならないのであるが,計算すると

\qquad
\displaystyle
\begin{align}
 \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi & \rightarrow \bar{\psi} e^{i q \chi} (i \gamma^\mu \partial_\mu - m) e^{-i q \chi} \psi \\
&=  \bar{\psi} e^{i q \chi} e^{-i q \chi} (i \gamma^\mu \partial_\mu - m) \psi + \bar{\psi} e^{i q \chi} i  \gamma^\mu   (- i q e^{-i q \chi} \partial_\mu \chi )  \psi \\
&=  \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi + \bar{\psi} q \gamma^\mu   (\partial_\mu \chi)  \psi
\end{align}
となるので, \bar{\psi} q \gamma^\mu   (\partial_\mu \chi)  \psi という余分な項が出てきてしまう.そこで,(電磁場のことはとりあえず忘れて) A^\mu という場で

\qquad
\displaystyle
A^\mu \rightarrow A^\mu + \partial^\mu \chi
と変化するものを考えて,Dirac方程式の  i \gamma^\mu \partial_\mu の項を  \gamma^\mu ( i \partial_\mu - q A_\mu) と書き換えたラグランジアン

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi
\end{align}
を考える.そうすると,上の変換で,

\qquad
\displaystyle
\begin{align}
 \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi & \rightarrow  \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi +  \bar{\psi}  \gamma^\mu (  q \partial_\mu \chi - q \partial_\mu \chi ) \psi \\
&= \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi
\end{align}
となり,ラグランジアンは不変になる.このような変換

\qquad
\displaystyle
\psi \rightarrow e^{-i q \chi} \psi
を局所的なゲージ変換という.それは, \chi が関数のため,時空間に依存して変化が変わるからである.ゲージ変換というときにはこの局所的なゲージ変換を指すことが多い.


上のラグランジアンでは,A^\mu の運動の情報が入っていないため,それを表すために,例えば
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおいて,ラグランジアン密度を

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu \\
&= \bar{\psi} i \gamma^\mu   \partial_\mu  - m) \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - ( j^{\mu} + q  \bar{\psi} \gamma^\mu \psi ) A_\mu
\end{align}
と考える.ここで  F_{\mu \nu} F^{\mu \nu} j^{\mu} A_\mu の添加のみを考えた理由は後で説明する.すると, \bar{\psi}オイラーラグランジュ方程式を考えれば,Dirac方程式を変形した

\qquad
\displaystyle
[ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi = 0
を得る.また, A^\muオイラーラグランジュ方程式を考えればマクスウェル方程式を変形した

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} =  j^{\mu} + q  \bar{\psi} \gamma^\mu \psi
を得る.


ここで,電磁場のポテンシャルのゲージ変換は  A^\mu \rightarrow A^\mu + \partial^\mu \chi となることを知っているので,上で必要となった  A^\mu は電磁場のポテンシャルではないかと期待できる.実際に,外部電磁場の中を電荷  q で運動する 1 粒子のハミルトニアンから方程式を計算すれば,

\qquad
\displaystyle
[ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi = 0
となることが分かる.電流  j^\mu はもちろん電子の動きを表しているため,電磁場の下で動く 1 粒子の影響が電流としても合わられるはずである.実際,マクスウェル方程式

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} =  j^{\mu} + q  \bar{\psi} \gamma^\mu \psi
となった.つまり,粒子  \psi からは  q  \bar{\psi} \gamma^\mu \psi の分が電流密度として反映される.


Dirac方程式の(局所的)ゲージ共変性から電磁場のポテンシャルと同じ変換がなされる場  A^\mu が現れることを導いたが,先歴史的には先に方程式があって,それがゲージ共変性をもっていたという流れのはずである.しかし,今回述べたように,電子の相互作用を表すために電磁場が必要となるという見方ができる.そのように見れば,相互作用する粒子一般に対して,電磁場のような相互作用を表すための場が必要になるという予想を立てることができる.


ただし,そのように見るには,本当にこの見方が電磁場においても正しいかということを考える必要がある.例えば, A^{\mu} の運動を表すために,なぜ  F_{\mu \nu} F^{\mu \nu} j^{\mu} A_\mu の項のみを考えて他の項は考えなかったのかを正当化しなければならない.まず,最終的なラグランジアン密度はゲージ不変でなければならない.F_{\mu \nu} F^{\mu \nu} A^\mu微分  \partial^\mu A^\nu で定義されており,偏微分の交換可能性からゲージ変換でも不変になるのであった.また, j^{\mu} A_\mu電荷の保存則  j^{\mu} \partial_\mu = 0 が作用の不変性を表すのであった.それ以外の項として例えば
 A_\mu A^\mu を考えると,ゲージ変換によって

\qquad
\displaystyle
\begin{align}
A_\mu A^\mu &\rightarrow (A_\mu + \partial_\mu \chi) ( A^\mu + \partial^\mu \chi) \\
&= A_\mu A^\mu + (\partial_\mu \chi ) A^\mu + A_\mu (\partial^\mu \chi) + (\partial_\mu \chi) (\partial^\mu \chi)
\end{align}
となり,一般にはゲージ変換で不変ではない.粒子の場合は,微分を取らないものの積は  m \bar{\psi} \psi の形で入っており,この項は質量を表していた.よって, A_\mu A^\mu のような微分を取らないものの積を質量項という.上で見たように,質量項があるとゲージ不変とはならないため,粒子の相互作用を表すために導入した場  A^\mu は質量を持たないと期待される.よって,ゲージ不変性を考えると  A^{\mu} の運動を表すために添加していい項は限られてくることが分かる.

粒子の相互作用を担う場を与える描像とその後の発展


前節の内容を一般化することで,相互作用する粒子に対して場が必要となる流れが定式化できたことになる.

(1) ある粒子のラグランジアンを考え,適当なゲージ変換を考える

(2) ゲージ変換のズレを消去するための項を生み出すような場を導入する

(3) ゲージ変換で不変になる程度に場の運動を表す項を添加する

もし現実がこの通りになっているのなら,相互作用を表す場は質量がないことが予想される.


さて,今回の内容がその後の素粒子理論の出発点となる.(以下は私が理解できているわけではありません)

(i) Dirac方程式は負のエネルギーの問題が出る.それは場を量子化する,つまり,A^\mu などの場を演算子と考えることで解決される.このような理論を量子場の理論という.(これまでの内容は古典場の理論.)電磁場の下でのDirac方程式を量子化すれば,量子電磁力学(QED)になる.相互作用を担う場は質量のないボーズ粒子によってなされることになる.例えば,光子の質量は 0である.

(ii) 上の流れ通りであれば,相互作用を担うボーズ粒子は質量がないはずであるが,実際にはそうではない.そこで,質量を得るための説明が必要となる.それがヒッグス機構であり,自発的対称性の破れからヒッグス場との相互作用により質量を得るという説明をする.

素粒子理論についての解説として
  ピーター・ウォイト『ストリング理論は科学か』
をオススメする.数式をほとんど使わなくても,かなり高度なことまで説明している.特に,最初に加速器実験についてかなり詳しく説明しており,この分野の感覚や実験で何が分かるのかといったことも教えてくれる.

共変微分

ゲージ変換の不変性を持たせるために場を導入したが,もう少し違う見方をする.ゲージ変換で不変になるために,微分   i \partial_\mu  i \partial_\mu - q A_\mu に書き換える必要があった.変更後はゲージ変換で不変になるような微分だと見ることができるので, \mathbb{D}_\mu = i \partial_\mu - q A_\mu とおき,これを共変微分と呼ぶ.つまりラグランジアンはゲージ変換で不変となる項のみで書かれているので明らかにゲージ不変になるという見方ができる.

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \bar{\psi} [ \gamma^\mu ( \mathbb{D}_\mu - m)] \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
\end{align}
実質的にはこれまでの説明と同じではあるが気持ちがずいぶん違う.これまでの説明は,不変になるように補正項を加えるというニュアンスであった.一方でこの説明は,登場するものが全てゲージ不変になるように,特に,微分を共変微分に書き換える,という説明である.その視点で見ると,電磁場とは,共変微分で普通の微分には現れないズレの項なのである.

理想的な物理理論としての電磁気学(4)

以下の記事の続きです.
tetobourbaki.hatenablog.com

一連の記事の目的としては,あとはゲージ変換やゲージ不変性について説明すれば終わりです.参考にしている牟田『電磁気学』では非相対論的な電子の場を使って議論をしているため,これと同じ説明をすると流れが悪くなってしまいます.そこで,この記事ではDirac方程式を説明することにします.ただし, c = 1,\, \hbar = 1 となる単位系をとることにします.

Dirac方程式


再度注意するが, c = 1,\, \hbar = 1 となる単位系を取って議論する.よって,\displaystyle \partial_0 = \frac{\partial}{\partial (ct)} = \frac{\partial}{\partial t} となっている.Dirac方程式を一から説明するのは大変なので,大きく端折る.シュレディンガー方程式特殊相対性理論と整合性があるように変形した以下のものが自由空間におけるDirac方程式である.

\qquad
\displaystyle
i \frac{\partial \psi}{\partial t} +i  \sum_{j=1}^3 \alpha^j \frac{\partial \psi}{\partial x^j} - m \beta \psi = 0
ここで,いくつも注意することがある.まず, \alpha^1, \alpha^2, \alpha^3, \beta 4 \times 4 の行列である.なので, \psi は 4成分のベクトルであり,Dirac方程式は 4連立の方程式になっている.次に, \alpha^1, \alpha^2, \alpha^3, \beta は以下の性質を満たす行列である.

\qquad
\displaystyle
\begin{align}
&\beta^2 = E_4 \\
&\alpha^j \beta + \beta \alpha^j = 0 \\
&\alpha^j \alpha^k + \alpha^k \alpha^j = 2 \delta^{kj} E_4
\end{align}
ここで,単位行列 E_n で表している.ここで,パウリ行列

\qquad
\displaystyle
\sigma_1 =
\left(
\begin{matrix}
0 & 1\\
1 & 0
\end{matrix}
\right), \quad
\sigma_2 = 
\left(
\begin{matrix}
0 & -i \\
i & 0
\end{matrix}
\right),
\quad
\sigma_3 = 
\left(
\begin{matrix}
1&0 \\
0& -1
\end{matrix}
\right)
を用いて,

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
0 & \sigma_k \\
\sigma_k & 0
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
E_2 & 0 \\
0 & -E_2
\end{matrix}
\right)
とおけば,満たすべき性質を満たしている. \alpha^1, \alpha^2, \alpha^3, \beta は他の取り方をとっても良い.


Dirac方程式に  \beta をかけて,\gamma^0 = \beta,  \gamma^{j} = \beta \alpha^j とおけば,

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
と書くことができる.次に,Dirac方程式をラグランジアン密度の場の方程式として書くことを考える.以前は実数の変数を考えていたが,\psi は複素値なので,実部と虚部を独立の変数と考えて変分法を使うことができる.*1しかし,それはちょっと面倒である.実は  \psi の実部と虚部の代わりに, \psi複素共役  \psi^* を独立の変数と考えて変分法を使っても良いことが知られている.そこで, \psi^{\dagger} = (\psi^*)^{\mathrm{T}}, \bar{\psi} = \psi^\dagger \beta とおき,ラグランジアン密度を

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \psi^\dagger ( i \partial_0 +  \alpha^{j} \partial_j - \beta m) \psi \\
&= \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
とおけば,( \psi^\dagger \bar{\psi} を変数としてオイラーラグランジュ方程式を計算すれば,)このラグランジアン密度からDirac方程式が得られる.

(自由空間におけるDirac方程式)
自由空間におけるDirac方程式のラグランジアン密度は

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
であり,Dirac方程式は

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
である.

Dirac方程式のローレンツ変換


ゲージ変換とは関係がないが,相対性理論との繋がりを知るために,ローレンツ変換との関係も述べておく.この節は飛ばしても次に進むことができる.計算を進めるために,上で述べたのと異なる行列  \alpha^1, \alpha^2, \alpha^3, \beta を取ろう.以下のような表示をカイラル表示という.

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right)
このとき,

\qquad
\displaystyle
\psi = \left(\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
とおけば,Dirac方程式は

\qquad \displaystyle
i \left(
\begin{matrix}
E_2 & 0 \\
0 & E_2
\end{matrix}
\right)
 \left(\begin{matrix}
\partial_0 \psi_{\mathrm{L}} \\
\partial_0 \psi_{\mathrm{R}}
\end{matrix}
\right)
+
 i
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
 \left(\begin{matrix}
\partial_j \psi_{\mathrm{L}} \\
\partial_j \psi_{\mathrm{R}}
\end{matrix}
\right)
 - m
 \left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right)
 \left(
\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
= 0
つまり,Dirac方程式は 2連立方程式
 \displaystyle
\qquad
\begin{align}
 i E_2 \partial_0 \psi_{\mathrm{L}} - i \sigma^j \partial_j \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\
 i E_2 \partial_0 \psi_{\mathrm{R}} + i \sigma^j \partial_j \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
で書ける.よって,

\displaystyle
\qquad
\sigma^{\mu} = (E_2, \sigma^1, \sigma^2, \sigma^3),\quad  \tilde{\sigma}^{\mu} = (E_2, -\sigma^1, -\sigma^2, -\sigma^3)
とおけば,Dirac方程式は

\displaystyle
\qquad
\begin{align}
 i \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\ 
 i \sigma^\mu \partial_\mu \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
と書ける.

Dirac方程式のカイラル表示)

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right),
\quad
\psi = \left(\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
とおけば,ラグランジュ密度が

\qquad
\displaystyle
\mathcal{L} = i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
であり,Dirac方程式が

\displaystyle
\qquad
\begin{align}
 i \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\ 
 i \sigma^\mu \partial_\mu \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
と書ける.


時空間  x^\mu が以下のようにローレンツ変換しているとする.

\qquad
\displaystyle
{x^{\mu} } ' = a^{\mu}_{\ \ \nu} x^{\nu}
このとき,

\qquad
\displaystyle
\partial_{\mu}  = a^{\nu}_{\ \ \mu} {\partial_{\mu}}'
に注意する.場  \psi_{\mathrm{L}}, \psi_{\mathrm{R}}

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
と変化すると仮定すると,ラグランジアンローレンツ変換で不変とすれば,

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= i { {\psi_{\mathrm{L} } }' }^\dagger \tilde{\sigma}^\mu {\partial_\mu}' {\psi_{\mathrm{L} }}'+ I { {\psi_{\mathrm{R} }}' }^\dagger \sigma^\mu {\partial_\mu}' {\psi_{\mathrm{R} } }' - m ({{\psi_{\mathrm{L} } }' }^{\dagger} { \psi_{\mathrm{R}} }' + { {\psi_{\mathrm{R} } }' }^{\dagger} {\psi_{\mathrm{L} } }' ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \mathbb{M}^{\dagger} \tilde{\sigma}^\mu {\partial_\mu}' \mathbb{M} \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \mathbb{N}^{\dagger} \sigma^\mu {\partial_\mu}' \mathbb{N} \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \mathbb{M}^{\dagger} \mathbb{N}  \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \mathbb{N}^{\dagger} \mathbb{M} \psi_{\mathrm{L} } ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} {\partial_\mu}'  \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \mathbb{N}^{\dagger} \sigma^\mu  \mathbb{N} {\partial_\mu}' \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \mathbb{M}^{\dagger} \mathbb{N}  \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \mathbb{N}^{\dagger} \mathbb{M} \psi_{\mathrm{L} } ) \\
\mathcal{L} &=  i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\nu a^{\mu}_{\ \ \nu} {\partial_\mu}' \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\nu a^{\mu}_{\ \ \nu} {\partial_\mu}' \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
\end{align}
となるから,

\qquad 
\displaystyle
\begin{align}
& \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} = a^{\mu}_{\ \ \nu} { \tilde{\sigma} }^\mu \\
& \mathbb{N}^{\dagger} \sigma^\mu \mathbb{N} = a^{\mu}_{\ \ \nu} {\sigma}^\mu \\
& \mathbb{M}^{\dagger} \mathbb{N} = E_2 \\
& \mathbb{N}^{\dagger} \mathbb{M} = E_2
\end{align}
となっている必要がある.任意のローレンツ変換に対して,上のような行列  \mathbb{M}, \mathbb{N} が存在することが知られている.つまり,ラグランジアンが不変になるためには,場  \psi_{\mathrm{L}}, \psi_{\mathrm{R}}

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
と変換する必要があることがわかった.

Dirac方程式のローレンツ変換
カイラル表示したDirac 方程式のラグランジュ密度

\qquad
\displaystyle
\mathcal{L} = i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
ローレンツ変換

\qquad
\displaystyle
{x^{\mu} } ' = a^{\mu}_{\ \ \nu} x^{\nu}
に対して

\qquad 
\displaystyle
\begin{align}
& \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} = a^{\mu}_{\ \ \nu} { \tilde{\sigma} }^\mu \\
& \mathbb{N}^{\dagger} \sigma^\mu \mathbb{N} = a^{\mu}_{\ \ \nu} {\sigma}^\mu \\
& \mathbb{M}^{\dagger} \mathbb{N} = E_2 \\
& \mathbb{N}^{\dagger} \mathbb{M} = E_2
\end{align}
を満たす場の変換

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
によって不変である.

電磁気の場合と同じように,ローレンツ不変になるように物理量の変換を自分で決めるという仕組みになっている.

*1:本当はラグランジアンがエルミートで変分が実数値でなければいけないが,この問題を今回は無視する.

理想的な物理理論としての電磁気学(3)

ラグランジュ密度を用いて微分方程式を出す方法とその利点をまとめていきます.
以下の記事の続きです.
tetobourbaki.hatenablog.com

今回はコッティンガム,グリーンウッドの『素粒子標準模型入門』を参考にしています.

連続系のラグランジュ形式


普通の解析力学ではラグランジュ形式で常微分方程式を導くことができた.連続系の場合で使われる,ラグランジュ密度を用いて偏微分方程式を導く方法を私は知らなかったので,まずは具体例でそれを見ていく.


両端を固定した弦を考える.張力によるポテンシャルエネルギーは

 \qquad 
\displaystyle 
T = \int_0^l \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 dx
であり,弦の運動エネルギーは

\qquad
\displaystyle
V = \int_0^l \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2 dx
と書ける.よって,ラグランジアン

\qquad
\displaystyle
 L := T - V = \int_0^l \left\{ \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 -  \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2 \right\} dx
となる.すると作用は

\qquad
\displaystyle
 S:= \int_0^{t_0} L \, dt
であるが,

\qquad
\displaystyle
\mathcal{L} :=  \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 -  \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2
とおけば,

\displaystyle
\qquad
S = \int_0^{t_0} \int_0^l \mathcal{L} \,dx dt
と書ける.この \mathcal{L}ラグランジュ密度と呼ぶ.


ラグランジュ密度は  \displaystyle \dot{\phi} = \frac{\partial \phi}{\partial t}  \displaystyle \phi' = \frac{\partial \phi}{\partial x} に依存しているので, \mathcal{L} = \mathcal{L} (\dot{\phi}, \phi') と書く.作用 S の変分を計算すると,
 
\qquad
\displaystyle
\delta S = \int_0^{t_0} \int_0^l \left[ \frac{\partial \mathcal{L} }{\partial \dot{\phi} }  \delta (\dot{\phi} ) +  \frac{\partial \mathcal{L} }{\partial \phi'}  \delta (\phi' ) \right] dx dt
であるが, \delta (\dot {\phi}) = \frac{\partial}{\partial t} (\delta \phi), \, \delta (\phi') = (\delta \phi)' に注意して,さらに任意の  t \phi(t,0) = \phi(t, l) = 0 かつ任意の x \phi (0,x) = \phi (t_0, x) を仮定すると,部分積分により,
 
\qquad
\displaystyle
\delta S = - \int_0^{t_0} \int_0^l \left[\frac{\partial  }{\partial t}   \frac{\partial \mathcal{L} }{\partial \dot{\phi} }  + \frac{\partial  }{\partial x }  \frac{\partial \mathcal{L} }{\partial \phi'} \right] \delta(\phi) dx dt
となる.よって,任意の任意の変分  \delta( \phi) \delta S = 0 を課するとオイラー方程式

\qquad
\displaystyle
\frac{\partial  }{\partial t}   \frac{\partial \mathcal{L} }{\partial \dot{\phi} }  + \frac{\partial  }{\partial x }  \frac{\partial \mathcal{L} }{\partial \phi'}  = 0
を得る.今のラグランジアンでは方程式

\qquad
\displaystyle
\rho \frac{\partial^2 \phi}{\partial t^2} - F \frac{\partial^2 \phi}{\partial x^2} = 0
を得る.これは波動方程式である.

ローレンツ共変な場の理論


前回の記事で導入した4次元変数  x^{\mu} を考える.ラグランジアン

\qquad
\displaystyle
S = \int \mathcal{L} \, dx^0 dx^1 dx^2 dx^3
となる.積分は時空間全体をとる.さて,作用  Sローレンツ不変になっているのが自然であろう.微分形式  dx^0 dx^1 dx^2 dx^3ローレンツ不変であることが分かるので, \mathcal{L}スカラーであるべきであり,もっというとスカラーに依存した関数であると考えるのが自然である.


今回はスカラー \phi(x^{\mu} ) = \phi(t, x, y, z) を用いて書けるラグランジアン密度

\qquad
\mathcal{L} = \mathcal{L} (\phi, \partial_\mu \phi) = \mathcal{L} ( \phi, \partial_t \phi, \partial_x \phi, \partial_y \phi, \partial_z \phi)
を考える.特にこの場合は \mathcal{L} が座標  x^{\mu} に直接は依存していないことが重要である.変分を取って,無限遠方で  \delta (\phi) = 0 を課すると部分積分により,

\qquad
\displaystyle
\begin{align}
\delta S & = \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} \delta (\phi) +  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi ) \right] dx^0 dx^1 dx^2 dx^3 \\
&=  \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} \delta (\phi) +  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\mu ( \delta \phi ) \right] dx^0 dx^1 dx^2 dx^3 \\
&=  \int \left[ \frac{\partial \mathcal{L} }{\partial \phi}  - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \right] ( \delta \phi ) dx^0 dx^1 dx^2 dx^3 
\end{align}
よって,任意の変分 \delta \phi \delta S = 0 とすると,場の方程式

\qquad
\displaystyle
\frac{\partial \mathcal{L} }{\partial \phi}  - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } = 0
を得る.

(場の方程式)
作用の変分の条件から得られる以下の方程式を場の方程式と呼ぶ.

\qquad
\displaystyle
\frac{\partial \mathcal{L} }{\partial \phi}  - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } = 0


電磁場に戻る前に,もう少し一般論を考える.エネルギー保存は時間  t の平行移動による対称性から導出されるのであった.また,運動量の保存は空間の平行移動による対称性から導出されるのであった.今の記法を用いれば微小な平行移動は

\qquad
x^\mu \rightarrow x^\mu + \delta a^{\mu}
と書くことができる.このときのラグランジュ密度の変分を二つの方法で計算する.場の方程式を用いれば,

\qquad
\displaystyle
\begin{align}
\delta \mathcal{L} &= \frac{\partial \mathcal{L} }{\partial \phi}  \delta \phi + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi) \\
&=\partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta \phi  + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi) \\
&=\partial_\mu  \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta \phi \right]
\end{align}
今の変分の取り方から

\qquad
\displaystyle
\delta \phi = \partial_\nu \delta a^\nu
なので,

\qquad
\displaystyle
\delta \mathcal{L}  =\partial_\mu  \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi \right] \delta a^{\nu}
である.一方, \mathcal{L} x^{\mu} に直接は依存していないことに注意して,記号の乱用ではあるが, \displaystyle \frac{\partial \mathcal{L}}{\partial x^\nu} = \frac{\partial }{\partial x^\nu} \mathcal{L} (\phi(x^\mu), \partial_\mu \phi (x^\mu) ) と書くことにすると,今の変分の取り方では


\qquad
\displaystyle
\begin{align}
\delta \mathcal{L}  &=  \frac{\partial \mathcal{L} }{\partial x^\mu}  \delta a^{\mu} \\
 &=  \delta_\nu^{\mu} \frac{\partial \mathcal{L} }{\partial x^\mu}  \delta a^{\nu} \\
&= \partial_\mu \delta_\nu^{\mu}  \mathcal{L}   \delta a^{\nu}
\end{align}
と書ける.よって,平行移動の任意の変分で  \delta \mathcal{L} の計算の仕方が等しいという条件から

\qquad
\displaystyle
\partial_\mu \left[  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi  - \delta_\nu^{\mu}  \mathcal{L} \right] = 0
を得る.ここで現れるテンソル

\displaystyle
\qquad
T_\nu^\mu =  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi  - \delta_\nu^{\mu}  \mathcal{L}
はエネルギー・運動量テンソルと呼ばれるものである.

(エネルギー・運動量テンソル
エネルギー・運動量テンソル

\displaystyle
\qquad
T_\nu^\mu =  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi  - \delta_\nu^{\mu}  \mathcal{L}
は任意の  \nu に対して,
\displaystyle
\qquad
\partial_\mu T_\nu^\mu  = 0
を満たす.

また,

\qquad
T_0^0 = \frac{\partial \mathcal{L}}{\partial \dot{\phi}} \dot{\phi} - \mathcal{L}
ハミルトニアン密度,

\displaystyle
\qquad
\mathbb{T}_0 = (T_0^1, T_0^1, T_0^3)
をエネルギーの流束と呼ぶ.

さらに,

\displaystyle
\qquad
P_i = \int T_i^0 d^3 \mathbb{x}
を場の運動量と呼ぶ.

得られた式のうち,\nu = 0 の場合は
\displaystyle
\qquad
\frac{\partial}{\partial_t} T_0^0 + \mathrm{div} \mathbb{T}_0 = 0
はエネルギー保存を意味する.実際,エネルギーの流速が遠方で  0 と仮定するとガウスの発散定理により,

\displaystyle
\qquad
\frac{\partial}{\partial t}\int T_0^0 d^3 \mathbb{x} = -\int \mathrm{div} \mathbb{T}_0  d^3 \mathbb{x} = 0
となる.同様に, T_i^j が遠方で  0 と仮定すれば,運動量保存

\displaystyle
\qquad
\frac{\partial}{\partial t} P_i = \frac{\partial}{\partial t}\int T_i^0 d^3 \mathbb{x} = -\int \mathrm{div} \mathbb{T}_i  d^3 \mathbb{x} = 0
を得る.

ラグランジュ形式によるマクスウェル方程式

前回求めたように,ポテンシャルを用いたときのマクスウェル方程式
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
と定義したときに

\displaystyle
\qquad
\partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}
と書ける.この方程式を導くラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4 \mu_0} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
である.実際,

\displaystyle
\qquad
S = \int \left[ - \frac{1}{4 \mu_0} g_{\mu \lambda} g_{\nu \rho} F^{\lambda \rho} F^{\mu \nu} - j^{\mu} A_\mu \right] d^4 x
なので,

\displaystyle
\qquad
\begin{align}
\delta S &=  \int \left[ - \frac{1}{2 \mu_0} g_{\mu \lambda} g_{\nu \rho} F^{\lambda \rho} \delta F^{\mu \nu} - j^{\mu} \delta A_\mu \right] d^4 x \\
&= \int \left[ - \frac{1}{2 \mu_0}  F^{\lambda \rho} (\partial_{\lambda} \delta A_{\rho} - \partial_\rho \delta A_{\lambda}) -  j^{\mu} \delta A_\mu \right] d^4 x \\
&= \int \left[ - \frac{1}{\mu_0} F^{\lambda \rho} \partial_{\lambda} \delta A_{\rho}  -  j^{\mu} \delta A_\mu \right] d^4 x \\
&= \int \left[  \frac{1}{\mu_0} \partial_\mu F^{\mu \nu} -  j^{\nu}\right]  \delta A_\nu d^4 x 
\end{align}
により,

\qquad
\displaystyle
\frac{1}{\mu_0} \partial_\mu F^{\mu \nu} -  j^{\nu} = 0
を得る.

(電磁場のラグランジアン密度)
電磁場のラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4 \mu_0} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
である.ここで,
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおいた.

ここで,ゲージ変換の意味を考え直す.ゲージ変換

\qquad
\displaystyle
A^{\mu} \rightarrow A^{\mu} + \partial^{\mu} \chi
によって,
 
\qquad
\displaystyle
F^{\mu \nu} \rightarrow F^{\mu \nu} + (\partial^\mu \partial \nu  \chi - \partial^\nu \partial^{\nu} \chi ) = F^{\mu \nu}
となるので  F^{\mu \nu} は変化しない.なので作用の変化を計算すると,

\qquad
\displaystyle
\begin{align}
S & \rightarrow S - \int j_\mu \partial^{\mu} \chi d^4 x \\
&= S + \int (\partial^\mu j_\mu) \chi d^4 x
\end{align}
となる.よって,任意の  \chi で作用  S が変化しないための条件は

\displaystyle
\qquad
\partial^\mu j_\mu  = \partial_\mu j^\mu = 0
である.この式は電荷の保存則であった.つまり,マクスウェル方程式から電荷の保存が得られるが,一方で電荷の保存がゲージ変換による作用の不変性を与える.

続き
tetobourbaki.hatenablog.com