記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

理想的な物理理論としての電磁気学

この記事は以下の一連の記事の最終回ですが,今回の内容が目標だったので,できるだけこれまでの記事を読まなくても理解できるように説明していく.
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com
tetobourbaki.hatenablog.com

今回使う知識

これまで説明したことで,今回使うものを復習する.ただし, c = 1, \hbar = 1, \mu_0 = 1 として書き直している.以下ではアインシュタインの規約を用いている.

(電磁場のマクスウェル方程式
ポテンシャル  A^\mu = (\phi, A_x, A_y, A_z) に対して
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおくと,電磁場のラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
であり,そのオイラーラグランジュ方程式としてマクスウェル方程式

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} = j^{\nu}
を得る.任意の関数  \chi に対して定義されるゲージ変換

\qquad
\displaystyle
A^\mu \rightarrow A^\mu + \partial^\mu \chi
により,作用(ラグランジアン密度の積分)は不変である.

(自由空間におけるDirac方程式)
自由空間におけるDirac方程式のラグランジアン密度は

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
であり,Dirac方程式は

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
である.

ここで, \gamma^\mu は行列であり,また,ある行列  \beta を用いて

\qquad
\displaystyle
\bar{\psi} = \psi^{\dagger} \beta = {\psi^*}^{\mathrm{T} } \beta
としているが,これらの行列が具体的にどのようなものであるかは今回の内容に影響しない.

ゲージ共変性による電磁場の導入


上で述べたのは自由空間のDirac方程式である.つまり,外力が働かないときに,純粋に量子力学的な効果だけを見ている方程式である.電子に電場による外力がかかったときの方程式は,ハミルトニアン正準量子化で電磁場を含んだ方程式を導くことができるが,一旦電磁場のことを忘れて別の視点から電磁場が自然に現れることをみる.


Dirac方程式のラグランジアン密度

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
を考える.このとき,定数 \theta を用いて,

\qquad
\displaystyle
\psi \rightarrow e^{-i \theta} \psi
と変換しても,ラグランジアン密度は変化しない.なぜなら,真ん中の項の微分や行列は関係なくて実質  \bar{\psi}  \psi の形なので,上の変換で  \bar{\psi}  \psi \rightarrow \bar{\psi}  e^{i \theta} e^{-i \theta} \psi = \bar{\psi}  \psi となるからである.これを大域的なゲージ変換という.変換をさらに一般化して,定数  q (これは  1 でも良い)と関数  \chi を用いた変換

\qquad
\displaystyle
\psi \rightarrow e^{-i q \chi} \psi
ラグランジアン密度が不変になるようにするにはどうすればいいかを考える.このままでは,Dirac方程式の真ん中の項の微分があるため不変にならないのであるが,計算すると

\qquad
\displaystyle
\begin{align}
 \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi & \rightarrow \bar{\psi} e^{i q \chi} (i \gamma^\mu \partial_\mu - m) e^{-i q \chi} \psi \\
&=  \bar{\psi} e^{i q \chi} e^{-i q \chi} (i \gamma^\mu \partial_\mu - m) \psi + \bar{\psi} e^{i q \chi} i  \gamma^\mu   (- i q e^{-i q \chi} \partial_\mu \chi )  \psi \\
&=  \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi + \bar{\psi} q \gamma^\mu   (\partial_\mu \chi)  \psi
\end{align}
となるので, \bar{\psi} q \gamma^\mu   (\partial_\mu \chi)  \psi という余分な項が出てきてしまう.そこで,(電磁場のことはとりあえず忘れて) A^\mu という場で

\qquad
\displaystyle
A^\mu \rightarrow A^\mu + \partial^\mu \chi
と変化するものを考えて,Dirac方程式の  i \gamma^\mu \partial_\mu の項を  \gamma^\mu ( i \partial_\mu - q A_\mu) と書き換えたラグランジアン

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi
\end{align}
を考える.そうすると,上の変換で,

\qquad
\displaystyle
\begin{align}
 \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi & \rightarrow  \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi +  \bar{\psi}  \gamma^\mu (  q \partial_\mu \chi - q \partial_\mu \chi ) \psi \\
&= \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi
\end{align}
となり,ラグランジアンは不変になる.このような変換

\qquad
\displaystyle
\psi \rightarrow e^{-i q \chi} \psi
を局所的なゲージ変換という.それは, \chi が関数のため,時空間に依存して変化が変わるからである.ゲージ変換というときにはこの局所的なゲージ変換を指すことが多い.


上のラグランジアンでは,A^\mu の運動の情報が入っていないため,それを表すために,例えば
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおいて,ラグランジアン密度を

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \bar{\psi} [ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu \\
&= \bar{\psi} i \gamma^\mu   \partial_\mu  - m) \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - ( j^{\mu} + q  \bar{\psi} \gamma^\mu \psi ) A_\mu
\end{align}
と考える.ここで  F_{\mu \nu} F^{\mu \nu} j^{\mu} A_\mu の添加のみを考えた理由は後で説明する.すると, \bar{\psi}オイラーラグランジュ方程式を考えれば,Dirac方程式を変形した

\qquad
\displaystyle
[ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi = 0
を得る.また, A^\muオイラーラグランジュ方程式を考えればマクスウェル方程式を変形した

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} =  j^{\mu} + q  \bar{\psi} \gamma^\mu \psi
を得る.


ここで,電磁場のポテンシャルのゲージ変換は  A^\mu \rightarrow A^\mu + \partial^\mu \chi となることを知っているので,上で必要となった  A^\mu は電磁場のポテンシャルではないかと期待できる.実際に,外部電磁場の中を電荷  q で運動する 1 粒子のハミルトニアンから方程式を計算すれば,

\qquad
\displaystyle
[ \gamma^\mu ( i \partial_\mu - q A_\mu) - m] \psi = 0
となることが分かる.電流  j^\mu はもちろん電子の動きを表しているため,電磁場の下で動く 1 粒子の影響が電流としても合わられるはずである.実際,マクスウェル方程式

\qquad
\displaystyle
 \partial_\mu F^{\mu \nu} =  j^{\mu} + q  \bar{\psi} \gamma^\mu \psi
となった.つまり,粒子  \psi からは  q  \bar{\psi} \gamma^\mu \psi の分が電流密度として反映される.


Dirac方程式の(局所的)ゲージ共変性から電磁場のポテンシャルと同じ変換がなされる場  A^\mu が現れることを導いたが,先歴史的には先に方程式があって,それがゲージ共変性をもっていたという流れのはずである.しかし,今回述べたように,電子の相互作用を表すために電磁場が必要となるという見方ができる.そのように見れば,相互作用する粒子一般に対して,電磁場のような相互作用を表すための場が必要になるという予想を立てることができる.


ただし,そのように見るには,本当にこの見方が電磁場においても正しいかということを考える必要がある.例えば, A^{\mu} の運動を表すために,なぜ  F_{\mu \nu} F^{\mu \nu} j^{\mu} A_\mu の項のみを考えて他の項は考えなかったのかを正当化しなければならない.まず,最終的なラグランジアン密度はゲージ不変でなければならない.F_{\mu \nu} F^{\mu \nu} A^\mu微分  \partial^\mu A^\nu で定義されており,偏微分の交換可能性からゲージ変換でも不変になるのであった.また, j^{\mu} A_\mu電荷の保存則  j^{\mu} \partial_\mu = 0 が作用の不変性を表すのであった.それ以外の項として例えば
 A_\mu A^\mu を考えると,ゲージ変換によって

\qquad
\displaystyle
\begin{align}
A_\mu A^\mu &\rightarrow (A_\mu + \partial_\mu \chi) ( A^\mu + \partial^\mu \chi) \\
&= A_\mu A^\mu + (\partial_\mu \chi ) A^\mu + A_\mu (\partial^\mu \chi) + (\partial_\mu \chi) (\partial^\mu \chi)
\end{align}
となり,一般にはゲージ変換で不変ではない.粒子の場合は,微分を取らないものの積は  m \bar{\psi} \psi の形で入っており,この項は質量を表していた.よって, A_\mu A^\mu のような微分を取らないものの積を質量項という.上で見たように,質量項があるとゲージ不変とはならないため,粒子の相互作用を表すために導入した場  A^\mu は質量を持たないと期待される.よって,ゲージ不変性を考えると  A^{\mu} の運動を表すために添加していい項は限られてくることが分かる.

粒子の相互作用を担う場を与える描像とその後の発展


前節の内容を一般化することで,相互作用する粒子に対して場が必要となる流れが定式化できたことになる.

(1) ある粒子のラグランジアンを考え,適当なゲージ変換を考える

(2) ゲージ変換のズレを消去するための項を生み出すような場を導入する

(3) ゲージ変換で不変になる程度に場の運動を表す項を添加する

もし現実がこの通りになっているのなら,相互作用を表す場は質量がないことが予想される.


さて,今回の内容がその後の素粒子理論の出発点となる.(以下は私が理解できているわけではありません)

(i) Dirac方程式は負のエネルギーの問題が出る.それは場を量子化する,つまり,A^\mu などの場を演算子と考えることで解決される.このような理論を量子場の理論という.(これまでの内容は古典場の理論.)電磁場の下でのDirac方程式を量子化すれば,量子電磁力学(QED)になる.相互作用を担う場は質量のないボーズ粒子によってなされることになる.例えば,光子の質量は 0である.

(ii) 上の流れ通りであれば,相互作用を担うボーズ粒子は質量がないはずであるが,実際にはそうではない.そこで,質量を得るための説明が必要となる.それがヒッグス機構であり,自発的対称性の破れからヒッグス場との相互作用により質量を得るという説明をする.

素粒子理論についての解説として
  ピーター・ウォイト『ストリング理論は科学か』
をオススメする.数式をほとんど使わなくても,かなり高度なことまで説明している.特に,最初に加速器実験についてかなり詳しく説明しており,この分野の感覚や実験で何が分かるのかといったことも教えてくれる.

共変微分

ゲージ変換の不変性を持たせるために場を導入したが,もう少し違う見方をする.ゲージ変換で不変になるために,微分   i \partial_\mu  i \partial_\mu - q A_\mu に書き換える必要があった.変更後はゲージ変換で不変になるような微分だと見ることができるので, \mathbb{D}_\mu = i \partial_\mu - q A_\mu とおき,これを共変微分と呼ぶ.つまりラグランジアンはゲージ変換で不変となる項のみで書かれているので明らかにゲージ不変になるという見方ができる.

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \bar{\psi} [ \gamma^\mu ( \mathbb{D}_\mu - m)] \psi - \frac{1}{4} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
\end{align}
実質的にはこれまでの説明と同じではあるが気持ちがずいぶん違う.これまでの説明は,不変になるように補正項を加えるというニュアンスであった.一方でこの説明は,登場するものが全てゲージ不変になるように,特に,微分を共変微分に書き換える,という説明である.その視点で見ると,電磁場とは,共変微分で普通の微分には現れないズレの項なのである.

理想的な物理理論としての電磁気学(4)

以下の記事の続きです.
tetobourbaki.hatenablog.com

一連の記事の目的としては,あとはゲージ変換やゲージ不変性について説明すれば終わりです.参考にしている牟田『電磁気学』では非相対論的な電子の場を使って議論をしているため,これと同じ説明をすると流れが悪くなってしまいます.そこで,この記事ではDirac方程式を説明することにします.ただし, c = 1,\, \hbar = 1 となる単位系をとることにします.

Dirac方程式


再度注意するが, c = 1,\, \hbar = 1 となる単位系を取って議論する.よって,\displaystyle \partial_0 = \frac{\partial}{\partial (ct)} = \frac{\partial}{\partial t} となっている.Dirac方程式を一から説明するのは大変なので,大きく端折る.シュレディンガー方程式特殊相対性理論と整合性があるように変形した以下のものが自由空間におけるDirac方程式である.

\qquad
\displaystyle
i \frac{\partial \psi}{\partial t} +i  \sum_{j=1}^3 \alpha^j \frac{\partial \psi}{\partial x^j} - m \beta \psi = 0
ここで,いくつも注意することがある.まず, \alpha^1, \alpha^2, \alpha^3, \beta 4 \times 4 の行列である.なので, \psi は 4成分のベクトルであり,Dirac方程式は 4連立の方程式になっている.次に, \alpha^1, \alpha^2, \alpha^3, \beta は以下の性質を満たす行列である.

\qquad
\displaystyle
\begin{align}
&\beta^2 = E_4 \\
&\alpha^j \beta + \beta \alpha^j = 0 \\
&\alpha^j \alpha^k + \alpha^k \alpha^j = 2 \delta^{kj} E_4
\end{align}
ここで,単位行列 E_n で表している.ここで,パウリ行列

\qquad
\displaystyle
\sigma_1 =
\left(
\begin{matrix}
0 & 1\\
1 & 0
\end{matrix}
\right), \quad
\sigma_2 = 
\left(
\begin{matrix}
0 & -i \\
i & 0
\end{matrix}
\right),
\quad
\sigma_3 = 
\left(
\begin{matrix}
1&0 \\
0& -1
\end{matrix}
\right)
を用いて,

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
0 & \sigma_k \\
\sigma_k & 0
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
E_2 & 0 \\
0 & -E_2
\end{matrix}
\right)
とおけば,満たすべき性質を満たしている. \alpha^1, \alpha^2, \alpha^3, \beta は他の取り方をとっても良い.


Dirac方程式に  \beta をかけて,\gamma^0 = \beta,  \gamma^{j} = \beta \alpha^j とおけば,

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
と書くことができる.次に,Dirac方程式をラグランジアン密度の場の方程式として書くことを考える.以前は実数の変数を考えていたが,\psi は複素値なので,実部と虚部を独立の変数と考えて変分法を使うことができる.*1しかし,それはちょっと面倒である.実は  \psi の実部と虚部の代わりに, \psi複素共役  \psi^* を独立の変数と考えて変分法を使っても良いことが知られている.そこで, \psi^{\dagger} = (\psi^*)^{\mathrm{T}}, \bar{\psi} = \psi^\dagger \beta とおき,ラグランジアン密度を

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= \psi^\dagger ( i \partial_0 +  \alpha^{j} \partial_j - \beta m) \psi \\
&= \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
とおけば,( \psi^\dagger \bar{\psi} を変数としてオイラーラグランジュ方程式を計算すれば,)このラグランジアン密度からDirac方程式が得られる.

(自由空間におけるDirac方程式)
自由空間におけるDirac方程式のラグランジアン密度は

\qquad
\displaystyle
\begin{align}
\mathcal{L} = \bar{\psi} (i \gamma^\mu \partial_\mu - m) \psi
\end{align}
であり,Dirac方程式は

\qquad
\displaystyle
(i \gamma^\mu \partial_\mu - m) \psi = 0
である.

Dirac方程式のローレンツ変換


ゲージ変換とは関係がないが,相対性理論との繋がりを知るために,ローレンツ変換との関係も述べておく.この節は飛ばしても次に進むことができる.計算を進めるために,上で述べたのと異なる行列  \alpha^1, \alpha^2, \alpha^3, \beta を取ろう.以下のような表示をカイラル表示という.

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right)
このとき,

\qquad
\displaystyle
\psi = \left(\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
とおけば,Dirac方程式は

\qquad \displaystyle
i \left(
\begin{matrix}
E_2 & 0 \\
0 & E_2
\end{matrix}
\right)
 \left(\begin{matrix}
\partial_0 \psi_{\mathrm{L}} \\
\partial_0 \psi_{\mathrm{R}}
\end{matrix}
\right)
+
 i
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
 \left(\begin{matrix}
\partial_j \psi_{\mathrm{L}} \\
\partial_j \psi_{\mathrm{R}}
\end{matrix}
\right)
 - m
 \left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right)
 \left(
\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
= 0
つまり,Dirac方程式は 2連立方程式
 \displaystyle
\qquad
\begin{align}
 i E_2 \partial_0 \psi_{\mathrm{L}} - i \sigma^j \partial_j \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\
 i E_2 \partial_0 \psi_{\mathrm{R}} + i \sigma^j \partial_j \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
で書ける.よって,

\displaystyle
\qquad
\sigma^{\mu} = (E_2, \sigma^1, \sigma^2, \sigma^3),\quad  \tilde{\sigma}^{\mu} = (E_2, -\sigma^1, -\sigma^2, -\sigma^3)
とおけば,Dirac方程式は

\displaystyle
\qquad
\begin{align}
 i \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\ 
 i \sigma^\mu \partial_\mu \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
と書ける.

Dirac方程式のカイラル表示)

\qquad
\displaystyle
\alpha_j = 
\left(
\begin{matrix}
 - \sigma^j & 0 \\
0 & \sigma^j
\end{matrix}
\right)
, \quad \beta = 
\left(
\begin{matrix}
0 & E_2 \\
E_2 & 0
\end{matrix}
\right),
\quad
\psi = \left(\begin{matrix}
\psi_{\mathrm{L}} \\
\psi_{\mathrm{R}}
\end{matrix}
\right)
とおけば,ラグランジュ密度が

\qquad
\displaystyle
\mathcal{L} = i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
であり,Dirac方程式が

\displaystyle
\qquad
\begin{align}
 i \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L}} - m \psi_{\mathrm{R}} = 0 \\ 
 i \sigma^\mu \partial_\mu \psi_{\mathrm{R}} - m \psi_{\mathrm{L}} = 0 
\end{align}
と書ける.


時空間  x^\mu が以下のようにローレンツ変換しているとする.

\qquad
\displaystyle
{x^{\mu} } ' = a^{\mu}_{\ \ \nu} x^{\nu}
このとき,

\qquad
\displaystyle
\partial_{\mu}  = a^{\nu}_{\ \ \mu} {\partial_{\mu}}'
に注意する.場  \psi_{\mathrm{L}}, \psi_{\mathrm{R}}

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
と変化すると仮定すると,ラグランジアンローレンツ変換で不変とすれば,

\qquad
\displaystyle
\begin{align}
\mathcal{L} &= i { {\psi_{\mathrm{L} } }' }^\dagger \tilde{\sigma}^\mu {\partial_\mu}' {\psi_{\mathrm{L} }}'+ I { {\psi_{\mathrm{R} }}' }^\dagger \sigma^\mu {\partial_\mu}' {\psi_{\mathrm{R} } }' - m ({{\psi_{\mathrm{L} } }' }^{\dagger} { \psi_{\mathrm{R}} }' + { {\psi_{\mathrm{R} } }' }^{\dagger} {\psi_{\mathrm{L} } }' ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \mathbb{M}^{\dagger} \tilde{\sigma}^\mu {\partial_\mu}' \mathbb{M} \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \mathbb{N}^{\dagger} \sigma^\mu {\partial_\mu}' \mathbb{N} \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \mathbb{M}^{\dagger} \mathbb{N}  \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \mathbb{N}^{\dagger} \mathbb{M} \psi_{\mathrm{L} } ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} {\partial_\mu}'  \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \mathbb{N}^{\dagger} \sigma^\mu  \mathbb{N} {\partial_\mu}' \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \mathbb{M}^{\dagger} \mathbb{N}  \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \mathbb{N}^{\dagger} \mathbb{M} \psi_{\mathrm{L} } ) \\
\mathcal{L} &=  i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } ) \\
&= i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\nu a^{\mu}_{\ \ \nu} {\partial_\mu}' \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\nu a^{\mu}_{\ \ \nu} {\partial_\mu}' \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
\end{align}
となるから,

\qquad 
\displaystyle
\begin{align}
& \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} = a^{\mu}_{\ \ \nu} { \tilde{\sigma} }^\mu \\
& \mathbb{N}^{\dagger} \sigma^\mu \mathbb{N} = a^{\mu}_{\ \ \nu} {\sigma}^\mu \\
& \mathbb{M}^{\dagger} \mathbb{N} = E_2 \\
& \mathbb{N}^{\dagger} \mathbb{M} = E_2
\end{align}
となっている必要がある.任意のローレンツ変換に対して,上のような行列  \mathbb{M}, \mathbb{N} が存在することが知られている.つまり,ラグランジアンが不変になるためには,場  \psi_{\mathrm{L}}, \psi_{\mathrm{R}}

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
と変換する必要があることがわかった.

Dirac方程式のローレンツ変換
カイラル表示したDirac 方程式のラグランジュ密度

\qquad
\displaystyle
\mathcal{L} = i {\psi_{\mathrm{L} } }^\dagger \tilde{\sigma}^\mu \partial_\mu \psi_{\mathrm{L} }+ i {\psi_{\mathrm{R} } }^\dagger \sigma^\mu \partial_\mu \psi_{\mathrm{R} } - m ({\psi_{\mathrm{L} } }^{\dagger} \psi_{\mathrm{R}} + {\psi_{\mathrm{R} } }^{\dagger} \psi_{\mathrm{L} } )
ローレンツ変換

\qquad
\displaystyle
{x^{\mu} } ' = a^{\mu}_{\ \ \nu} x^{\nu}
に対して

\qquad 
\displaystyle
\begin{align}
& \mathbb{M}^{\dagger} \tilde{\sigma}^\mu \mathbb{M} = a^{\mu}_{\ \ \nu} { \tilde{\sigma} }^\mu \\
& \mathbb{N}^{\dagger} \sigma^\mu \mathbb{N} = a^{\mu}_{\ \ \nu} {\sigma}^\mu \\
& \mathbb{M}^{\dagger} \mathbb{N} = E_2 \\
& \mathbb{N}^{\dagger} \mathbb{M} = E_2
\end{align}
を満たす場の変換

\qquad
\displaystyle
\begin{align}
&{ \psi_{\mathrm{L}} }' = \mathbb{M}  \psi_{\mathrm{L}} \\
&{ \psi_{\mathrm{R}} }' = \mathbb{N}  \psi_{\mathrm{R}}
\end{align}
によって不変である.

電磁気の場合と同じように,ローレンツ不変になるように物理量の変換を自分で決めるという仕組みになっている.

*1:本当はラグランジアンがエルミートで変分が実数値でなければいけないが,この問題を今回は無視する.

理想的な物理理論としての電磁気学(3)

ラグランジュ密度を用いて微分方程式を出す方法とその利点をまとめていきます.
以下の記事の続きです.
tetobourbaki.hatenablog.com

今回はコッティンガム,グリーンウッドの『素粒子標準模型入門』を参考にしています.

連続系のラグランジュ形式


普通の解析力学ではラグランジュ形式で常微分方程式を導くことができた.連続系の場合で使われる,ラグランジュ密度を用いて偏微分方程式を導く方法を私は知らなかったので,まずは具体例でそれを見ていく.


両端を固定した弦を考える.張力によるポテンシャルエネルギーは

 \qquad 
\displaystyle 
T = \int_0^l \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 dx
であり,弦の運動エネルギーは

\qquad
\displaystyle
V = \int_0^l \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2 dx
と書ける.よって,ラグランジアン

\qquad
\displaystyle
 L := T - V = \int_0^l \left\{ \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 -  \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2 \right\} dx
となる.すると作用は

\qquad
\displaystyle
 S:= \int_0^{t_0} L \, dt
であるが,

\qquad
\displaystyle
\mathcal{L} :=  \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 -  \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2
とおけば,

\displaystyle
\qquad
S = \int_0^{t_0} \int_0^l \mathcal{L} \,dx dt
と書ける.この \mathcal{L}ラグランジュ密度と呼ぶ.


ラグランジュ密度は  \displaystyle \dot{\phi} = \frac{\partial \phi}{\partial t}  \displaystyle \phi' = \frac{\partial \phi}{\partial x} に依存しているので, \mathcal{L} = \mathcal{L} (\dot{\phi}, \phi') と書く.作用 S の変分を計算すると,
 
\qquad
\displaystyle
\delta S = \int_0^{t_0} \int_0^l \left[ \frac{\partial \mathcal{L} }{\partial \dot{\phi} }  \delta (\dot{\phi} ) +  \frac{\partial \mathcal{L} }{\partial \phi'}  \delta (\phi' ) \right] dx dt
であるが, \delta (\dot {\phi}) = \frac{\partial}{\partial t} (\delta \phi), \, \delta (\phi') = (\delta \phi)' に注意して,さらに任意の  t \phi(t,0) = \phi(t, l) = 0 かつ任意の x \phi (0,x) = \phi (t_0, x) を仮定すると,部分積分により,
 
\qquad
\displaystyle
\delta S = - \int_0^{t_0} \int_0^l \left[\frac{\partial  }{\partial t}   \frac{\partial \mathcal{L} }{\partial \dot{\phi} }  + \frac{\partial  }{\partial x }  \frac{\partial \mathcal{L} }{\partial \phi'} \right] \delta(\phi) dx dt
となる.よって,任意の任意の変分  \delta( \phi) \delta S = 0 を課するとオイラー方程式

\qquad
\displaystyle
\frac{\partial  }{\partial t}   \frac{\partial \mathcal{L} }{\partial \dot{\phi} }  + \frac{\partial  }{\partial x }  \frac{\partial \mathcal{L} }{\partial \phi'}  = 0
を得る.今のラグランジアンでは方程式

\qquad
\displaystyle
\rho \frac{\partial^2 \phi}{\partial t^2} - F \frac{\partial^2 \phi}{\partial x^2} = 0
を得る.これは波動方程式である.

ローレンツ共変な場の理論


前回の記事で導入した4次元変数  x^{\mu} を考える.ラグランジアン

\qquad
\displaystyle
S = \int \mathcal{L} \, dx^0 dx^1 dx^2 dx^3
となる.積分は時空間全体をとる.さて,作用  Sローレンツ不変になっているのが自然であろう.微分形式  dx^0 dx^1 dx^2 dx^3ローレンツ不変であることが分かるので, \mathcal{L}スカラーであるべきであり,もっというとスカラーに依存した関数であると考えるのが自然である.


今回はスカラー \phi(x^{\mu} ) = \phi(t, x, y, z) を用いて書けるラグランジアン密度

\qquad
\mathcal{L} = \mathcal{L} (\phi, \partial_\mu \phi) = \mathcal{L} ( \phi, \partial_t \phi, \partial_x \phi, \partial_y \phi, \partial_z \phi)
を考える.特にこの場合は \mathcal{L} が座標  x^{\mu} に直接は依存していないことが重要である.変分を取って,無限遠方で  \delta (\phi) = 0 を課すると部分積分により,

\qquad
\displaystyle
\begin{align}
\delta S & = \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} \delta (\phi) +  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi ) \right] dx^0 dx^1 dx^2 dx^3 \\
&=  \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} \delta (\phi) +  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\mu ( \delta \phi ) \right] dx^0 dx^1 dx^2 dx^3 \\
&=  \int \left[ \frac{\partial \mathcal{L} }{\partial \phi}  - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \right] ( \delta \phi ) dx^0 dx^1 dx^2 dx^3 
\end{align}
よって,任意の変分 \delta \phi \delta S = 0 とすると,場の方程式

\qquad
\displaystyle
\frac{\partial \mathcal{L} }{\partial \phi}  - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } = 0
を得る.

(場の方程式)
作用の変分の条件から得られる以下の方程式を場の方程式と呼ぶ.

\qquad
\displaystyle
\frac{\partial \mathcal{L} }{\partial \phi}  - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } = 0


電磁場に戻る前に,もう少し一般論を考える.エネルギー保存は時間  t の平行移動による対称性から導出されるのであった.また,運動量の保存は空間の平行移動による対称性から導出されるのであった.今の記法を用いれば微小な平行移動は

\qquad
x^\mu \rightarrow x^\mu + \delta a^{\mu}
と書くことができる.このときのラグランジュ密度の変分を二つの方法で計算する.場の方程式を用いれば,

\qquad
\displaystyle
\begin{align}
\delta \mathcal{L} &= \frac{\partial \mathcal{L} }{\partial \phi}  \delta \phi + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi) \\
&=\partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta \phi  + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi) \\
&=\partial_\mu  \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta \phi \right]
\end{align}
今の変分の取り方から

\qquad
\displaystyle
\delta \phi = \partial_\nu \delta a^\nu
なので,

\qquad
\displaystyle
\delta \mathcal{L}  =\partial_\mu  \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi \right] \delta a^{\nu}
である.一方, \mathcal{L} x^{\mu} に直接は依存していないことに注意して,記号の乱用ではあるが, \displaystyle \frac{\partial \mathcal{L}}{\partial x^\nu} = \frac{\partial }{\partial x^\nu} \mathcal{L} (\phi(x^\mu), \partial_\mu \phi (x^\mu) ) と書くことにすると,今の変分の取り方では


\qquad
\displaystyle
\begin{align}
\delta \mathcal{L}  &=  \frac{\partial \mathcal{L} }{\partial x^\mu}  \delta a^{\mu} \\
 &=  \delta_\nu^{\mu} \frac{\partial \mathcal{L} }{\partial x^\mu}  \delta a^{\nu} \\
&= \partial_\mu \delta_\nu^{\mu}  \mathcal{L}   \delta a^{\nu}
\end{align}
と書ける.よって,平行移動の任意の変分で  \delta \mathcal{L} の計算の仕方が等しいという条件から

\qquad
\displaystyle
\partial_\mu \left[  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi  - \delta_\nu^{\mu}  \mathcal{L} \right] = 0
を得る.ここで現れるテンソル

\displaystyle
\qquad
T_\nu^\mu =  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi  - \delta_\nu^{\mu}  \mathcal{L}
はエネルギー・運動量テンソルと呼ばれるものである.

(エネルギー・運動量テンソル
エネルギー・運動量テンソル

\displaystyle
\qquad
T_\nu^\mu =  \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi  - \delta_\nu^{\mu}  \mathcal{L}
は任意の  \nu に対して,
\displaystyle
\qquad
\partial_\mu T_\nu^\mu  = 0
を満たす.

また,

\qquad
T_0^0 = \frac{\partial \mathcal{L}}{\partial \dot{\phi}} \dot{\phi} - \mathcal{L}
ハミルトニアン密度,

\displaystyle
\qquad
\mathbb{T}_0 = (T_0^1, T_0^1, T_0^3)
をエネルギーの流束と呼ぶ.

さらに,

\displaystyle
\qquad
P_i = \int T_i^0 d^3 \mathbb{x}
を場の運動量と呼ぶ.

得られた式のうち,\nu = 0 の場合は
\displaystyle
\qquad
\frac{\partial}{\partial_t} T_0^0 + \mathrm{div} \mathbb{T}_0 = 0
はエネルギー保存を意味する.実際,エネルギーの流速が遠方で  0 と仮定するとガウスの発散定理により,

\displaystyle
\qquad
\frac{\partial}{\partial t}\int T_0^0 d^3 \mathbb{x} = -\int \mathrm{div} \mathbb{T}_0  d^3 \mathbb{x} = 0
となる.同様に, T_i^j が遠方で  0 と仮定すれば,運動量保存

\displaystyle
\qquad
\frac{\partial}{\partial t} P_i = \frac{\partial}{\partial t}\int T_i^0 d^3 \mathbb{x} = -\int \mathrm{div} \mathbb{T}_i  d^3 \mathbb{x} = 0
を得る.

ラグランジュ形式によるマクスウェル方程式

前回求めたように,ポテンシャルを用いたときのマクスウェル方程式
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
と定義したときに

\displaystyle
\qquad
\partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}
と書ける.この方程式を導くラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4 \mu_0} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
である.実際,

\displaystyle
\qquad
S = \int \left[ - \frac{1}{4 \mu_0} g_{\mu \lambda} g_{\nu \rho} F^{\lambda \rho} F^{\mu \nu} - j^{\mu} A_\mu \right] d^4 x
なので,

\displaystyle
\qquad
\begin{align}
\delta S &=  \int \left[ - \frac{1}{2 \mu_0} g_{\mu \lambda} g_{\nu \rho} F^{\lambda \rho} \delta F^{\mu \nu} - j^{\mu} \delta A_\mu \right] d^4 x \\
&= \int \left[ - \frac{1}{2 \mu_0}  F^{\lambda \rho} (\partial_{\lambda} \delta A_{\rho} - \partial_\rho \delta A_{\lambda}) -  j^{\mu} \delta A_\mu \right] d^4 x \\
&= \int \left[ - \frac{1}{\mu_0} F^{\lambda \rho} \partial_{\lambda} \delta A_{\rho}  -  j^{\mu} \delta A_\mu \right] d^4 x \\
&= \int \left[  \frac{1}{\mu_0} \partial_\mu F^{\mu \nu} -  j^{\nu}\right]  \delta A_\nu d^4 x 
\end{align}
により,

\qquad
\displaystyle
\frac{1}{\mu_0} \partial_\mu F^{\mu \nu} -  j^{\nu} = 0
を得る.

(電磁場のラグランジアン密度)
電磁場のラグランジアン密度は

\displaystyle
\qquad
\mathcal{L} = - \frac{1}{4 \mu_0} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu
である.ここで,
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおいた.

ここで,ゲージ変換の意味を考え直す.ゲージ変換

\qquad
\displaystyle
A^{\mu} \rightarrow A^{\mu} + \partial^{\mu} \chi
によって,
 
\qquad
\displaystyle
F^{\mu \nu} \rightarrow F^{\mu \nu} + (\partial^\mu \partial \nu  \chi - \partial^\nu \partial^{\nu} \chi ) = F^{\mu \nu}
となるので  F^{\mu \nu} は変化しない.なので作用の変化を計算すると,

\qquad
\displaystyle
\begin{align}
S & \rightarrow S - \int j_\mu \partial^{\mu} \chi d^4 x \\
&= S + \int (\partial^\mu j_\mu) \chi d^4 x
\end{align}
となる.よって,任意の  \chi で作用  S が変化しないための条件は

\displaystyle
\qquad
\partial^\mu j_\mu  = \partial_\mu j^\mu = 0
である.この式は電荷の保存則であった.つまり,マクスウェル方程式から電荷の保存が得られるが,一方で電荷の保存がゲージ変換による作用の不変性を与える.

続き
tetobourbaki.hatenablog.com

理想的な物理理論としての電磁気学(2)

今回は以下のブログの続きで、相対性理論に関連することをまとめる.
tetobourbaki.hatenablog.com

ローレンツ変換


物理学では,「座標が変わっても法則の形は変わらない」という信念がある.例えば,ニュートン運動方程式は座標変換で方程式の形が大きく変わってしまうが、ラグランジュ力学系におけるオイラーラグランジュ方程式ハミルトン力学系におけるハミルトン系は(適切な)変数変換で方程式の形が全く変わらない.


そこで,マクスウェル方程式の形が変わらないように適切な変数変換を考えるという問題意識が自然に現れる.もしそのような変換がなければ,マクスウェル方程式は基礎におく方程式と適切でない.ただし,座標の変換だけでなく, \mathbb{E}などの物理量を表す変数も適切に変換する必要があるという話になっていく.

ここでは,ローレンツ条件の下でのマクスウェル方程式から始めることにする.

ローレンツ条件の下でのマクスウェル方程式
ローレンツ条件
 \displaystyle
 \qquad \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0
の下で
 \displaystyle
\qquad
\begin{align}
&\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi =  \frac{1}{\epsilon} \rho \\
&\displaystyle  \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} =  \mu \mathbb{j}
\end{align}

ここで現れた特徴的な作用素
 
\qquad \displaystyle \Box := \epsilon \mu \frac{\partial^2}{\partial t^2} -\Delta
と定義しておこう.これはダランベルシアンと呼ばれる.まず簡単のため,電荷と電流がない真空の状況を考える.この時,マクスウェル方程式
 \displaystyle
\qquad
\begin{align}
\Box \phi = 0\\
\Box \mathbb{A} = 0
\end{align}
となる.空間だけの変換ではうまくいかないことが分かるので最初から,時間も合わせた4次元の変換  (t,\mathbb{x}) \rightarrow (t', \mathbb{x}) で方程式が
 \displaystyle
\qquad
\begin{align}
\Box' \phi' = 0\\
\Box' \mathbb{A}' = 0
\end{align}
のように形が全く変化しないための条件を考える.ここで, \phi', \mathbb{A}' は変換後の物理量であるが,うまくいくように後で決めることになる.


一般に考えるのは難しいので,まずは, x 方向に速度  v で動く物体から見た座標  (t', \mathbb{x}) を考える.仮定として,変換が線型で  y, z に関しては恒等変換になるという条件を課せば,考える変換は

\displaystyle
\qquad
\begin{align}
&x' = \gamma_1 (x - vt) \\
&y' = y\\
&z' = z\\
&t' = \gamma_2 (t + s x) 
\end{align}
となる. \gamma_1, \gamma_2, s は求めるパラメータである.マクスウェル方程式が不変になるように, \Box' = \Box となるための条件を考える.

\displaystyle
\qquad
\begin{align}
& \frac{\partial}{\partial t} = \gamma_2  \frac{\partial}{\partial t'} - v \gamma_1  \frac{\partial}{\partial x'} \\ 
& \frac{\partial}{\partial x} = \gamma_2  s \frac{\partial}{\partial t'}  + \gamma_1  \frac{\partial}{\partial x'}
\end{align}
となるので計算すると

\displaystyle
\qquad
\begin{align}
\Box = & \, \Box' + ( \epsilon_0 \mu_0 (\gamma_2^2 - 1) - \gamma_2^2 s^2 ) \frac{\partial^2}{\partial t'^2} \\
           &+ (\epsilon_0 \mu_0 v^2 \gamma_1^2 - \gamma_1^2 + 1)  \frac{\partial^2}{\partial x'^2} - 2 \gamma_1 \gamma_2 ( \epsilon_0 \mu_0 v + s) \frac{\partial^2}{\partial t \partial x'}
\end{align}
だから, c = \frac{1}{ \epsilon_0 \mu_0}, \beta = \frac{v}{c}とおくと,

\displaystyle
\qquad
\begin{align}
&s = - \frac{\beta}{c} \\
&\gamma_1^2 = \frac{1}{1 - \beta^2} \\
&\gamma_1^2 = \frac{1}{1 - \beta^2}
\end{align}
が分かる.ここで導入した  c はまさに光速を表すことになる. \gamma_1, \gamma_2 > 0 を仮定すれば,等速運動から見た座標への変換は

\displaystyle
\qquad
\begin{align}
&x' = \gamma_1 (x - vt) \\
&y' = y\\
&z' = z\\
&t' =  \gamma_1 \left( t - \frac{\beta}{c} x \right) 
\end{align}
であることが分かった.

(等速直線運動のローレンツ変換
座標系  (t, \mathbb{x}) から x 方向に  v で等速直線運動する座標系  (t', \mathbb{x}') への変換で  \Box' = \Box となるものは

\displaystyle
\qquad
\begin{align}
&x' = \gamma (x - vt) \\
&y' = y\\
&z' = z\\
&t' =  \gamma \left(t - \frac{\beta}{c} x \right) 
\end{align}
である.ここで,

\displaystyle
\qquad
\begin{align}
&c = \frac{1}{ \epsilon_0 \mu_0} \quad \beta = \frac{v}{c}, \quad \gamma = \frac{1}{\sqrt{1 - \beta^2}}
\end{align}
である.

このように相対性理論で出てくるローレンツ変換が現れる. c の意味が分かりやすいことがこの方法の魅力である.

テンソル


マクスウェル方程式に問題を戻ると,実はまだ問題は解決していない.なぜなら,この変換でゲージ条件が変わってしまうからである.このことに踏み込む前に,数学的な準備をしておく.


まず,空間と時間をまとめて4次元のベクトルとして扱った方が良さそうなので, x^{\mu} = (x^0, x^1, x^2. x^3) := (ct, x, y, z) と表すことにする.ギリシャ文字は0から3を動くとし,ローマ字は1から3まで動くとする. x^{\mu} はベクトルと  \mu 成分のどちらも表すことがあるので注意せよ.偏微分
 
\qquad \displaystyle \partial_{\mu} := \frac{\partial}{\partial x^{\mu}}
と表すことにする.下添字と上添字は区別していくので注意せよ.すると,ダランベルシアン

\qquad \displaystyle \Box = \partial_0 - \sum_{i=1}^3 \partial_i
となるが,計量テンソル  g_{\mu \nu}

\qquad \displaystyle g_{00} = 1, \quad g_{ii} = -1, \quad g_{\mu \nu} = 0 \, (\mu \neq \nu)
と定め,その逆行列 g^{\mu \nu} を定義すれば,

\qquad \displaystyle \Box = \sum_{\mu, \nu} g^{\mu \nu} \partial_\mu \partial_\nu
と書くことができる.今の場合, g_{\mu \nu} g^{\mu \nu} は成分が同じであるため違いが分からないように見えるが,上添字と下添字を区別していく.


ここからアインシュタインの規約を使っていく.つまり,下添字と上添字で同じ記号が現れた場合には(たびたび,上下が同じでも),それらに関する和をとることにする.例えば,ダランベルシアン

\qquad \displaystyle \Box = g^{\mu \nu} \partial_\mu \partial_\nu
と書くことができる.さらに,3次反対称テンソル  \epsilon^{ijk} (ijk) (123) の偶置換のとき 1, (ijk) (123) の奇置換のとき-1,それ以外のとき 0,と定めると  \mathbb{V} = (V^1, V^2, V^3) のローテーションの i 成分は

\qquad \displaystyle (\mathrm{rot} \mathbb{V})^i := \epsilon^{ijk} \partial_j V^k
と書くことができる.ここでアルファベット  i,j,k は 1から 3までを動くように和を取っていることに注意せよ.


さてローレンツ変換に戻ろう.ローレンツ変換ダランベルシアンを変化させないものであったが,一般に変数変換

\qquad \displaystyle {x^{\mu}}' = a^{\mu}_{\ \ \nu} x^\nu
と変換されるとき,ダランベルシアン

\qquad \displaystyle \Box = g^{\mu \nu} a^{\lambda}_{\ \ \mu} a^{\rho}_{\ \ \nu} \partial_{\lambda}' \partial_{\rho}'
となるので,ダランベルシアンが変わらないための条件は

\displaystyle \qquad  g^{\mu \nu} a^{\lambda}_{\ \ \mu} a^{\rho}_{\ \ \nu} = g^{\lambda \rho}
となる.実際,ローレンツ変換はこれを満たす.逆にこのような変換を一般のローレンツ変換と呼ぶことにする.

(一般のローレンツ変換
変数変換

\qquad \displaystyle {x^{\mu}}' = a^{\mu}_{\ \ \nu} x^\nu
ローレンツ変換であるとは,

\displaystyle \qquad  g^{\mu \nu} a^{\lambda}_{\ \ \mu} a^{\rho}_{\ \ \nu} = g^{\lambda \rho}
を満たすことを言う.

(注意.一般には二次形式  g_{\mu \nu} dx^{\mu} dy^{\nu} を不変にするものをローレンツ変換というが,今回はダランベルシアンの不変性で定義したのでこのようになった.今は  g_{\mu \nu} g^{\mu \nu} に違いはないためうまくいくが, 2次形式の不変性で定義した方が良い.)


さて,これからが大事である.座標  x^{\mu} と同じように変換されるものを反変ベクトルといい,反変テンソルg_{\mu \nu} をかけたものを共変ベクトルという.

(共変ベクトル,反変ベクトル,共変テンソル
変数変換が

\qquad \displaystyle {x^{\mu}}' = a^{\mu}_{\ \ \nu} x^\nu
となっているとき, U^{\mu} が反変ベクトルであるとは

\displaystyle \qquad  {U^{\mu}}' = a^{\mu}_{\ \ \nu} U^{\mu}
が成り立つことを言う.また,

\displaystyle \qquad {U_{\mu}} = g_{\mu \nu} U^{\mu}
 U^{\mu} の共変ベクトルという.

一般に, U^{\mu_1 \dots \mu_n} n 階の反変ベクトルであるとは変数変換で

\displaystyle \qquad  {U^{\mu_1 \dots \mu_n}}' = a^{\mu_1}_{\ \ \nu_1} \dots a^{\mu_n}_{\ \ \nu_n}  U^{\nu_1 \dots \nu_n}
が成り立つことを言う.

ここで, \partial^\mu := g^{\mu \nu} \partial_\nu と定義する.ローレンツ変換の条件式を用いれば,

\displaystyle
\qquad
\begin{align}
 {\partial^\mu}'& := g^{\mu \nu} {\partial_\nu}' \\
&=a^{\mu}_{\\ \lambda} g^{\lambda \rho} a^{\nu}_{\ \ \rho} {\partial_\nu}' \\
&=a^{\mu}_{\\ \lambda} g^{\lambda \rho} \frac{\partial {x^{\nu}}'}{\partial x^\rho}  \frac{\partial {x^{\alpha}}'}{\partial x^\nu}  \partial_\alpha \\
&=a^{\mu}_{\\ \lambda} g^{\lambda \rho}  \delta^{\alpha}_{\ \ \rho} \partial_\alpha \\
&=a^{\mu}_{\\ \lambda} g^{\lambda \rho} \partial_\rho \\
&=a^{\mu}_{\\ \lambda} \partial^{\lambda}
\end{align}
となる.つまり, \partial^\mu は反変ベクトルである.また,\partial_{\mu} = g_{\mu \nu} \partial^\nu となることが分かるので  \partial_{\mu} は共変ベクトルである.


ちょっと長かったが,以上の準備から以下の性質を得る.

(共変ベクトルと反変ベクトル内積スカラー性)
反変ベクトル  U^{\mu} と共変ベクトル  V_{\mu} に対して, U^{\mu} V_{\mu}ローレンツ変換で不変である.つまり,
 
\qquad \displaystyle {U^{\mu}}' {V_{\mu}}' =U^{\mu} V_{\mu}
が成り立つ.

これはローレンツ変換の定義から明らかである.実際,
 
\qquad \displaystyle
\begin{align}
 {U^{\mu}}' {V_{\mu}}' &=  g_{\mu \nu }{U^{\mu}}' {V^{\mu}}' \\
 &= g_{\mu \nu } a^{\mu}_{\ \ \lambda} a^{\mu}_{\ \ \rho} {U^{\lambda}} {V^{\rho}} \\
&= g_{\lambda \rho} {U^{\lambda}} {V^{\rho}}\\
&= {U^{\lambda}} {V_{\lambda}}
\end{align}
となる.


ダランベルシアン
 
\displaystyle
\qquad
\Box = g_{\mu \nu} \partial_\mu \partial_\nu = \partial_\mu \partial^{\nu}
と書けることからも,ローレンツ不変であることがわかる.

ローレンツ共変性

マクスウェル方程式の問題に戻ろう.今の所,
ローレンツ条件
 \displaystyle
 \qquad \frac{1}{c^2} \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0
の下でマクスウェル方程式
 \displaystyle
\qquad
\begin{align}
& \partial_{\mu} \partial^{\nu} \phi =  \frac{1}{\epsilon_0} \rho \\
& \partial_{\mu} \partial^{\nu} \mathbb{A} =  \mu_0 \mathbb{j}
\end{align}
と書けることが分かっていた.ダランベルシアンローレンツ変換 \Box' = \Box となり不変であったから,マクスウェル方程式は変更する必要がない.しかし,ローレンツ条件は形が変わってしまう.どのように変化するかを計算しても答えは分かるがもっと簡単な方法がある.ローレンツ条件は
 \displaystyle
 \qquad \frac{1}{c} \partial_0 \phi + \partial_1 A_x +  \partial_2 A_y +  \partial_3 A_z= 0
である.これまでの記号を用いてこの方程式を簡単に書くには,まず,
 \displaystyle
 \qquad \partial_0  (\frac{1}{c} \phi) -  \partial_1 (-A_x) -  \partial_2 (-A_y) -  \partial_3 (-A_z)= 0
となるので, A_{\mu} = (\frac{1}{c} \phi, -A_x, -A_y, -A_z) とおけば,
 \displaystyle
 \qquad \partial_{\mu} g^{\mu \nu} A_{\nu}= 0
と書ける.そこで  A^{\mu} = g^{\mu \nu} A_{\nu} とおけば
 \displaystyle
 \qquad \partial_{\mu} A^{\mu} = 0
と書ける.ここで,A^{\mu} が反変ベクトルであれば,つまり, A_{\mu} が共変ベクトルであればローレンツ変換で式は形を変えない.つまり,
 \displaystyle
 \qquad {\partial_{\mu}}' {A^{\mu}}' = \partial_{\mu} A^{\mu}
となる.よって, A_{\mu} = (\frac{1}{c} \phi, -A_x, -A_y, -A_z)ローレンツ変換で共変ベクトルとして変化するように定めれば良い.それは, A^{\mu} = (\frac{1}{c} \phi, A_x, A_y, A_z)ローレンツ変換で反変ベクトルとして変化することと同じである.

(ポテンシャルの変換)
 A^{\mu} = (\frac{1}{c} \phi, A_x, A_y, A_z)ローレンツ変換
 \displaystyle
 \qquad {A^{\mu}} = a^{\mu}_{\ \ \nu} A^{\nu}
と変換すると定めれば,ローレンツ条件はローレンツ変換で不変である.

ダランベルシアン偏微分ローレンツ変換でどのように変わるかは決まってしまうが,物理量は自分で決めるものである.普通,座標を変えても物理量は変わらないものとして扱うかもしれないが,うまく物理量の変化を自分で決めることで法則が簡単になるようにしているのである.これは,等加速度運動している座標系においては力が変化して慣性力がかかっていると考えることで,そこを静止座標系とみて議論ができるようになるのと同じ発想である.

最後に電荷  \rho と電流  \mathbf{j} の変化も定めよう.今まで行っていなかったが,これらは自由に取っていいわけではなく,電荷の保存則

\qquad \displaystyle \frac{\partial \rho}{\partial t} + \mathrm{div} \, \mathbf{j} = 0
を満たしている必要がある.この式は
 \displaystyle
 \qquad \partial_0  (c \rho ) -  \partial_1 (-j_x) -  \partial_2 (-j_y) -  \partial_3 (-j_z)= 0
と書けるので, j_{\mu} := (c \rho, -j^x), -j^y, -j^z) と定めて, j^{\mu} := g^{\mu \nu} j_{\nu} = (c\rho, j_x, j_y, j_z) とすれば,電荷の保存則は
 \displaystyle
 \qquad \partial_\mu j^{\mu} = 0
と書ける.よって, j^{\mu} が共変ベクトルであれば,ローレンツ変換で保存則は不変である.

電荷と電流の変換)
 j^{\mu}  = (c\rho, j_x, j_y, j_z) ローレンツ変換
 \displaystyle
 \qquad {j^{\mu}} = a^{\mu}_{\ \ \nu} j^{\nu}
と変換すると定めれば,電荷の保存則はローレンツ変換で不変である.

以上をまとめると,マクスウェル方程式ローレンツ変換で不変であることが分かる.

マクスウェル方程式ローレンツ共変性)
ローレンツ条件  \partial_\mu A^{\mu} = 0 を満たすポテンシャル  A^{\mu} = (\frac{1}{c} \phi, A_x, A_y, A_z)
電荷の保存則  \partial_\mu j^\mu = 0 を満たす電荷と電流  j^{\mu}  = (c\rho, j_x, j_y, j_z) が共変ベクトルで
マクスウェル方程式
 \displaystyle
\qquad \partial_{\nu} \partial^{\nu} A^\mu = \mu_0 j^\mu
を満たすとする.
このとき,ローレンツ変換ローレンツ条件,電荷の保存則,マクスウェル方程式は満たされる.


これまでの流れを整理しておく.まず,ダランベルシアンが変化しないものとしてローレンツ変換を定めた.次に,ローレンツ変換で法則の形が変わらないように物理量  A^\mu j^\mu の変換を定めた.おまけとしてマクスウェル方程式 \Box A^\mu = \mu_0 j^{\mu} という簡単な式で表されていることにも注意しよう.


ちなみに,ここで導入した文字を用いれば,ゲージ変換
\displaystyle
\qquad (\phi, \mathbb{A}) \rightarrow (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi)

\displaystyle
\qquad A^{\mu} \rightarrow  A^{\mu} + \partial^{\mu} \chi
と書ける.

共変形式のマクスウェル方程式

ポテンシャルのマクスウェル方程式はゲージを固定したときの書き方なので,ゲージによらない,つまり, \mathbb{E}, \mathbb{B} の方程式をきれいな形で書くことを考えよう.そのために, \mathbb{E}, \mathbb{B} を一つの量で表せないか考える.


まず,ポテンシャルの定義より,
 \displaystyle
\qquad
\begin{align}
& \mathbb{B} = \mathrm{rot} \mathbb{A} \\
& \mathbb{E} = - \mathrm{grad} \phi - \frac{\partial \mathbb{A}}{\partial t}
\end{align}
であった.最初の式を書き直すと,

\qquad B^I = \epsilon^{ijk} \partial_j A^k
であるが,計算すると,

\qquad \epsilon^{lmi} B^l = - \partial^l A^m + \partial^m A^l
となることが分かる.次に 2番目の指揮により,
 \displaystyle
\qquad
\begin{align}
E^i &= -\partial_i \phi - \frac{\partial}{\partial t} A^i \\
&=c \left\{ -\partial_i) \frac{\phi}{c} - \partial_0 A^i \right\} \\
&= c ( \partial^i A^0 - \partial^0 A^i)
\end{align}
と書ける.よって,
 
\displaystyle
\qquad F^{\mu \nu} := \partial^\mu A^\nu - \partial^{\nu} A^\mu
とおけば,

\displaystyle
\qquad
\begin{align}
&E^i  = cF^{i 0}
&\epsilon^{ijk} B^k = - F^{ij}
\end{align}
と書くことができる. F^{\mu \nu} は 2つの反変ベクトルで定義されているので 2階の反変テンソルである.行列で書けば,

\displaystyle
\qquad
F^{\mu \nu} = \left(
\begin{matrix}
0 & - E_x/c & -E_y/c & -E_z/c \\
E_x /c &0 & -B_z & B_y  \\
E_y/c & B_z & 0 & -B_x \\
E_z/c & - B_y & B_x & 0
\end{matrix}
\right)
となる.


悲しいことに,非常に面倒になってきた.計算を省略するが,マクスウェル方程式のうち右辺が 0でない

\displaystyle
\qquad
\begin{align}
&\mathrm{div} \mathbb{E} = \frac{1}{\epsilon_0} \rho \\
&\frac{1}{\mu_0} \mathrm{rot} \mathbb{B} - \epsilon_0 \frac{\partial \mathbb{E}}{\partial t} = \mathbb{j}
\end{align}


\displaystyle
\qquad
\partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}
と書くことができる.
また,マクスウェル方程式の残りの式

\displaystyle
\qquad
\begin{align}
&\mathrm{div} \mathbb{B} = 0 \\
&\mathrm{rot} \mathbb{E} + \frac{\partial \mathbb{B}}{\partial t} = 0
\end{align}


\displaystyle
\qquad \partial_{\lambda} F^{\mu \nu} + \partial_{\mu} F^{\nu \lambda} + \partial_{\nu} F^{\lambda \mu} = 0
と書けることが分かる.

以上をまとめると以下のようになる.

(共変形式のマクスウェル方程式
2階の反変テンソル  F^{\mu \nu}

\displaystyle
\qquad
F^{\mu \nu} = \left(
\begin{matrix}
0 & - E_x/c & -E_y/c & -E_z/c \\
E_x /c &0 & -B_z & B_y  \\
E_y/c & B_z & 0 & -B_x \\
E_z/c & - B_y & B_x & 0
\end{matrix}
\right)
と定めると,マクスウェル方程式

\displaystyle
\qquad
\begin{align}
& \partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}\\
& \partial_{\lambda} F^{\mu \nu} + \partial_{\mu} F^{\nu \lambda} + \partial_{\nu} F^{\lambda \mu} = 0
\end{align}
となる.

ちなみに,ポテンシャルを用いたときは定義から

\displaystyle
\qquad
\begin{align}
&\mathrm{div} \mathbb{B} = 0 \\
&\mathrm{rot} \mathbb{E} + \frac{\partial \mathbb{B}}{\partial t} = 0
\end{align}
が自動的に成り立つので,ポテンシャルを用いて 2階反変テンソル
 
\displaystyle
\qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu
を定義した場合には

\displaystyle
\qquad \partial_{\lambda} F^{\mu \nu} + \partial_{\mu} F^{\nu \lambda} + \partial_{\nu} F^{\lambda \mu} = 0
は自動的に成り立つ.

続き
tetobourbaki.hatenablog.com

理想的な物理理論としての電磁気学(1)

物理学の様々な分野を勉強する上で,電磁気学は理論のお手本として提示されることが多い.つまり,成功した理論である電磁気学との類推で新しい理論の方針を決めるという場面が非常に多い.そのため,電磁気学のどこを見て成功している理論と呼んでいるのかを理解していなければ,その他の分野を勉強する上で指針がなくなってしまう.そこで,他の分野へのお手本として電磁気学を捉えるという目標で,電磁気学を整理していく.

以下の内容は牟田泰三『電磁気学』(岩波書店)を参考にした。

マクスウェル方程式

電磁気学で扱われるすべての現象は以下のマクスウェル方程式から導くことができる.本記事ではマクスウェル方程式の物理的な意味の説明は省略し,この方程式自体を考察するところから始めていく.

マクスウェル方程式だけでは,条件は不十分で,適切な問題設定を与えなければならない.特に, \mathbb{E}\mathbb{D} および  \mathbb{H} \mathbb{B} の関係を表す条件が与えられなければ,方程式は解きようがない.状況の一つとして,例えば等方一様媒質においては以下の関係が成り立つのであった.

等方一様媒質において,
 \displaystyle
\qquad \begin{align}
&\mathbb{D} = \epsilon \mathbb{E} \\
&\mathbb{H} = \frac{1}{\mu} \mathbb{B}
\end{align}

このような条件があれば,あとは  \rho, \mathbb{j} および境界条件を与えることで方程式の解を考えることができる.

ポテンシャル

マクスウェル方程式は4つの変数  \mathbb{E}, \mathbb{D},  \mathbb{H}, \mathbb{B} に関する方程式であるが,ポテンシャルと呼ばれる変数を用いれば便利である.これを導入するために以下のベクトル解析の定理を用いる.

ポアンカレ補題

 \mathrm{rot} \mathbb{V} = 0\, \Leftrightarrow \, ある関数  \phi が存在して  \mathbb{V} = \mathrm{grad} \phi と書ける.

 \mathrm{div} \mathbb{V} = 0\, \Leftrightarrow \, あるベクトル  \mathbb{A} が存在して  \mathbb{V} = \mathrm{rot} \mathbb{A} と書ける.

このポアンカレ補題を用いよう.
マクスウェル方程式(2)  \mathrm{div} \mathbb{B} = 0 より、 \mathbb{B} = \mathrm{rot} \mathbb{A} となる  \mathbb{A} が取れる.さらにこの式とマクスウェル方程式 (4) により
 \displaystyle
\qquad \mathrm{rot} \left(\mathbb{E} + \frac{\partial \mathbb{A}}{\partial t} \right) = 0
なので,ポアンカレ補題により
 \displaystyle
\qquad \mathbb{E} + \frac{\partial \mathbb{A}}{\partial t} = - \mathrm{grad} \mathrm{\phi}
となる  \phi が取れる.つまり, \phi, \mathbb{A} を用いて
 \displaystyle
\qquad 
\begin{align}
&\mathbb{B} = \mathrm{rot} \,\mathbb{A}\\
&\mathbb{E} = -\mathrm{grad} \, {\phi} - \frac{\partial \mathbb{A} }{\partial t}
\end{align}
と表すことができる.この  \mathbb{A} を磁束密度 \mathbb{B} に対するベクトルポテンシャル \phiスカラーポテンシャルと呼ぶ.

(ポテンシャル)
 \phi, \mathbb{A} がポテンシャルであるとは,
 \displaystyle
\qquad 
\begin{align}
&\mathbb{B} = \mathrm{rot} \,\mathbb{A}\\
&\mathbb{E} = -\mathrm{grad} \, {\phi} - \frac{\partial \mathbb{A} }{\partial t}
\end{align}
を満たすことをいう.

ゲージ変換

ポテンシャル  \phi, \mathbb{A} を導入したが,ここで,
 \displaystyle
\qquad 
\begin{align}
& \mathrm{rot} \, \mathbb{A}_{\chi} = 0 \\
& \mathrm{grad} \, \phi_{\chi} +  \frac{\partial \mathbb{A}_{\chi}}{\partial t} = 0
\end{align}
となる  \phi_{\chi}, \mathbb{A}_{\chi} を取ると,
 \displaystyle
\qquad
\begin{align}
&\mathbb{B} = \mathrm{rot} \,\mathbb{A} = \mathrm{rot}\,  ( \mathbb{A} + \mathbb{A}_{\chi}) \\
&\mathbb{E} = -\mathrm{grad} \, {\phi} - \frac{\partial \mathbb{A} }{\partial t} = -\mathrm{grad} \, ({\phi + \phi_{\chi} }) - \frac{\partial (\mathbb{A} +\mathbb{A}_{\chi}) }{\partial t}
\end{align}
となる.つまり, \phi + \phi_{\chi},  \mathbb{A} + \mathbb{A}_{\chi} もポテンシャルになるのである.あるいはポテンシャルには   \phi_{\chi}, \mathbb{A}_{\chi} 分の不定性があると言ってもいい.


このように, \phi ,  \mathbb{A} \phi + \phi_{\chi},  \mathbb{A} + \mathbb{A}_{\chi} に変化させることをゲージ変換といい,この変換で  \mathbb{B}, \mathbb{E} が変わらないことはゲージ不変性と呼ばれる.


ところで,
 \displaystyle
\qquad \mathrm{rot} \mathbb{A}_{\chi} = 0
なので, \mathbb{A}_{\chi} = -\mathrm{grad} \chi となる関数  \chi が存在する.さらに
 \displaystyle
\qquad \mathrm{grad} \left( \phi_{\chi} - \frac{\partial \chi}{\partial t} \right) = 0
なので, t にのみ依存する関数  C(t)
 \displaystyle
\qquad   \phi_{\chi} - \frac{\partial \chi}{\partial t} = C(t)
と書ける.ここで, \chi + \int^t C(t') dt' を改めて  \chi と書くことにすると
 \displaystyle
\qquad
\begin{align}
&\mathbb{A}_{\chi} = -\mathrm{grad}\, \chi \\
&\phi_{\chi} = \frac{\partial \chi}{\partial t}
\end{align}
が成り立つ.つまり,ゲージ変換とはある関数  \chi を用いて
 \displaystyle
\qquad (\phi, \mathbb{A}) \rightarrow (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi )
と変換することに他ならないことがわかった.

(ゲージ変換)
ある関数  \chi を用いて
 \displaystyle
\qquad (\phi, \mathbb{A}) \rightarrow (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi )
とポテンシャルを変換すること.

ゲージ変換によりポテンシャルが良い性質を満たすように変換することができるが,そのようにしてポテンシャルを一つの形に決めることをゲージを固定するという.

ポテンシャルを用いたマクスウェル方程式

最後にゲージ変換の応用を述べる.マクスウェル方程式 (1) と (3) をまだ使っていなかった.等方一様媒質と仮定すれば
 \displaystyle
\qquad
\begin{align}
&\mathbb{D} = \epsilon \mathbb{E} \\
&\mathbb{H} = \frac{1}{\mu} \mathbb{B}
\end{align}
なので,これとポテンシャルを用いてマクスウェル方程式を書き換える.
それにはベクトル解析の公式を用いる.

(公式)
 \qquad \displaystyle \mathrm{div}\, \mathrm{grad} = \Delta
 \qquad \displaystyle \mathrm{rot}\, \mathrm{rot} = \mathrm{grad}\, \mathrm{div} - \Delta

さて,この公式とポテンシャルを用いれば,ちょっと計算すれば,マクスウェル方程式(1)は
 \displaystyle
\qquad \Delta \phi + \frac{\partial \, \mathrm{ div} \mathbb{A} }{\partial t} = - \frac{1}{\epsilon} \rho
となる.また,マクスウェル方程式(3)は
 \displaystyle 
\qquad
\begin{align}
\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \mathrm{grad} \left( \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} \right) = 0
\end{align}
となる.

マクスウェル方程式(2)と(4)はポテンシャルの定義から自動的に成立するので,ポテンシャル  \phi, \mathbb{A} を用いればマクスウェル方程式
 \displaystyle
\qquad
\begin{align}
&\Delta \phi + \frac{\partial \, \mathrm{ div} \mathbb{A} }{\partial t} = - \frac{1}{\epsilon} \rho \\
&\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \mathrm{grad} \left( \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} \right) = - \mu \mathbb{j}
\end{align}
となる.

(ポテンシャルを用いたマクスウェル方程式
 \displaystyle
\qquad
\begin{align}
&\Delta \phi + \frac{\partial \, \mathrm{ div} \mathbb{A} }{\partial t} = - \frac{1}{\epsilon} \rho \\
&\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \mathrm{grad} \left( \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} \right) = - \mu \mathbb{j}
\end{align}

最後にゲージ変換により,ポテンシャルを用いたマクスウェル方程式を簡単化することを考えよう.

ローレンツゲージ

まず,
 \displaystyle
 \qquad \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0
となるように  \phi, \mathbb{A} をとる.この条件をローレンツ条件という.この条件の下ではマクスウェル方程式
 \displaystyle
\qquad
\begin{align}
&\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi =  \frac{1}{\epsilon} \rho \\
&\displaystyle  \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} =  \mu \mathbb{j}
\end{align}
となることが簡単にわかる. \phi \mathbb{A} の方程式はほぼ同じになっている.

ここでローレンツ条件を満たすようにゲージ変換することができるかを考えよう.ポテンシャル  (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi )ローレンツ条件を満たすための条件は
 \displaystyle
\qquad \epsilon \mu \frac{\partial^2 \chi}{\partial t^2}  - \Delta \chi = \mathrm{div} \mathbb{A} - \frac{\partial \phi}{\partial t}
となることが分かる.適当なポテンシャル  \phi, \mathbb{A} に対してこの方程式を解けば,ローレンツ条件を満たすようにゲージ変換することができる.

ローレンツ条件の下でのマクスウェル方程式
ローレンツ条件
 \displaystyle
 \qquad \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0
の下で
 \displaystyle
\qquad
\begin{align}
&\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi =  \frac{1}{\epsilon} \rho \\
&\displaystyle  \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} =  \mu \mathbb{j}
\end{align}

クーロンゲージ

次に
 \displaystyle
\qquad \mathrm{div} \mathbb{A} = 0
となるように  \phi, \mathbb{A} をとる.この条件をクーロン条件という.この条件の下ではマクスウェル方程式が,
 \displaystyle
\qquad 
\begin{align}
&\Delta \phi = - \frac{1}{\epsilon} \rho \\
&\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} -  \epsilon \mu \mathrm{grad}  \frac{\partial \phi}{\partial t} = - \mu \mathbb{j}
\end{align}
となることが簡単にわかる. \phiポアソン方程式を満たすことになり,しかも,これはクーロンポテンシャルを求めるときにも現れた方程式そのままである.

(クーロン条件の下でのマクスウェル方程式
クーロン条件
 \displaystyle
\qquad \mathrm{div} \mathbb{A} = 0
の下で
 \displaystyle
\qquad 
\begin{align}
&\Delta \phi = - \frac{1}{\epsilon} \rho \\
&\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} -  \epsilon \mu \mathrm{grad}  \frac{\partial \phi}{\partial t} = - \mu \mathbb{j}
\end{align}

最後に

本記事ではポテンシャル  \phi, \mathbb{A} を導入した.特に,ローレンツ条件の下でのマクスウェル方程式
 \displaystyle
\qquad
\begin{align}
&\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi =  \frac{1}{\epsilon} \rho \\
&\displaystyle  \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} =  \mu \mathbb{j}
\end{align}
となることが非常に重要である.

次回は特殊相対論を使って考察していくが,マクスウェル方程式に現れる
 
\qquad \displaystyle \epsilon \mu \frac{\partial^2}{\partial t^2} -\Delta
という作用素が特殊相対論の観点から重要になってくる.よく見れば,ローレンツ条件にもこの作用素が現れていることにも注意しておきたい.

続き
tetobourbaki.hatenablog.com

オイラー・ポアソン方程式とリー・ポアソン構造

(この記事は数理物理 Advent Calendar 2018 - Adventar 4日目の記事です。)

固定点を持つ剛体の運動を表す方程式(つまり,コマの方程式)はオイラーポアソン方程式と呼ばれ*1,以下のように書ける.
 \displaystyle
\qquad \dot{\Gamma} = \Gamma \times \Omega \\
\qquad \dot{M} = M \times \Omega + \Gamma \times L,

本記事の目標はこの方程式がラックス形式で書けることを確認することである.それを通して,リー・ポアソン構造の有用さが分かると思う.

この問題に対する私のモチベーションを少し書く.オイラーポアソン方程式の可積分性というのは面白い問題であるが,本来,可積分性はシンプレクティック形式から定まるポアソン括弧で書けるハミルトン系に対する概念である.そこで,オイラーポアソン方程式が今のべた意味でのハミルトン系で書けるかというのを調べたいのが私のモチベーションである.

準備

少し長いので簡単な流れを述べておく.
(1)リー代数  V があるとき, V^* 上の関数にポアソン構造を入れることができる.これにより  V^*上のハミルトン系が定義できる.
(2)リー代数に非退化な対称双線形形式があるとき, V上の関数にポアソン構造を入れることができる.これにより  V上のハミルトン系ができる.
(3)さらに,双線形形式がアジョイント不変であれば, V上のハミルトン系はラックス形式で書ける.

ポアソン構造

まずリー代数の定義を復習する.係数体を  \mathbb{R}とするベクトル空間  Vを考える. このベクトル空間に対し演算  [\cdot ,\, \cdot] \colon V\times V \to Vが存在し, 以下の性質を満たす.

(1)双線型である.つまり, [a v_1+bv_2, w ] = a [ v_1, w ]+ b [v_2, w] かつ  [v, aw_1 + bw_2 ] = a[v, w_1 ]+ b[v, w_2] ;

(2)反対称である.つまり,  [v, w] = - [w, v] ;

(3)ヤコビ恒等式が成り立つ.つまり, [v_1, [v_2 , v_3 ] ] + [ v_2, [v_3, v_1 ] ] + [ v_3, [v_1 , v_2 ] ] =0
このとき, Vリー代数という.演算  [ \cdot, \cdot] はリー括弧と呼ばれる.


次に,ポアソン構造を定義する. \mathrm{C}^{\infty} 級の実多様体  Mを考える.多様体上の  \mathrm{C}^{\infty}級の関数の集合  \mathrm{C}^{\infty} (M)に対して,演算  \{ \cdot , \cdot \} \colon \mathrm{C}^{\infty} (M) \times \mathrm{C}^{\infty} (M) \rightarrow \mathrm{C}^{\infty} (M)があり, リー括弧の性質(1),(2),(3)に加えて,

(4)ライプニッツ則,つまり, \{F, GH \} = \{F, G\} H + G \{F, H\}

を満たすとき, Mポアソン多様体と呼ばれる. 演算  \{\cdot , \cdot \}ポアソン括弧と呼ばれる.
ライプニッツ則は  \{ f, \cdot\}ないし \{ \cdot ,\, f\}微分であることを表す(微分代数の考え方).

 Mポアソン多様体とし,関数  H \in \mathrm{C}^{\infty} (M)を定めると, X_{H} = \{H , \cdot\}M上のベクトル場になっている. これをハミルトンベクトル場という. これにより定まる微分方程式
\displaystyle
\qquad \dot{x} = X_H (x)
をハミルトン系という. Hをハミルトン系のハミルトン関数という. 多様体で定義したため若干説明不足な部分があるが  M = \mathbb{R}^nのケースだと単に n次元微分方程式
\displaystyle
\qquad \dot{x_i} = \{H , x_i\}, \quad i = 1,\, \dots n
である. ハミルトン関数  Hのハミルトン系に対して,  F \in \mathrm{C}^{\infty} (M) が保存量であることは  \{H, F\} = 0と同値である. それは  X_H (F) = \{ H, F\}から自明である. 微分形式に慣れていれば,
\displaystyle
\qquad \frac{d}{dt} F(x) = dF (\dot{x}) = dF(X_H) = X_H (F)  = \{ H, F\}
からもよくわかる.
特に,ハミルトン関数自身は常に保存量である.また,ヤコビ恒等式より2つの保存量  F, G に対し, \{ F, G \} も保存量となる.任意の関数  H \in \mathrm{C}^{\infty} (M) に対して  \{H , C\} = 0 となる関数  C \in \mathrm{C}^{\infty} (M)カシミール(Casimir)関数という.つまり,カシミール関数はポアソン括弧によりできる任意のハミルトンベクトル場の保存量である.言い換えると,カシミール関数  Cに対してハミルトンベクトル場は  X_C = 0 であるとも言える.

リー・ポアソン構造

リー・ポアソン構造を説明するために,まずリー代数  Vの双対空間 V^*ポアソン構造が入ることを見る.まず,わかりやすさのために  v \in V,\, \mu \in V^*に対し, \langle \mu , v\rangle := \mu (v)と書くことにする. V^* 上の関数  F \in \mathrm{C}^{\infty} (V^*)に対して, \nu \in V^* での勾配  D_{\nu}F V^*から \mathbb{R}への線形写像になっているため, D_{\nu} F\in V^{**}であり, Vとの同一視,つまり,
\displaystyle
\qquad D_{\nu}F (\mu) = \left\langle \mu , \frac{\delta F}{\delta \nu} \right\rangle
となる元  \frac{\delta F}{\delta \nu} \in V が存在する.ここで, V^* 上のポアソン括弧を
 \displaystyle
\qquad \{F , G\} (\mu) = \left\langle \mu , \left[ \frac{\delta F}{\delta \mu}, \frac{\delta G}{\delta \mu} \right] \right\rangle
と定めることができる. このようにできたポアソン括弧をリー・ポアソン括弧という.

 V 上にポアソン構造を定めるためには Vの非退化な対称双線形形式  \eta ( \cdot , \cdot )が必要である. \etaがあれば,  F \in \mathrm{C}^{\infty} (V), v \in Vに対して, D_{v} F \in V^*なので
 \displaystyle
\qquad \left\langle D_v F, w\right\rangle = \eta(\nabla_v F , w ) ,\quad  ^{\forall} w \in V
となる  \nabla_v F \in Vが(非退化な条件より)一意に定まる.これにより, V上にもポアソン構造が
 \displaystyle
\qquad \{F, G\} (v) = \eta( v ,\, [ \nabla_v F ,\, \nabla_v G])
\
で定まる.

ラックス形式

ここで, \muが特殊な場合にはハミルトン系がいわゆるラックス形式でかけることを見る. ここで仮定するのは  \muのアジョイント不変性, つまり,
 \displaystyle
\qquad \eta(v_1 , [v_2 ,\, v_3] ) = \eta ( [v_1 , v_2] ,\, v_3) ,\quad  ^{\forall}v_1, v_2 , v_3 \in V
である.このとき, V上の関数  G, H v \in Vに対し,
 \displaystyle
\qquad \{ H, G \} (v) = \eta(v , [\nabla_v H , \nabla_v G] )\\
\;\;\quad \qquad \qquad = \eta( [v , \nabla_v H ] , \nabla_v G)\\
\;\;\quad \qquad \qquad = \eta( \nabla_v G, [v, \nabla_v H] )\\
最後に  \nabla_v G の定義より,
\displaystyle
\qquad \eta( \nabla_v G , [v, \nabla_v H ]) =\left\langle D_v G, [v, \nabla_v H]\right\rangle
となる.そのそもハミルトンベクトル場  X_Hは任意の関数  Gと点  v\in Vに対し  X_H (G) (v) = \{H, G\} (v) = \left\langle D_vG , X_H(v) \right\rangleとなるものだったので, X_H(v) = [v , \nabla_v H ] であることがわかる.よって,ハミルトン系も
 \displaystyle
\qquad \frac{dv}{dt} = [v , \nabla_v H ]
と書ける. これをラックス形式という.

オイラーポアソン方程式

以上の準備の下,オイラーポアソン方程式ポアソン構造と見る方法を述べる.まず線形空間  V = \mathbb{R}^6を考え,元を  v = (\Gamma , M)^t \in \mathbb{R}^3 \times \mathbb{R}^3 = Vと書く. \GammaMも縦ベクトルと見たいので,少し書き方が変であるが,伝わると思うので縦ベクトルと横ベクトルの区別はおおらかにする.

リー括弧を  v = (\Gamma , M)^t, \bar{v} = (\bar{\Gamma} , \bar{M})^tに対して,
 \displaystyle
\qquad [v ,\, \bar{v} ] = (\Gamma \times \bar{\Gamma}, \Gamma \times \bar{M} + M \times \bar{\Gamma} )^t
で定める.次に非退化な対称双線形形式  \eta
 \displaystyle
\qquad \eta (v, \bar{v}) = \Gamma \cdot \bar{M} + M \cdot \bar{\Gamma}
と定める. \etaを行列  Nで表現すると
 \displaystyle
\qquad N = \left(\begin{matrix}
0 & E_3 \\
E_3 & 0
\end{matrix}\right)
であり(つまり, \mu(v, \bar{v}) = v^t N \bar{v})非退化で対称なことがすぐに分かる. V上の関数を  Fとし, Fに対して \nabla_v F = (\tilde{\Gamma}, \tilde{M} )^t \in V が定まる.計算すると
 \displaystyle
\qquad \left\langle D_v F , \bar{v} \right\rangle = \sum_{i=1}^3 \frac{\partial F}{\partial \Gamma_i}(v) \bar{\Gamma_i} + \sum_{i=1}^3 \frac{\partial F}{\partial M_i}(v)\bar{M_i}
であり,
 \displaystyle
\qquad \eta(\nabla_v F , \bar{v}) = \sum_{i=1} \tilde{\Gamma}_i \bar{M}_i + \sum_{i=1}^3 \tilde{M}_i \bar{\Gamma}_i
なので,任意の  \bar{v}
 \displaystyle
\qquad \left\langle D_v F , \bar{v} \right\rangle =\eta(\nabla_v F ,\, \bar{v})
が成り立つことから,両辺を比較すると,
 \displaystyle
\qquad \nabla_v F = \left(\frac{\partial F}{\partial M}(v) , \frac{\partial F}{\partial \Gamma_i}(v) \right)^t
であることが分かる.具体的には
 \displaystyle
\qquad \nabla_v H = (\Omega , L)^t , \quad \nabla_v H_2 = (\Gamma , M)^t ,\quad \nabla_v H_3 = (0 , 2\Gamma)^t
であることが分かる.

ポアソン括弧からもハミルトンベクトル場を計算できるが,すでにラックス形式で計算できることが分かっているので,
 \displaystyle
\qquad \dot{v} = [v, \nabla_v H]\\
\quad \quad \;\,=[ (\Gamma , M)^t , (\Omega , L)^t ] \\
\quad \quad \;\,=( \Gamma \times \Omega , M \times \Omega + \Gamma \times L)^t
となる.つまり,通常のオイラーポアソン方程式
 \displaystyle
\qquad \dot{\Gamma} = \Gamma \times \Omega \\
\qquad \dot{M} = M \times \Omega + \Gamma \times L

に一致した.

*1:吉田春生先生の用語に従っているが,この方程式をオイラーポアソン方程式と呼んでいいものか分からない.

Kovacicのアルゴリズム

Kovacicのアルゴリズムとは,2階の線形微分方程式を解くアルゴリズムです.もちろん,解けない微分方程式もあるのですが,解ける時は解を求め,解けない時は求まらないことを教えてくれます.このアルゴリズムMapleMathematicaでも使われています.

このアルゴリズムについて解説したpdfを書いたのでここにリンクを貼っておきます.現段階では完成しているわけではないですが,アルゴリズムを理解する上で十分なことは書いてあるはずです.

kovacic.pdf - Google ドライブ