2019-01-26

理想的な物理理論としての電磁気学(3)

物理学

ラグランジュ密度を用いて微分方程式を出す方法とその利点をまとめていきます．
以下の記事の続きです．
tetobourbaki.hatenablog.com

今回はコッティンガム，グリーンウッドの『素粒子標準模型入門』を参考にしています．

連続系のラグランジュ形式
ローレンツ共変な場の理論
ラグランジュ形式によるマクスウェル方程式

連続系のラグランジュ形式

普通の解析力学ではラグランジュ形式で常微分方程式を導くことができた．連続系の場合で使われる，ラグランジュ密度を用いて偏微分方程式を導く方法を私は知らなかったので，まずは具体例でそれを見ていく．

両端を固定した弦を考える．張力によるポテンシャルエネルギーは
$\qquad \displaystyle T = \int_0^l \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 dx$
であり，弦の運動エネルギーは
$\qquad \displaystyle V = \int_0^l \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2 dx$
と書ける．よって，ラグランジアンは
$\qquad \displaystyle L := T - V = \int_0^l \left\{ \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 - \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2 \right\} dx$
となる．すると作用は
$\qquad \displaystyle S:= \int_0^{t_0} L \, dt$
であるが，
$\qquad \displaystyle \mathcal{L} := \frac{1}{2} F \left( \frac{\partial \phi}{\partial x} \right)^2 - \frac{1}{2} \rho \left( \frac{\partial \phi}{\partial t} \right)^2$
とおけば，
$\displaystyle \qquad S = \int_0^{t_0} \int_0^l \mathcal{L} \,dx dt$
と書ける．この $\mathcal{L}$ をラグランジュ密度と呼ぶ．

ラグランジュ密度は $\displaystyle \dot{\phi} = \frac{\partial \phi}{\partial t}$ $\displaystyle \phi' = \frac{\partial \phi}{\partial x}$ に依存しているので， $\mathcal{L} = \mathcal{L} (\dot{\phi}, \phi')$ と書く．作用 $S$ の変分を計算すると，
$\qquad \displaystyle \delta S = \int_0^{t_0} \int_0^l \left[ \frac{\partial \mathcal{L} }{\partial \dot{\phi} } \delta (\dot{\phi} ) + \frac{\partial \mathcal{L} }{\partial \phi'} \delta (\phi' ) \right] dx dt$
であるが， $\delta (\dot {\phi}) = \frac{\partial}{\partial t} (\delta \phi), \, \delta (\phi') = (\delta \phi)'$ に注意して，さらに任意の $t$ で $\phi(t,0) = \phi(t, l) = 0$ かつ任意の $x$ で $\phi (0,x) = \phi (t_0, x)$ を仮定すると，部分積分により，
$\qquad \displaystyle \delta S = - \int_0^{t_0} \int_0^l \left[\frac{\partial }{\partial t} \frac{\partial \mathcal{L} }{\partial \dot{\phi} } + \frac{\partial }{\partial x } \frac{\partial \mathcal{L} }{\partial \phi'} \right] \delta(\phi) dx dt$
となる．よって，任意の任意の変分 $\delta( \phi)$ で $\delta S = 0$ を課するとオイラー方程式
$\qquad \displaystyle \frac{\partial }{\partial t} \frac{\partial \mathcal{L} }{\partial \dot{\phi} } + \frac{\partial }{\partial x } \frac{\partial \mathcal{L} }{\partial \phi'} = 0$
を得る．今のラグランジアンでは方程式
$\qquad \displaystyle \rho \frac{\partial^2 \phi}{\partial t^2} - F \frac{\partial^2 \phi}{\partial x^2} = 0$
を得る．これは波動方程式である．

ローレンツ共変な場の理論

前回の記事で導入した4次元変数 $x^{\mu}$ を考える．ラグランジアンは
$\qquad \displaystyle S = \int \mathcal{L} \, dx^0 dx^1 dx^2 dx^3$
となる．積分は時空間全体をとる．さて，作用 $S$ はローレンツ不変になっているのが自然であろう．微分形式 $dx^0 dx^1 dx^2 dx^3$ はローレンツ不変であることが分かるので， $\mathcal{L}$ はスカラーであるべきであり，もっというとスカラーに依存した関数であると考えるのが自然である．

今回はスカラー場 $\phi(x^{\mu} ) = \phi(t, x, y, z)$ を用いて書けるラグランジアン密度
$\qquad \mathcal{L} = \mathcal{L} (\phi, \partial_\mu \phi) = \mathcal{L} ( \phi, \partial_t \phi, \partial_x \phi, \partial_y \phi, \partial_z \phi)$
を考える．特にこの場合は $\mathcal{L}$ が座標 $x^{\mu}$ に直接は依存していないことが重要である．変分を取って，無限遠方で $\delta (\phi) = 0$ を課すると部分積分により，
$\qquad \displaystyle \begin{align} \delta S & = \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} \delta (\phi) + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi ) \right] dx^0 dx^1 dx^2 dx^3 \\ &= \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} \delta (\phi) + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\mu ( \delta \phi ) \right] dx^0 dx^1 dx^2 dx^3 \\ &= \int \left[ \frac{\partial \mathcal{L} }{\partial \phi} - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \right] ( \delta \phi ) dx^0 dx^1 dx^2 dx^3 \end{align}$
よって，任意の変分 $\delta \phi$ で $\delta S = 0$ とすると，場の方程式
$\qquad \displaystyle \frac{\partial \mathcal{L} }{\partial \phi} - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } = 0$
を得る．

（場の方程式）
作用の変分の条件から得られる以下の方程式を場の方程式と呼ぶ．
$\qquad \displaystyle \frac{\partial \mathcal{L} }{\partial \phi} - \partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } = 0$

電磁場に戻る前に，もう少し一般論を考える．エネルギー保存は時間 $t$ の平行移動による対称性から導出されるのであった．また，運動量の保存は空間の平行移動による対称性から導出されるのであった．今の記法を用いれば微小な平行移動は
$\qquad x^\mu \rightarrow x^\mu + \delta a^{\mu}$
と書くことができる．このときのラグランジュ密度の変分を二つの方法で計算する．場の方程式を用いれば，
$\qquad \displaystyle \begin{align} \delta \mathcal{L} &= \frac{\partial \mathcal{L} }{\partial \phi} \delta \phi + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi) \\ &=\partial_\mu \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta \phi + \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta (\partial_\mu \phi) \\ &=\partial_\mu \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \delta \phi \right] \end{align}$
今の変分の取り方から
$\qquad \displaystyle \delta \phi = \partial_\nu \delta a^\nu$
なので，
$\qquad \displaystyle \delta \mathcal{L} =\partial_\mu \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi \right] \delta a^{\nu}$
である．一方， $\mathcal{L}$ は $x^{\mu}$ に直接は依存していないことに注意して，記号の乱用ではあるが， $\displaystyle \frac{\partial \mathcal{L}}{\partial x^\nu} = \frac{\partial }{\partial x^\nu} \mathcal{L} (\phi(x^\mu), \partial_\mu \phi (x^\mu) )$ と書くことにすると，今の変分の取り方では

$\qquad \displaystyle \begin{align} \delta \mathcal{L} &= \frac{\partial \mathcal{L} }{\partial x^\mu} \delta a^{\mu} \\ &= \delta_\nu^{\mu} \frac{\partial \mathcal{L} }{\partial x^\mu} \delta a^{\nu} \\ &= \partial_\mu \delta_\nu^{\mu} \mathcal{L} \delta a^{\nu} \end{align}$
と書ける．よって，平行移動の任意の変分で $\delta \mathcal{L}$ の計算の仕方が等しいという条件から
$\qquad \displaystyle \partial_\mu \left[ \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi - \delta_\nu^{\mu} \mathcal{L} \right] = 0$
を得る．ここで現れるテンソル
$\displaystyle \qquad T_\nu^\mu = \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi - \delta_\nu^{\mu} \mathcal{L}$
はエネルギー・運動量テンソルと呼ばれるものである．

（エネルギー・運動量テンソル）
エネルギー・運動量テンソル
$\displaystyle \qquad T_\nu^\mu = \frac{\partial \mathcal{L} }{\partial (\partial_\mu \phi) } \partial_\nu \phi - \delta_\nu^{\mu} \mathcal{L}$
は任意の $\nu$ に対して，
$\displaystyle \qquad \partial_\mu T_\nu^\mu = 0$
を満たす．

また，
$\qquad T_0^0 = \frac{\partial \mathcal{L}}{\partial \dot{\phi}} \dot{\phi} - \mathcal{L}$
をハミルトニアン密度，
$\displaystyle \qquad \mathbb{T}_0 = (T_0^1, T_0^1, T_0^3)$
をエネルギーの流束と呼ぶ．

さらに，
$\displaystyle \qquad P_i = \int T_i^0 d^3 \mathbb{x}$
を場の運動量と呼ぶ．

得られた式のうち， $\nu = 0$ の場合は
$\displaystyle \qquad \frac{\partial}{\partial_t} T_0^0 + \mathrm{div} \mathbb{T}_0 = 0$
はエネルギー保存を意味する．実際，エネルギーの流速が遠方で $0$ と仮定するとガウスの発散定理により，
$\displaystyle \qquad \frac{\partial}{\partial t}\int T_0^0 d^3 \mathbb{x} = -\int \mathrm{div} \mathbb{T}_0 d^3 \mathbb{x} = 0$
となる．同様に， $T_i^j$ が遠方で $0$ と仮定すれば，運動量保存
$\displaystyle \qquad \frac{\partial}{\partial t} P_i = \frac{\partial}{\partial t}\int T_i^0 d^3 \mathbb{x} = -\int \mathrm{div} \mathbb{T}_i d^3 \mathbb{x} = 0$
を得る．

ラグランジュ形式によるマクスウェル方程式

前回求めたように，ポテンシャルを用いたときのマクスウェル方程式は
$\displaystyle \qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu$
と定義したときに
$\displaystyle \qquad \partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}$
と書ける．この方程式を導くラグランジアン密度は
$\displaystyle \qquad \mathcal{L} = - \frac{1}{4 \mu_0} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu$
である．実際，
$\displaystyle \qquad S = \int \left[ - \frac{1}{4 \mu_0} g_{\mu \lambda} g_{\nu \rho} F^{\lambda \rho} F^{\mu \nu} - j^{\mu} A_\mu \right] d^4 x$
なので，
$\displaystyle \qquad \begin{align} \delta S &= \int \left[ - \frac{1}{2 \mu_0} g_{\mu \lambda} g_{\nu \rho} F^{\lambda \rho} \delta F^{\mu \nu} - j^{\mu} \delta A_\mu \right] d^4 x \\ &= \int \left[ - \frac{1}{2 \mu_0} F^{\lambda \rho} (\partial_{\lambda} \delta A_{\rho} - \partial_\rho \delta A_{\lambda}) - j^{\mu} \delta A_\mu \right] d^4 x \\ &= \int \left[ - \frac{1}{\mu_0} F^{\lambda \rho} \partial_{\lambda} \delta A_{\rho} - j^{\mu} \delta A_\mu \right] d^4 x \\ &= \int \left[ \frac{1}{\mu_0} \partial_\mu F^{\mu \nu} - j^{\nu}\right] \delta A_\nu d^4 x \end{align}$
により，
$\qquad \displaystyle \frac{1}{\mu_0} \partial_\mu F^{\mu \nu} - j^{\nu} = 0$
を得る．

（電磁場のラグランジアン密度）
電磁場のラグランジアン密度は
$\displaystyle \qquad \mathcal{L} = - \frac{1}{4 \mu_0} F_{\mu \nu} F^{\mu \nu} - j^{\mu} A_\mu$
である．ここで，
$\displaystyle \qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu$
とおいた．

ここで，ゲージ変換の意味を考え直す．ゲージ変換
$\qquad \displaystyle A^{\mu} \rightarrow A^{\mu} + \partial^{\mu} \chi$
によって，
$\qquad \displaystyle F^{\mu \nu} \rightarrow F^{\mu \nu} + (\partial^\mu \partial \nu \chi - \partial^\nu \partial^{\nu} \chi ) = F^{\mu \nu}$
となるので $F^{\mu \nu}$ は変化しない．なので作用の変化を計算すると，
$\qquad \displaystyle \begin{align} S & \rightarrow S - \int j_\mu \partial^{\mu} \chi d^4 x \\ &= S + \int (\partial^\mu j_\mu) \chi d^4 x \end{align}$
となる．よって，任意の $\chi$ で作用 $S$ が変化しないための条件は
$\displaystyle \qquad \partial^\mu j_\mu = \partial_\mu j^\mu = 0$
である．この式は電荷の保存則であった．つまり，マクスウェル方程式から電荷の保存が得られるが，一方で電荷の保存がゲージ変換による作用の不変性を与える．

続き
tetobourbaki.hatenablog.com

2019-01-23

理想的な物理理論としての電磁気学(2)

物理学

今回は以下のブログの続きで、相対性理論に関連することをまとめる．
tetobourbaki.hatenablog.com

ローレンツ変換
テンソル
ローレンツ共変性
共変形式のマクスウェル方程式

ローレンツ変換

物理学では，「座標が変わっても法則の形は変わらない」という信念がある．例えば，ニュートンの運動方程式は座標変換で方程式の形が大きく変わってしまうが、ラグランジュ力学系におけるオイラー・ラグランジュ方程式やハミルトン力学系におけるハミルトン系は（適切な）変数変換で方程式の形が全く変わらない．

そこで，マクスウェル方程式の形が変わらないように適切な変数変換を考えるという問題意識が自然に現れる．もしそのような変換がなければ，マクスウェル方程式は基礎におく方程式と適切でない．ただし，座標の変換だけでなく， $\mathbb{E}$ などの物理量を表す変数も適切に変換する必要があるという話になっていく．

ここでは，ローレンツ条件の下でのマクスウェル方程式から始めることにする．

（ローレンツ条件の下でのマクスウェル方程式）
ローレンツ条件
$\displaystyle \qquad \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0$
の下で
$\displaystyle \qquad \begin{align} &\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi = \frac{1}{\epsilon} \rho \\ &\displaystyle \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} = \mu \mathbb{j} \end{align}$

ここで現れた特徴的な作用素を
$\qquad \displaystyle \Box := \epsilon \mu \frac{\partial^2}{\partial t^2} -\Delta$
と定義しておこう．これはダランベルシアンと呼ばれる．まず簡単のため，電荷と電流がない真空の状況を考える．この時，マクスウェル方程式は
$\displaystyle \qquad \begin{align} \Box \phi = 0\\ \Box \mathbb{A} = 0 \end{align}$
となる．空間だけの変換ではうまくいかないことが分かるので最初から，時間も合わせた4次元の変換 $(t,\mathbb{x}) \rightarrow (t', \mathbb{x})$ で方程式が
$\displaystyle \qquad \begin{align} \Box' \phi' = 0\\ \Box' \mathbb{A}' = 0 \end{align}$
のように形が全く変化しないための条件を考える．ここで， $\phi', \mathbb{A}'$ は変換後の物理量であるが，うまくいくように後で決めることになる．

一般に考えるのは難しいので，まずは， $x$ 方向に速度 $v$ で動く物体から見た座標 $(t', \mathbb{x})$ を考える．仮定として，変換が線型で $y, z$ に関しては恒等変換になるという条件を課せば，考える変換は
$\displaystyle \qquad \begin{align} &x' = \gamma_1 (x - vt) \\ &y' = y\\ &z' = z\\ &t' = \gamma_2 (t + s x) \end{align}$
となる． $\gamma_1, \gamma_2, s$ は求めるパラメータである．マクスウェル方程式が不変になるように， $\Box' = \Box$ となるための条件を考える．
$\displaystyle \qquad \begin{align} & \frac{\partial}{\partial t} = \gamma_2 \frac{\partial}{\partial t'} - v \gamma_1 \frac{\partial}{\partial x'} \\ & \frac{\partial}{\partial x} = \gamma_2 s \frac{\partial}{\partial t'} + \gamma_1 \frac{\partial}{\partial x'} \end{align}$
となるので計算すると
$\displaystyle \qquad \begin{align} \Box = & \, \Box' + ( \epsilon_0 \mu_0 (\gamma_2^2 - 1) - \gamma_2^2 s^2 ) \frac{\partial^2}{\partial t'^2} \\ &+ (\epsilon_0 \mu_0 v^2 \gamma_1^2 - \gamma_1^2 + 1) \frac{\partial^2}{\partial x'^2} - 2 \gamma_1 \gamma_2 ( \epsilon_0 \mu_0 v + s) \frac{\partial^2}{\partial t \partial x'} \end{align}$
だから， $c = \frac{1}{ \epsilon_0 \mu_0}, \beta = \frac{v}{c}$ とおくと，
$\displaystyle \qquad \begin{align} &s = - \frac{\beta}{c} \\ &\gamma_1^2 = \frac{1}{1 - \beta^2} \\ &\gamma_1^2 = \frac{1}{1 - \beta^2} \end{align}$
が分かる．ここで導入した $c$ はまさに光速を表すことになる． $\gamma_1, \gamma_2 > 0$ を仮定すれば，等速運動から見た座標への変換は
$\displaystyle \qquad \begin{align} &x' = \gamma_1 (x - vt) \\ &y' = y\\ &z' = z\\ &t' = \gamma_1 \left( t - \frac{\beta}{c} x \right) \end{align}$
であることが分かった．

（等速直線運動のローレンツ変換）
座標系 $(t, \mathbb{x})$ から $x$ 方向に $v$ で等速直線運動する座標系 $(t', \mathbb{x}')$ への変換で $\Box' = \Box$ となるものは
$\displaystyle \qquad \begin{align} &x' = \gamma (x - vt) \\ &y' = y\\ &z' = z\\ &t' = \gamma \left(t - \frac{\beta}{c} x \right) \end{align}$
である．ここで，
$\displaystyle \qquad \begin{align} &c = \frac{1}{ \epsilon_0 \mu_0} \quad \beta = \frac{v}{c}, \quad \gamma = \frac{1}{\sqrt{1 - \beta^2}} \end{align}$
である．

このように相対性理論で出てくるローレンツ変換が現れる． $c$ の意味が分かりやすいことがこの方法の魅力である．

テンソル

マクスウェル方程式に問題を戻ると，実はまだ問題は解決していない．なぜなら，この変換でゲージ条件が変わってしまうからである．このことに踏み込む前に，数学的な準備をしておく．

まず，空間と時間をまとめて4次元のベクトルとして扱った方が良さそうなので， $x^{\mu} = (x^0, x^1, x^2. x^3) := (ct, x, y, z)$ と表すことにする．ギリシャ文字は0から3を動くとし，ローマ字は1から3まで動くとする． $x^{\mu}$ はベクトルと $\mu$ 成分のどちらも表すことがあるので注意せよ．偏微分は
$\qquad \displaystyle \partial_{\mu} := \frac{\partial}{\partial x^{\mu}}$
と表すことにする．下添字と上添字は区別していくので注意せよ．すると，ダランベルシアンは
$\qquad \displaystyle \Box = \partial_0 - \sum_{i=1}^3 \partial_i$
となるが，計量テンソル $g_{\mu \nu}$ を
$\qquad \displaystyle g_{00} = 1, \quad g_{ii} = -1, \quad g_{\mu \nu} = 0 \, (\mu \neq \nu)$
と定め，その逆行列で $g^{\mu \nu}$ を定義すれば，
$\qquad \displaystyle \Box = \sum_{\mu, \nu} g^{\mu \nu} \partial_\mu \partial_\nu$
と書くことができる．今の場合， $g_{\mu \nu}$ と $g^{\mu \nu}$ は成分が同じであるため違いが分からないように見えるが，上添字と下添字を区別していく．

ここからアインシュタインの規約を使っていく．つまり，下添字と上添字で同じ記号が現れた場合には（たびたび，上下が同じでも），それらに関する和をとることにする．例えば，ダランベルシアンは
$\qquad \displaystyle \Box = g^{\mu \nu} \partial_\mu \partial_\nu$
と書くことができる．さらに，3次反対称テンソル $\epsilon^{ijk}$ を $(ijk)$ が $(123)$ の偶置換のとき 1， $(ijk)$ が $(123)$ の奇置換のとき-1，それ以外のとき 0，と定めると $\mathbb{V} = (V^1, V^2, V^3)$ のローテーションの $i$ 成分は
$\qquad \displaystyle (\mathrm{rot} \mathbb{V})^i := \epsilon^{ijk} \partial_j V^k$
と書くことができる．ここでアルファベット $i,j,k$ は 1から 3までを動くように和を取っていることに注意せよ．

さてローレンツ変換に戻ろう．ローレンツ変換がダランベルシアンを変化させないものであったが，一般に変数変換
$\qquad \displaystyle {x^{\mu}}' = a^{\mu}_{\ \ \nu} x^\nu$
と変換されるとき，ダランベルシアンは
$\qquad \displaystyle \Box = g^{\mu \nu} a^{\lambda}_{\ \ \mu} a^{\rho}_{\ \ \nu} \partial_{\lambda}' \partial_{\rho}'$
となるので，ダランベルシアンが変わらないための条件は
$\displaystyle \qquad g^{\mu \nu} a^{\lambda}_{\ \ \mu} a^{\rho}_{\ \ \nu} = g^{\lambda \rho}$
となる．実際，ローレンツ変換はこれを満たす．逆にこのような変換を一般のローレンツ変換と呼ぶことにする．

（一般のローレンツ変換）
変数変換
$\qquad \displaystyle {x^{\mu}}' = a^{\mu}_{\ \ \nu} x^\nu$
がローレンツ変換であるとは，
$\displaystyle \qquad g^{\mu \nu} a^{\lambda}_{\ \ \mu} a^{\rho}_{\ \ \nu} = g^{\lambda \rho}$
を満たすことを言う．

（注意．一般には二次形式 $g_{\mu \nu} dx^{\mu} dy^{\nu}$ を不変にするものをローレンツ変換というが，今回はダランベルシアンの不変性で定義したのでこのようになった．今は $g_{\mu \nu}$ と $g^{\mu \nu}$ に違いはないためうまくいくが， 2次形式の不変性で定義した方が良い．）

さて，これからが大事である．座標 $x^{\mu}$ と同じように変換されるものを反変ベクトルといい，反変テンソルに $g_{\mu \nu}$ をかけたものを共変ベクトルという．

（共変ベクトル，反変ベクトル，共変テンソル）
変数変換が
$\qquad \displaystyle {x^{\mu}}' = a^{\mu}_{\ \ \nu} x^\nu$
となっているとき， $U^{\mu}$ が反変ベクトルであるとは
$\displaystyle \qquad {U^{\mu}}' = a^{\mu}_{\ \ \nu} U^{\mu}$
が成り立つことを言う．また，
$\displaystyle \qquad {U_{\mu}} = g_{\mu \nu} U^{\mu}$
を $U^{\mu}$ の共変ベクトルという．

一般に， $U^{\mu_1 \dots \mu_n}$ が $n$ 階の反変ベクトルであるとは変数変換で
$\displaystyle \qquad {U^{\mu_1 \dots \mu_n}}' = a^{\mu_1}_{\ \ \nu_1} \dots a^{\mu_n}_{\ \ \nu_n} U^{\nu_1 \dots \nu_n}$
が成り立つことを言う．

ここで， $\partial^\mu := g^{\mu \nu} \partial_\nu$ と定義する．ローレンツ変換の条件式を用いれば，
$\displaystyle \qquad \begin{align} {\partial^\mu}'& := g^{\mu \nu} {\partial_\nu}' \\ &=a^{\mu}_{\\ \lambda} g^{\lambda \rho} a^{\nu}_{\ \ \rho} {\partial_\nu}' \\ &=a^{\mu}_{\\ \lambda} g^{\lambda \rho} \frac{\partial {x^{\nu}}'}{\partial x^\rho} \frac{\partial {x^{\alpha}}'}{\partial x^\nu} \partial_\alpha \\ &=a^{\mu}_{\\ \lambda} g^{\lambda \rho} \delta^{\alpha}_{\ \ \rho} \partial_\alpha \\ &=a^{\mu}_{\\ \lambda} g^{\lambda \rho} \partial_\rho \\ &=a^{\mu}_{\\ \lambda} \partial^{\lambda} \end{align}$
となる．つまり， $\partial^\mu$ は反変ベクトルである．また， $\partial_{\mu} = g_{\mu \nu} \partial^\nu$ となることが分かるので $\partial_{\mu}$ は共変ベクトルである．

ちょっと長かったが，以上の準備から以下の性質を得る．

（共変ベクトルと反変ベクトル内積のスカラー性）
反変ベクトル $U^{\mu}$ と共変ベクトル $V_{\mu}$ に対して， $U^{\mu} V_{\mu}$ はローレンツ変換で不変である．つまり，
$\qquad \displaystyle {U^{\mu}}' {V_{\mu}}' =U^{\mu} V_{\mu}$
が成り立つ．

これはローレンツ変換の定義から明らかである．実際，
$\qquad \displaystyle \begin{align} {U^{\mu}}' {V_{\mu}}' &= g_{\mu \nu }{U^{\mu}}' {V^{\mu}}' \\ &= g_{\mu \nu } a^{\mu}_{\ \ \lambda} a^{\mu}_{\ \ \rho} {U^{\lambda}} {V^{\rho}} \\ &= g_{\lambda \rho} {U^{\lambda}} {V^{\rho}}\\ &= {U^{\lambda}} {V_{\lambda}} \end{align}$
となる．

ダランベルシアンは
$\displaystyle \qquad \Box = g_{\mu \nu} \partial_\mu \partial_\nu = \partial_\mu \partial^{\nu}$
と書けることからも，ローレンツ不変であることがわかる．

ローレンツ共変性

マクスウェル方程式の問題に戻ろう．今の所，
ローレンツ条件
$\displaystyle \qquad \frac{1}{c^2} \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0$
の下でマクスウェル方程式は
$\displaystyle \qquad \begin{align} & \partial_{\mu} \partial^{\nu} \phi = \frac{1}{\epsilon_0} \rho \\ & \partial_{\mu} \partial^{\nu} \mathbb{A} = \mu_0 \mathbb{j} \end{align}$
と書けることが分かっていた．ダランベルシアンはローレンツ変換で $\Box' = \Box$ となり不変であったから，マクスウェル方程式は変更する必要がない．しかし，ローレンツ条件は形が変わってしまう．どのように変化するかを計算しても答えは分かるがもっと簡単な方法がある．ローレンツ条件は
$\displaystyle \qquad \frac{1}{c} \partial_0 \phi + \partial_1 A_x + \partial_2 A_y + \partial_3 A_z= 0$
である．これまでの記号を用いてこの方程式を簡単に書くには，まず，
$\displaystyle \qquad \partial_0 (\frac{1}{c} \phi) - \partial_1 (-A_x) - \partial_2 (-A_y) - \partial_3 (-A_z)= 0$
となるので， $A_{\mu} = (\frac{1}{c} \phi, -A_x, -A_y, -A_z)$ とおけば，
$\displaystyle \qquad \partial_{\mu} g^{\mu \nu} A_{\nu}= 0$
と書ける．そこで $A^{\mu} = g^{\mu \nu} A_{\nu}$ とおけば
$\displaystyle \qquad \partial_{\mu} A^{\mu} = 0$
と書ける．ここで， $A^{\mu}$ が反変ベクトルであれば，つまり， $A_{\mu}$ が共変ベクトルであればローレンツ変換で式は形を変えない．つまり，
$\displaystyle \qquad {\partial_{\mu}}' {A^{\mu}}' = \partial_{\mu} A^{\mu}$
となる．よって， $A_{\mu} = (\frac{1}{c} \phi, -A_x, -A_y, -A_z)$ はローレンツ変換で共変ベクトルとして変化するように定めれば良い．それは， $A^{\mu} = (\frac{1}{c} \phi, A_x, A_y, A_z)$ がローレンツ変換で反変ベクトルとして変化することと同じである．

（ポテンシャルの変換）
$A^{\mu} = (\frac{1}{c} \phi, A_x, A_y, A_z)$ がローレンツ変換で
$\displaystyle \qquad {A^{\mu}} = a^{\mu}_{\ \ \nu} A^{\nu}$
と変換すると定めれば，ローレンツ条件はローレンツ変換で不変である．

ダランベルシアンや偏微分はローレンツ変換でどのように変わるかは決まってしまうが，物理量は自分で決めるものである．普通，座標を変えても物理量は変わらないものとして扱うかもしれないが，うまく物理量の変化を自分で決めることで法則が簡単になるようにしているのである．これは，等加速度運動している座標系においては力が変化して慣性力がかかっていると考えることで，そこを静止座標系とみて議論ができるようになるのと同じ発想である．

最後に電荷 $\rho$ と電流 $\mathbf{j}$ の変化も定めよう．今まで行っていなかったが，これらは自由に取っていいわけではなく，電荷の保存則
$\qquad \displaystyle \frac{\partial \rho}{\partial t} + \mathrm{div} \, \mathbf{j} = 0$
を満たしている必要がある．この式は
$\displaystyle \qquad \partial_0 (c \rho ) - \partial_1 (-j_x) - \partial_2 (-j_y) - \partial_3 (-j_z)= 0$
と書けるので， $j_{\mu} := (c \rho, -j^x), -j^y, -j^z)$ と定めて， $j^{\mu} := g^{\mu \nu} j_{\nu} = (c\rho, j_x, j_y, j_z)$ とすれば，電荷の保存則は
$\displaystyle \qquad \partial_\mu j^{\mu} = 0$
と書ける．よって， $j^{\mu}$ が共変ベクトルであれば，ローレンツ変換で保存則は不変である．

（電荷と電流の変換）
$j^{\mu} = (c\rho, j_x, j_y, j_z)$ がローレンツ変換で
$\displaystyle \qquad {j^{\mu}} = a^{\mu}_{\ \ \nu} j^{\nu}$
と変換すると定めれば，電荷の保存則はローレンツ変換で不変である．

以上をまとめると，マクスウェル方程式がローレンツ変換で不変であることが分かる．

（マクスウェル方程式のローレンツ共変性）
ローレンツ条件 $\partial_\mu A^{\mu} = 0$ を満たすポテンシャル $A^{\mu} = (\frac{1}{c} \phi, A_x, A_y, A_z)$ と
電荷の保存則 $\partial_\mu j^\mu = 0$ を満たす電荷と電流 $j^{\mu} = (c\rho, j_x, j_y, j_z)$ が共変ベクトルで
マクスウェル方程式
$\displaystyle \qquad \partial_{\nu} \partial^{\nu} A^\mu = \mu_0 j^\mu$
を満たすとする．
このとき，ローレンツ変換でローレンツ条件，電荷の保存則，マクスウェル方程式は満たされる．

これまでの流れを整理しておく．まず，ダランベルシアンが変化しないものとしてローレンツ変換を定めた．次に，ローレンツ変換で法則の形が変わらないように物理量 $A^\mu$ と $j^\mu$ の変換を定めた．おまけとしてマクスウェル方程式が $\Box A^\mu = \mu_0 j^{\mu}$ という簡単な式で表されていることにも注意しよう．

ちなみに，ここで導入した文字を用いれば，ゲージ変換
$\displaystyle \qquad (\phi, \mathbb{A}) \rightarrow (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi)$
は
$\displaystyle \qquad A^{\mu} \rightarrow A^{\mu} + \partial^{\mu} \chi$
と書ける．

共変形式のマクスウェル方程式

ポテンシャルのマクスウェル方程式はゲージを固定したときの書き方なので，ゲージによらない，つまり， $\mathbb{E}, \mathbb{B}$ の方程式をきれいな形で書くことを考えよう．そのために， $\mathbb{E}, \mathbb{B}$ を一つの量で表せないか考える．

まず，ポテンシャルの定義より，
$\displaystyle \qquad \begin{align} & \mathbb{B} = \mathrm{rot} \mathbb{A} \\ & \mathbb{E} = - \mathrm{grad} \phi - \frac{\partial \mathbb{A}}{\partial t} \end{align}$
であった．最初の式を書き直すと，
$\qquad B^I = \epsilon^{ijk} \partial_j A^k$
であるが，計算すると，
$\qquad \epsilon^{lmi} B^l = - \partial^l A^m + \partial^m A^l$
となることが分かる．次に 2番目の指揮により，
$\displaystyle \qquad \begin{align} E^i &= -\partial_i \phi - \frac{\partial}{\partial t} A^i \\ &=c \left\{ -\partial_i) \frac{\phi}{c} - \partial_0 A^i \right\} \\ &= c ( \partial^i A^0 - \partial^0 A^i) \end{align}$
と書ける．よって，
$\displaystyle \qquad F^{\mu \nu} := \partial^\mu A^\nu - \partial^{\nu} A^\mu$
とおけば，
$\displaystyle \qquad \begin{align} &E^i = cF^{i 0} &\epsilon^{ijk} B^k = - F^{ij} \end{align}$
と書くことができる． $F^{\mu \nu}$ は 2つの反変ベクトルで定義されているので 2階の反変テンソルである．行列で書けば，
$\displaystyle \qquad F^{\mu \nu} = \left( \begin{matrix} 0 & - E_x/c & -E_y/c & -E_z/c \\ E_x /c &0 & -B_z & B_y \\ E_y/c & B_z & 0 & -B_x \\ E_z/c & - B_y & B_x & 0 \end{matrix} \right)$
となる．

悲しいことに，非常に面倒になってきた．計算を省略するが，マクスウェル方程式のうち右辺が 0でない
$\displaystyle \qquad \begin{align} &\mathrm{div} \mathbb{E} = \frac{1}{\epsilon_0} \rho \\ &\frac{1}{\mu_0} \mathrm{rot} \mathbb{B} - \epsilon_0 \frac{\partial \mathbb{E}}{\partial t} = \mathbb{j} \end{align}$
は
$\displaystyle \qquad \partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}$
と書くことができる．
また，マクスウェル方程式の残りの式
$\displaystyle \qquad \begin{align} &\mathrm{div} \mathbb{B} = 0 \\ &\mathrm{rot} \mathbb{E} + \frac{\partial \mathbb{B}}{\partial t} = 0 \end{align}$
は
$\displaystyle \qquad \partial_{\lambda} F^{\mu \nu} + \partial_{\mu} F^{\nu \lambda} + \partial_{\nu} F^{\lambda \mu} = 0$
と書けることが分かる．

以上をまとめると以下のようになる．

（共変形式のマクスウェル方程式）
2階の反変テンソル $F^{\mu \nu}$ を
$\displaystyle \qquad F^{\mu \nu} = \left( \begin{matrix} 0 & - E_x/c & -E_y/c & -E_z/c \\ E_x /c &0 & -B_z & B_y \\ E_y/c & B_z & 0 & -B_x \\ E_z/c & - B_y & B_x & 0 \end{matrix} \right)$
と定めると，マクスウェル方程式は
$\displaystyle \qquad \begin{align} & \partial_\mu F^{\mu \nu} = \mu_0 j^{\mu}\\ & \partial_{\lambda} F^{\mu \nu} + \partial_{\mu} F^{\nu \lambda} + \partial_{\nu} F^{\lambda \mu} = 0 \end{align}$
となる．

ちなみに，ポテンシャルを用いたときは定義から
$\displaystyle \qquad \begin{align} &\mathrm{div} \mathbb{B} = 0 \\ &\mathrm{rot} \mathbb{E} + \frac{\partial \mathbb{B}}{\partial t} = 0 \end{align}$
が自動的に成り立つので，ポテンシャルを用いて 2階反変テンソル
$\displaystyle \qquad F^{\mu \nu} = \partial^\mu A^\nu - \partial^{\nu} A^\mu$
を定義した場合には
$\displaystyle \qquad \partial_{\lambda} F^{\mu \nu} + \partial_{\mu} F^{\nu \lambda} + \partial_{\nu} F^{\lambda \mu} = 0$
は自動的に成り立つ．

続き
tetobourbaki.hatenablog.com

2019-01-21

理想的な物理理論としての電磁気学(1)

物理学

物理学の様々な分野を勉強する上で，電磁気学は理論のお手本として提示されることが多い．つまり，成功した理論である電磁気学との類推で新しい理論の方針を決めるという場面が非常に多い．そのため，電磁気学のどこを見て成功している理論と呼んでいるのかを理解していなければ，その他の分野を勉強する上で指針がなくなってしまう．そこで，他の分野へのお手本として電磁気学を捉えるという目標で，電磁気学を整理していく．

以下の内容は牟田泰三『電磁気学』（岩波書店）を参考にした。

マクスウェル方程式
ポテンシャル
ゲージ変換
ポテンシャルを用いたマクスウェル方程式
- ローレンツゲージ
- クーロンゲージ
最後に

マクスウェル方程式

電磁気学で扱われるすべての現象は以下のマクスウェル方程式から導くことができる．本記事ではマクスウェル方程式の物理的な意味の説明は省略し，この方程式自体を考察するところから始めていく．

（マクスウェル方程式）
$\displaystyle \begin{align} & \mathrm{div} \,\mathbb{D} = \rho \tag{1} \\ &\mathrm{div} \,\mathbb{B} = 0 \tag{2} \\ &\mathrm{rot} \,\mathbb{H} - \frac{\partial \mathbb{D}}{\partial t} = \mathbb{j} \tag{3} \\ &\mathrm{rot} \,\mathbb{E} + \frac{\partial \mathbb{B}}{\partial t} = 0 \tag{4} \end{align}$

マクスウェル方程式だけでは，条件は不十分で，適切な問題設定を与えなければならない．特に， $\mathbb{E}$ と $\mathbb{D}$ および $\mathbb{H}$ と $\mathbb{B}$ の関係を表す条件が与えられなければ，方程式は解きようがない．状況の一つとして，例えば等方一様媒質においては以下の関係が成り立つのであった．

等方一様媒質において，
$\displaystyle \qquad \begin{align} &\mathbb{D} = \epsilon \mathbb{E} \\ &\mathbb{H} = \frac{1}{\mu} \mathbb{B} \end{align}$

このような条件があれば，あとは $\rho, \mathbb{j}$ および境界条件を与えることで方程式の解を考えることができる．

ポテンシャル

マクスウェル方程式は4つの変数 $\mathbb{E}, \mathbb{D}, \mathbb{H}, \mathbb{B}$ に関する方程式であるが，ポテンシャルと呼ばれる変数を用いれば便利である．これを導入するために以下のベクトル解析の定理を用いる．

（ポアンカレの補題）

$\mathrm{rot} \mathbb{V} = 0\, \Leftrightarrow \,$ ある関数 $\phi$ が存在して $\mathbb{V} = \mathrm{grad} \phi$ と書ける．

$\mathrm{div} \mathbb{V} = 0\, \Leftrightarrow \,$ あるベクトル $\mathbb{A}$ が存在して $\mathbb{V} = \mathrm{rot} \mathbb{A}$ と書ける．

このポアンカレの補題を用いよう．
マクスウェル方程式(2) $\mathrm{div} \mathbb{B} = 0$ より、 $\mathbb{B} = \mathrm{rot} \mathbb{A}$ となる $\mathbb{A}$ が取れる．さらにこの式とマクスウェル方程式 (4) により
$\displaystyle \qquad \mathrm{rot} \left(\mathbb{E} + \frac{\partial \mathbb{A}}{\partial t} \right) = 0$
なので，ポアンカレの補題により
$\displaystyle \qquad \mathbb{E} + \frac{\partial \mathbb{A}}{\partial t} = - \mathrm{grad} \mathrm{\phi}$
となる $\phi$ が取れる．つまり， $\phi, \mathbb{A}$ を用いて
$\displaystyle \qquad \begin{align} &\mathbb{B} = \mathrm{rot} \,\mathbb{A}\\ &\mathbb{E} = -\mathrm{grad} \, {\phi} - \frac{\partial \mathbb{A} }{\partial t} \end{align}$
と表すことができる．この $\mathbb{A}$ を磁束密度 $\mathbb{B}$ に対するベクトルポテンシャル， $\phi$ をスカラーポテンシャルと呼ぶ．

（ポテンシャル）
$\phi, \mathbb{A}$ がポテンシャルであるとは，
$\displaystyle \qquad \begin{align} &\mathbb{B} = \mathrm{rot} \,\mathbb{A}\\ &\mathbb{E} = -\mathrm{grad} \, {\phi} - \frac{\partial \mathbb{A} }{\partial t} \end{align}$
を満たすことをいう．

ゲージ変換

ポテンシャル $\phi, \mathbb{A}$ を導入したが，ここで，
$\displaystyle \qquad \begin{align} & \mathrm{rot} \, \mathbb{A}_{\chi} = 0 \\ & \mathrm{grad} \, \phi_{\chi} + \frac{\partial \mathbb{A}_{\chi}}{\partial t} = 0 \end{align}$
となる $\phi_{\chi}, \mathbb{A}_{\chi}$ を取ると，
$\displaystyle \qquad \begin{align} &\mathbb{B} = \mathrm{rot} \,\mathbb{A} = \mathrm{rot}\, ( \mathbb{A} + \mathbb{A}_{\chi}) \\ &\mathbb{E} = -\mathrm{grad} \, {\phi} - \frac{\partial \mathbb{A} }{\partial t} = -\mathrm{grad} \, ({\phi + \phi_{\chi} }) - \frac{\partial (\mathbb{A} +\mathbb{A}_{\chi}) }{\partial t} \end{align}$
となる．つまり， $\phi + \phi_{\chi}, \mathbb{A} + \mathbb{A}_{\chi}$ もポテンシャルになるのである．あるいはポテンシャルには $\phi_{\chi}, \mathbb{A}_{\chi}$ 分の不定性があると言ってもいい．

このように， $\phi , \mathbb{A}$ を $\phi + \phi_{\chi}, \mathbb{A} + \mathbb{A}_{\chi}$ に変化させることをゲージ変換といい，この変換で $\mathbb{B}, \mathbb{E}$ が変わらないことはゲージ不変性と呼ばれる．

ところで，
$\displaystyle \qquad \mathrm{rot} \mathbb{A}_{\chi} = 0$
なので， $\mathbb{A}_{\chi} = -\mathrm{grad} \chi$ となる関数 $\chi$ が存在する．さらに
$\displaystyle \qquad \mathrm{grad} \left( \phi_{\chi} - \frac{\partial \chi}{\partial t} \right) = 0$
なので， $t$ にのみ依存する関数 $C(t)$ で
$\displaystyle \qquad \phi_{\chi} - \frac{\partial \chi}{\partial t} = C(t)$
と書ける．ここで， $\chi + \int^t C(t') dt'$ を改めて $\chi$ と書くことにすると
$\displaystyle \qquad \begin{align} &\mathbb{A}_{\chi} = -\mathrm{grad}\, \chi \\ &\phi_{\chi} = \frac{\partial \chi}{\partial t} \end{align}$
が成り立つ．つまり，ゲージ変換とはある関数 $\chi$ を用いて
$\displaystyle \qquad (\phi, \mathbb{A}) \rightarrow (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi )$
と変換することに他ならないことがわかった．

（ゲージ変換）
ある関数 $\chi$ を用いて
$\displaystyle \qquad (\phi, \mathbb{A}) \rightarrow (\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi )$
とポテンシャルを変換すること．

ゲージ変換によりポテンシャルが良い性質を満たすように変換することができるが，そのようにしてポテンシャルを一つの形に決めることをゲージを固定するという．

ポテンシャルを用いたマクスウェル方程式

最後にゲージ変換の応用を述べる．マクスウェル方程式 (1) と (3) をまだ使っていなかった．等方一様媒質と仮定すれば
$\displaystyle \qquad \begin{align} &\mathbb{D} = \epsilon \mathbb{E} \\ &\mathbb{H} = \frac{1}{\mu} \mathbb{B} \end{align}$
なので，これとポテンシャルを用いてマクスウェル方程式を書き換える．
それにはベクトル解析の公式を用いる．

(公式)
$\qquad \displaystyle \mathrm{div}\, \mathrm{grad} = \Delta$
$\qquad \displaystyle \mathrm{rot}\, \mathrm{rot} = \mathrm{grad}\, \mathrm{div} - \Delta$

さて，この公式とポテンシャルを用いれば，ちょっと計算すれば，マクスウェル方程式(1)は
$\displaystyle \qquad \Delta \phi + \frac{\partial \, \mathrm{ div} \mathbb{A} }{\partial t} = - \frac{1}{\epsilon} \rho$
となる．また，マクスウェル方程式(3)は
$\displaystyle \qquad \begin{align} \Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \mathrm{grad} \left( \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} \right) = 0 \end{align}$
となる．

マクスウェル方程式(2)と(4)はポテンシャルの定義から自動的に成立するので，ポテンシャル $\phi, \mathbb{A}$ を用いればマクスウェル方程式は
$\displaystyle \qquad \begin{align} &\Delta \phi + \frac{\partial \, \mathrm{ div} \mathbb{A} }{\partial t} = - \frac{1}{\epsilon} \rho \\ &\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \mathrm{grad} \left( \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} \right) = - \mu \mathbb{j} \end{align}$
となる．

（ポテンシャルを用いたマクスウェル方程式）
$\displaystyle \qquad \begin{align} &\Delta \phi + \frac{\partial \, \mathrm{ div} \mathbb{A} }{\partial t} = - \frac{1}{\epsilon} \rho \\ &\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \mathrm{grad} \left( \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} \right) = - \mu \mathbb{j} \end{align}$

最後にゲージ変換により，ポテンシャルを用いたマクスウェル方程式を簡単化することを考えよう．

ローレンツゲージ

まず，
$\displaystyle \qquad \epsilon \mu \frac{\partial \phi}{\partial t} + \mathrm{div} \mathbb{A} = 0$
となるように $\phi, \mathbb{A}$ をとる．この条件をローレンツ条件という．この条件の下ではマクスウェル方程式は
$\displaystyle \qquad \begin{align} &\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi = \frac{1}{\epsilon} \rho \\ &\displaystyle \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} = \mu \mathbb{j} \end{align}$
となることが簡単にわかる． $\phi$ と $\mathbb{A}$ の方程式はほぼ同じになっている．

ここでローレンツ条件を満たすようにゲージ変換することができるかを考えよう．ポテンシャル $(\phi + \frac{\partial \chi}{\partial t}, \mathbb{A} - \mathrm{grad} \chi )$ がローレンツ条件を満たすための条件は
$\displaystyle \qquad \epsilon \mu \frac{\partial^2 \chi}{\partial t^2} - \Delta \chi = \mathrm{div} \mathbb{A} - \frac{\partial \phi}{\partial t}$
となることが分かる．適当なポテンシャル $\phi, \mathbb{A}$ に対してこの方程式を解けば，ローレンツ条件を満たすようにゲージ変換することができる．

クーロンゲージ

次に
$\displaystyle \qquad \mathrm{div} \mathbb{A} = 0$
となるように $\phi, \mathbb{A}$ をとる．この条件をクーロン条件という．この条件の下ではマクスウェル方程式が，
$\displaystyle \qquad \begin{align} &\Delta \phi = - \frac{1}{\epsilon} \rho \\ &\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \epsilon \mu \mathrm{grad} \frac{\partial \phi}{\partial t} = - \mu \mathbb{j} \end{align}$
となることが簡単にわかる． $\phi$ がポアソン方程式を満たすことになり，しかも，これはクーロンポテンシャルを求めるときにも現れた方程式そのままである．

（クーロン条件の下でのマクスウェル方程式）
クーロン条件
$\displaystyle \qquad \mathrm{div} \mathbb{A} = 0$
の下で
$\displaystyle \qquad \begin{align} &\Delta \phi = - \frac{1}{\epsilon} \rho \\ &\Delta \mathbb{A} - \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \epsilon \mu \mathrm{grad} \frac{\partial \phi}{\partial t} = - \mu \mathbb{j} \end{align}$

最後に

本記事ではポテンシャル $\phi, \mathbb{A}$ を導入した．特に，ローレンツ条件の下でのマクスウェル方程式が
$\displaystyle \qquad \begin{align} &\epsilon \mu \frac{\partial^2 \phi}{\partial t^2} -\Delta \phi = \frac{1}{\epsilon} \rho \\ &\displaystyle \epsilon \mu \frac{\partial^2 \mathbb{A} }{\partial t^2} - \Delta \mathbb{A} = \mu \mathbb{j} \end{align}$
となることが非常に重要である．

次回は特殊相対論を使って考察していくが，マクスウェル方程式に現れる
$\qquad \displaystyle \epsilon \mu \frac{\partial^2}{\partial t^2} -\Delta$
という作用素が特殊相対論の観点から重要になってくる．よく見れば，ローレンツ条件にもこの作用素が現れていることにも注意しておきたい．

続き
tetobourbaki.hatenablog.com

2018-12-03

オイラー・ポアソン方程式とリー・ポアソン構造

可積分数学

（この記事は数理物理 Advent Calendar 2018 - Adventar ４日目の記事です。）

固定点を持つ剛体の運動を表す方程式（つまり，コマの方程式）はオイラー・ポアソン方程式と呼ばれ*1，以下のように書ける.
$\displaystyle \qquad \dot{\Gamma} = \Gamma \times \Omega \\ \qquad \dot{M} = M \times \Omega + \Gamma \times L,$

本記事の目標はこの方程式がラックス形式で書けることを確認することである．それを通して，リー・ポアソン構造の有用さが分かると思う．

この問題に対する私のモチベーションを少し書く．オイラー・ポアソン方程式の可積分性というのは面白い問題であるが，本来，可積分性はシンプレクティック形式から定まるポアソン括弧で書けるハミルトン系に対する概念である．そこで，オイラー・ポアソン方程式が今のべた意味でのハミルトン系で書けるかというのを調べたいのが私のモチベーションである．

準備
オイラー・ポアソン方程式

準備

少し長いので簡単な流れを述べておく．
（１）リー代数 $V$ があるとき， $V^*$ 上の関数にポアソン構造を入れることができる．これにより $V^*$ 上のハミルトン系が定義できる.
（２）リー代数に非退化な対称双線形形式があるとき， $V$ 上の関数にポアソン構造を入れることができる．これにより $V$ 上のハミルトン系ができる．
（３）さらに，双線形形式がアジョイント不変であれば， $V$ 上のハミルトン系はラックス形式で書ける．

ポアソン構造

まずリー代数の定義を復習する．係数体を $\mathbb{R}$ とするベクトル空間 $V$ を考える. このベクトル空間に対し演算 $[\cdot ,\, \cdot] \colon V\times V \to V$ が存在し, 以下の性質を満たす．

（１）双線型である．つまり， $[a v_1+bv_2, w ] = a [ v_1, w ]+ b [v_2, w]$ かつ $[v, aw_1 + bw_2 ]$ $= a[v, w_1 ]+ b[v, w_2]$ ;

（２）反対称である．つまり, $[v, w] = - [w, v]$ ;

（３）ヤコビ恒等式が成り立つ．つまり， $[v_1, [v_2 , v_3 ] ] + [ v_2, [v_3, v_1 ] ] + [ v_3, [v_1 , v_2 ] ] =0$ ．
このとき， $V$ をリー代数という．演算 $[ \cdot, \cdot]$ はリー括弧と呼ばれる．

次に，ポアソン構造を定義する． $\mathrm{C}^{\infty}$ 級の実多様体 $M$ を考える．多様体上の $\mathrm{C}^{\infty}$ 級の関数の集合 $\mathrm{C}^{\infty} (M)$ に対して，演算 $\{ \cdot , \cdot \} \colon \mathrm{C}^{\infty} (M) \times \mathrm{C}^{\infty} (M) \rightarrow \mathrm{C}^{\infty} (M)$ があり, リー括弧の性質（１），（２），（３）に加えて,

（４）ライプニッツ則，つまり， $\{F, GH \} = \{F, G\} H + G \{F, H\}$

を満たすとき， $M$ はポアソン多様体と呼ばれる. 演算 $\{\cdot , \cdot \}$ はポアソン括弧と呼ばれる．
ライプニッツ則は $\{ f, \cdot\}$ ないし $\{ \cdot ,\, f\}$ が微分であることを表す（微分代数の考え方）．

$M$ をポアソン多様体とし，関数 $H \in \mathrm{C}^{\infty} (M)$ を定めると， $X_{H} = \{H , \cdot\}$ は $M$ 上のベクトル場になっている. これをハミルトンベクトル場という. これにより定まる微分方程式
$\displaystyle \qquad \dot{x} = X_H (x)$
をハミルトン系という． $H$ をハミルトン系のハミルトン関数という. 多様体で定義したため若干説明不足な部分があるが $M = \mathbb{R}^n$ のケースだと単に $n$ 次元微分方程式
$\displaystyle \qquad \dot{x_i} = \{H , x_i\}, \quad i = 1,\, \dots n$
である. ハミルトン関数 $H$ のハミルトン系に対して, $F \in \mathrm{C}^{\infty} (M)$ が保存量であることは $\{H, F\} = 0$ と同値である. それは $X_H (F) = \{ H, F\}$ から自明である. 微分形式に慣れていれば，
$\displaystyle \qquad \frac{d}{dt} F(x) = dF (\dot{x}) = dF(X_H) = X_H (F) = \{ H, F\}$
からもよくわかる．
特に，ハミルトン関数自身は常に保存量である．また，ヤコビ恒等式より２つの保存量 $F, G$ に対し， $\{ F, G \}$ も保存量となる．任意の関数 $H \in \mathrm{C}^{\infty} (M)$ に対して $\{H , C\} = 0$ となる関数 $C \in \mathrm{C}^{\infty} (M)$ をカシミール（Casimir）関数という．つまり，カシミール関数はポアソン括弧によりできる任意のハミルトンベクトル場の保存量である．言い換えると，カシミール関数 $C$ に対してハミルトンベクトル場は $X_C = 0$ であるとも言える．

リー・ポアソン構造

リー・ポアソン構造を説明するために，まずリー代数 $V$ の双対空間 $V^*$ にポアソン構造が入ることを見る．まず，わかりやすさのために $v \in V,\, \mu \in V^*$ に対し， $\langle \mu , v\rangle := \mu (v)$ と書くことにする． $V^*$ 上の関数 $F \in \mathrm{C}^{\infty} (V^*)$ に対して， $\nu \in V^*$ での勾配 $D_{\nu}F$ は $V^*$ から $\mathbb{R}$ への線形写像になっているため， $D_{\nu} F\in V^{**}$ であり， $V$ との同一視，つまり，
$\displaystyle \qquad D_{\nu}F (\mu) = \left\langle \mu , \frac{\delta F}{\delta \nu} \right\rangle$
となる元 $\frac{\delta F}{\delta \nu} \in V$ が存在する．ここで， $V^*$ 上のポアソン括弧を
$\displaystyle \qquad \{F , G\} (\mu) = \left\langle \mu , \left[ \frac{\delta F}{\delta \mu}, \frac{\delta G}{\delta \mu} \right] \right\rangle$
と定めることができる. このようにできたポアソン括弧をリー・ポアソン括弧という．

$V$ 上にポアソン構造を定めるためには $V$ の非退化な対称双線形形式 $\eta ( \cdot , \cdot )$ が必要である. $\eta$ があれば, $F \in \mathrm{C}^{\infty} (V), v \in V$ に対して， $D_{v} F \in V^*$ なので
$\displaystyle \qquad \left\langle D_v F, w\right\rangle = \eta(\nabla_v F , w ) ,\quad ^{\forall} w \in V$
となる $\nabla_v F \in V$ が（非退化な条件より）一意に定まる．これにより， $V$ 上にもポアソン構造が
$\displaystyle \qquad \{F, G\} (v) = \eta( v ,\, [ \nabla_v F ,\, \nabla_v G]) \$
で定まる．

ラックス形式

ここで， $\mu$ が特殊な場合にはハミルトン系がいわゆるラックス形式でかけることを見る. ここで仮定するのは $\mu$ のアジョイント不変性, つまり，
$\displaystyle \qquad \eta(v_1 , [v_2 ,\, v_3] ) = \eta ( [v_1 , v_2] ,\, v_3) ,\quad ^{\forall}v_1, v_2 , v_3 \in V$
である．このとき， $V$ 上の関数 $G, H$ と $v \in V$ に対し，
$\displaystyle \qquad \{ H, G \} (v) = \eta(v , [\nabla_v H , \nabla_v G] )\\ \;\;\quad \qquad \qquad = \eta( [v , \nabla_v H ] , \nabla_v G)\\ \;\;\quad \qquad \qquad = \eta( \nabla_v G, [v, \nabla_v H] )\\$
最後に $\nabla_v G$ の定義より，
$\displaystyle \qquad \eta( \nabla_v G , [v, \nabla_v H ]) =\left\langle D_v G, [v, \nabla_v H]\right\rangle$
となる．そのそもハミルトンベクトル場 $X_H$ は任意の関数 $G$ と点 $v\in V$ に対し $X_H (G) (v) = \{H, G\} (v) = \left\langle D_vG , X_H(v) \right\rangle$ となるものだったので， $X_H(v) = [v , \nabla_v H ]$ であることがわかる．よって，ハミルトン系も
$\displaystyle \qquad \frac{dv}{dt} = [v , \nabla_v H ]$
と書ける. これをラックス形式という.

オイラー・ポアソン方程式

以上の準備の下，オイラーポアソン方程式をポアソン構造と見る方法を述べる．まず線形空間 $V = \mathbb{R}^6$ を考え，元を $v = (\Gamma , M)^t \in \mathbb{R}^3 \times \mathbb{R}^3 = V$ と書く． $\Gamma$ と $M$ も縦ベクトルと見たいので，少し書き方が変であるが，伝わると思うので縦ベクトルと横ベクトルの区別はおおらかにする．

リー括弧を $v = (\Gamma , M)^t, \bar{v} = (\bar{\Gamma} , \bar{M})^t$ に対して，
$\displaystyle \qquad [v ,\, \bar{v} ] = (\Gamma \times \bar{\Gamma}, \Gamma \times \bar{M} + M \times \bar{\Gamma} )^t$
で定める．次に非退化な対称双線形形式 $\eta$ を
$\displaystyle \qquad \eta (v, \bar{v}) = \Gamma \cdot \bar{M} + M \cdot \bar{\Gamma}$
と定める． $\eta$ を行列 $N$ で表現すると
$\displaystyle \qquad N = \left(\begin{matrix} 0 & E_3 \\ E_3 & 0 \end{matrix}\right)$
であり（つまり， $\mu(v, \bar{v}) = v^t N \bar{v}$ ）非退化で対称なことがすぐに分かる． $V$ 上の関数を $F$ とし， $F$ に対して $\nabla_v F = (\tilde{\Gamma}, \tilde{M} )^t \in V$ が定まる．計算すると
$\displaystyle \qquad \left\langle D_v F , \bar{v} \right\rangle = \sum_{i=1}^3 \frac{\partial F}{\partial \Gamma_i}(v) \bar{\Gamma_i} + \sum_{i=1}^3 \frac{\partial F}{\partial M_i}(v)\bar{M_i}$
であり，
$\displaystyle \qquad \eta(\nabla_v F , \bar{v}) = \sum_{i=1} \tilde{\Gamma}_i \bar{M}_i + \sum_{i=1}^3 \tilde{M}_i \bar{\Gamma}_i$
なので，任意の $\bar{v}$ で
$\displaystyle \qquad \left\langle D_v F , \bar{v} \right\rangle =\eta(\nabla_v F ,\, \bar{v})$
が成り立つことから，両辺を比較すると,
$\displaystyle \qquad \nabla_v F = \left(\frac{\partial F}{\partial M}(v) , \frac{\partial F}{\partial \Gamma_i}(v) \right)^t$
であることが分かる．具体的には
$\displaystyle \qquad \nabla_v H = (\Omega , L)^t , \quad \nabla_v H_2 = (\Gamma , M)^t ,\quad \nabla_v H_3 = (0 , 2\Gamma)^t$
であることが分かる．

ポアソン括弧からもハミルトンベクトル場を計算できるが，すでにラックス形式で計算できることが分かっているので，
$\displaystyle \qquad \dot{v} = [v, \nabla_v H]\\ \quad \quad \;\,=[ (\Gamma , M)^t , (\Omega , L)^t ] \\ \quad \quad \;\,=( \Gamma \times \Omega , M \times \Omega + \Gamma \times L)^t$
となる．つまり，通常のオイラーポアソン方程式
$\displaystyle \qquad \dot{\Gamma} = \Gamma \times \Omega \\ \qquad \dot{M} = M \times \Omega + \Gamma \times L$

に一致した．

*1:吉田春生先生の用語に従っているが，この方程式をオイラー・ポアソン方程式と呼んでいいものか分からない．

2018-11-03

Kovacicのアルゴリズム

Kovacicのアルゴリズムとは，2階の線形微分方程式を解くアルゴリズムです．もちろん，解けない微分方程式もあるのですが，解ける時は解を求め，解けない時は求まらないことを教えてくれます．このアルゴリズムはMapleやMathematicaでも使われています．

このアルゴリズムについて解説したpdfを書いたのでここにリンクを貼っておきます．現段階では完成しているわけではないですが，アルゴリズムを理解する上で十分なことは書いてあるはずです．

kovacic.pdf - Google ドライブ

2018-10-05

発散級数とBorel-Laplace総和

数学

この記事では，収束するとは限らない級数に関数を対応させる方法である，ボレル変換とラプラス変換を説明します．例として，ときどき紹介される謎の式
$\displaystyle \qquad 1 - 1 + 2 - 6 + 24 - 120 + \dots = 0.59634732...$
についても説明します．

前提知識がある人のために注意しておくと，本記事では原点が特異点の場合を考えている．よって，ラプラス変換の定義や形式ボレル変換は，無限遠点を特異点と考えるときと違う．また，ジュブレー位数が $1$ の場合だけを考えていく．さらに，基本的に角領域が $\arg s = 0$ で二等分されている状況を考える．

収束級数と形式的ベキ級数
形式ボレル変換
漸近展開
オイラー級数
参考文献

収束級数と形式的ベキ級数

収束ベキ級数があったとき，それを関数と同一視してしまいがちであるが，厳密には区別すべきである．収束するとは限らないベキ級数はハットの記号を使って $\hat{f} (z) = \sum_{n=0}^{\infty} a_n z^n$ のように表す．形式ベキ級数の集まりを $\mathbb{C} [ [ z ] ]$ と表す．

形式ボレル変換

さて，収束しないベキ級数があったとき，無理やり係数を小さくして収束級数に変換するのはそれほど不自然ではないだろう．そこで以下の変換を考える．

定義（形式ボレル変換）
形式ベキ級数 $\hat{f} (z) = \sum_{n = 0}^{\infty} a_n z^n$ のボレル変換を
$\displaystyle \qquad \hat{\mathcal{B}} (f) (s) = \sum_{n=0}^{\infty} \frac{a_n}{n!} s^n$
と定義する．

ここで，変換前と変換後が分かりやすいように変数も $z$ から $s$ に変えている．
ボレル変換の逆写像
$\displaystyle \qquad \sum_{n=0}^{\infty} a_n s^n \mapsto \sum_{n=0}^{\infty} n! a_n z^n$
を考えたいが、単に、ボレル変換にこれを作用しても元に戻るだけである。なので、この変換を意味のある別の形にしなければいけない。実はこの変換はラプラス変換である。

定義　（ラプラス変換と逆ラプラス変換）
$g(s)$ のラプラス変換
$\displaystyle \qquad L(g) (z) := \int_0^{\infty} e^{-sz} g(s) ds$

$f(z)$ の逆ラプラス変換
$\displaystyle L^{-1} (f) (s) := \int_{C} e^{zs} f(z) d z$
（積分路の詳細は省略）

ベキ関数のラプラス変換を考えよう．

命題
$\displaystyle \qquad L(s^n) (z) = \int_0^{\infty} e^{-sz} s^n ds = \frac{n!}{z^{n+1}}$
特に，適当な仮定の下
$\displaystyle \qquad L \left( \sum_{n=0}^{\infty} a_n s^n \right) (s) = \sum_{n=0}^{\infty} n! a_n \frac{1}{z^{n+1}}$

（証明）数学的帰納法で示す． $n = 0$ のとき、
$\displaystyle \qquad \int_0^{\infty} e^{-sz} ds = \left[ - \frac{e^{-sz}}{z} \right]_0^{\infty} = \frac{1}{z}$
であり， $n=k-1$ で成り立つとすれば，
$\displaystyle \qquad \int_0^{\infty} e^{-sz} s^k ds = \left[ - \frac{e^{-sz}}{z} s^k \right]_0^{\infty} + \frac{k}{z} \int_0^{\infty} e^{-sz} s^{k-1} ds\\ \displaystyle \qquad \qquad \qquad \quad = \frac{k}{z} \frac{(k-1)!}{z^{k}}\\ \displaystyle \qquad \qquad \qquad \quad = \frac{k!}{z^{k+1}}$
となるので，数学的帰納法により成立． $\square$

この命題で残念なところが二つあります．まず，ラプラス変換後は $z$ の多項式ではなく， $1/z$ の多項式になっている．また， $n!$ がかかる項が $1/z^{n+1}$ の係数なので、一つ期待とはずれています．そこでうまくいくようにラプラス変換を少し変えましょう．

定義
$g(s)$ に対して
$\displaystyle \qquad \mathcal{L} (g) (z) = z^{-1} \int_0^{\infty} \exp \left(-\frac{s}{z} \right) g(s) ds$
と定める．以下では $\mathcal{L} (g)$ も $g$ のラプラス変換という*1．

命題
$\displaystyle \qquad \mathcal{L} (s^n) (z) = z^{-1} \int_0^{\infty} \exp \left(-\frac{s}{z} \right) s^n ds = n! z^n$
特に，適当な仮定の下，
$\displaystyle \qquad L \left( \sum_{n=0}^{\infty} a_n s^n \right) (s) = \sum_{n=0}^{\infty} n! a_n z^n$

証明は普通のラプラス変換と同じである．

さて，積分
$\displaystyle \qquad \int_0^{\infty} \exp \left( -\frac{s}{z} \right) g(s) ds$
は $|g(s)| \leq e^{c |s|}$ と指数的に抑えられるとすると，
$\displaystyle \qquad \left| \int_0^{\infty} \exp \left(-\frac{s}{z} \right) g(s) ds \right| \leq \int_0^{\infty} \exp \left(-\mathrm{Re} \left( \frac{s}{z} \right) \right) |g(s)| ds \leq \int_0^{\infty} \exp \left( - \frac{s}{|z|} \cos ( \arg z ) + c s \right) ds$
より，
$\displaystyle \qquad \cos (\arg z) > c |z|$
となる $z$ では積分が収束する．よって，特に， $- \frac{\pi}{2} < \arg z < \frac{\pi}{2}$ かつ十分絶対値が小さい $z$ で $f(z) = \mathcal{L} (f) (z)$ はちゃんと定義される．

これが非常に面白いことになっていることに気づいてください．形式ボレル変換にその逆変換を行ったら元に戻って何も変わらないはずです．しかし，ラプラス変換は関数から（定義域が全体とは限らない）関数への写像となっています．特に，もともと形式ベキ級数で関数が定まらないものであっても，ラプラス変換で戻した時はあくまで $- \frac{\pi}{2} < \arg z < \frac{\pi}{2}$ と定義域を制限しているため矛盾は起こっていないのです．

さて，本当にもとの関数に戻るのでしょうか？厳密にいうともとは形式ベキ級数 $\hat{f}$ であり，ボレル変換とラプラス変換後の $f$ は関数なので比較しようがありません．そこで，べき級数と関数を比較する方法を考えましょう．

漸近展開

まず角領域を定義する．

（定義）
実数 $\theta_1 < \theta_2$ に対して，
$\displaystyle \qquad S(\theta_1, \theta_2) := \{z \mid \theta_1 < \arg z < \theta_2 \}$
とする．

複素平面では $\arg z = \arg (z + 2\pi)$ なので， $\theta_2 - \theta_1 > 2\pi$ のときに $S(\theta_1, \theta_2)$ が意味がないように思うかもしれないがそうではない．曖昧に書いてしまったが，例えば $\log z$ のような多価関数は $\arg z' = \arg z + 2 \pi$ のとき $\log z' = \log z + 2 \pi i$ となる．このように，多価関数を1価関数と見るために， $0$ の角度と $2\pi$ の角度を区別する必要がある．（曖昧な書き方だが分かる人には分かるだろうから細部にこだわらない．）

また， $r > 0$ に対して， $S(\theta_1, \theta_2, r) = S(\theta_1, \theta_2) \cap \{ z \mid | z | < r \}$ とおく． $S(\theta_1, \theta_2)$ や $S(\theta_1, \theta_2, r)$ を開角領域という．また，開各領域の閉包から原点を除いたものを閉角領域という．また， $\theta_2 - \theta_1$ を角領域の角度と呼ぶことにする．

（定義）
開角領域 $S$ と $S$ で解析的な関数 $f$ を考える．
$f$ が形式ベキ級数 $\hat{f} (z)= \sum_{n=0}^{\infty} a_n z^n$ に位数 $1$ で漸近的に等しい，あるいは， $\hat{f}$ に位数 $1$ で漸近展開可能であるとは， $S$ に含まれる任意の閉角領域 $S_1$ に対して，ある定数 $C,K>0$ が存在し，任意の自然数 $N$ と $z \in S_1$ に対して，
$\displaystyle \qquad \left| f(z) - \sum_{n=0}^{N-1} a_n z^n \right| \leq C K^N N! |z|^N$
が成り立つことをいう．

位数 $1$ である $\hat{f}$ に漸近展開可能な $f$ のなす集合を $\mathcal{A}_1 (S)$ と表す．

簡単に意味を説明すると，漸近展開可能であるとは，形式ベキ級数を有限項で打ち切るとそれは関数になるが，それとの差が（打ち切った次数以上の位数の）多項式で抑えられることを意味する．ただし，この誤差の項の係数の $N$ に関する依存性に制限を設けている．

ここで， $f\in \mathcal{A}_1 (S)$ に対して，ある形式ベキ級数 $\hat{f} \in \mathbb{C} [ [z ] ]$ が定まるのでそれを $Jf$ と表すことにする．このときの $Jf$ の性質を考えてみよう．

$Jf (z) = \sum_{n =0}^{\infty} a_n z^n$ としたとき，
$\displaystyle \qquad |a_N| = |a_N z^N| \cdot \frac{1}{|z|^N}$
$\displaystyle \qquad \qquad= \left|\sum_{n=0}^N a_n z^n - \sum_{n=0}^{N-1} a_n z^n \right| \cdot \frac{1}{|z|^N}$
$\displaystyle \qquad \qquad \leq \left|f(z) - \sum_{n=0}^N a_n z^N \right| \cdot \frac{1}{|z|^N} + \left| f(z) - \sum_{n=0}^{N-1} a_n z^n \right| \cdot \frac{1}{|z|^N}$
$\displaystyle \qquad \qquad = C K^{N+1} (N+1)! |z| + C K^N N!$

よって，十分原点に近い $z$ を考えることで，
$\displaystyle \qquad |a_N| \leq C K^N N!$
が成り立つことが分かる．このような級数に名前をつけておこう．

（定義）
形式ベキ級数 $\hat{f} = \sum_{n=0}^{\infty} a_n z^n$ がジュブレー位数 $1$ であるとは，
定数 $C,K>0$ が存在して，
$\displaystyle \qquad |a_N| \leq C K^N N!$
が成り立つことをいう．
ジュブレー位数 $1$ の形式ベキ級数のなす集合を $\mathbb{C} [ [ z ] ]_1$ と表す．

以上の考察により，漸近展開可能な関数からジュブレー位数 $1$ の形式ベキ級数への関数 $J \colon \mathcal{A}_1 (S) \to \mathbb{C} [ [z ] ]_1$ が定まったことになる．

証明は省略するが，この写像 $J$ には様々な綺麗な定理が成り立つのでそれを紹介する．まずはRittの定理と呼ばれるもののジュブレー位数 $1$ のときのバージョン．

（定理）

角領域の角度が $\pi$ 以下ならば， $J \colon \mathcal{A}_1 (S) \to \mathbb{C} [ [z ] ]_1$ は全射である．つまり，ジュブレー位数 $1$ の形式ベキ級数 $\hat{f}$ に対して， $S$ で解析的な関数 $f$ が存在し， $f$ は $\hat{f}$ に位数 $1$ で漸近展開可能である．

この定理の証明には，形式ボレル変換とラプラス変換を用いる．ただし，本記事ではラプラス変換の積分路を $\arg z = 0$ に沿ったものにしていたがそれを変更する必要があり，また，有限の点までの積分に修正する必要がある．

元のモチベーションに戻ると，この定理は角領域をある程度小さくすることで（ジュブレー位数 $1$ の）形式ベキ級数はそれと漸近的に近いある解析関数を必ず得ることを主張している．しかし，残念ながら一意性は必ず成り立たない．なぜなら， $e^{-z}$ が $S (-\pi, \pi)$ において（形式ベキ級数の） $0 \in \mathbb{C} [ [z ] ]_1$ に漸近展開可能なので，この分の誤差をいつでも入れることができるからである．

一意性を得るためには角領域を大きくする必要がある．

（定理）

角領域 $S$ の角度が $\pi$ より大きいならば， $J \colon \mathcal{A}_1 (S) \to \mathbb{C} [ [z ] ]_1$ は単射である．つまり，任意のジュブレー位数 $1$ の形式ベキ級数 $\hat{f}$ に対して， $\hat{f}$ に位数 $1$ で漸近展開可能な関数 $f\in \mathcal{A}_1 (S)$ は一意である．

証明にはやはりBorel変換とLaplace変換を用いる．

ジュブレー位数 $1$ の形式ベキ級数 $\hat{f}$ は小さな角領域では漸近的に等しい解析関数を持つ．角領域を大きくすることで，この関数が一意である，つまり，形式ベキ級数に対し，関数が一つになる条件を考えたい．実はこれは簡単で，まず， $\hat{f}$ をボレル変換し $\mathcal{B}(\hat{f})$ が（ある方向に）Laplace変換できることが必要である．さらに，少し積分路の角度を少しを変えてもラプラス変換が可能なら，それは大きな角領域で漸近展開可能な解析関数を得たことになる．つまり，一意に関数が定まる．

最後に，以上のことを具体例で見ていこう．

オイラー 級数

オイラー級数
$\displaystyle \qquad \hat{\phi} (z) = \sum_{n=0}^{\infty} (-1)^n n! z^n = 1 - z + 2 z^2 - 6 z^3 + \dots$
を考えよう．これは明らかに発散級数である．これを形式ボレル変換すると，
$\displaystyle \qquad \hat{\mathcal{B}} (\hat{\phi}) (s) = \sum_{n=0}^{\infty} (-1)^n s^n = \frac{1}{s+1}$
となり， $s = -1$ に特異点を持つ簡単な有理関数になる．これはラプラス変換可能なので実行すると，
$\displaystyle \qquad \phi(z) := \mathcal{L} (\hat{\mathcal{B}}(\hat{\phi})) (z) = z^{-1} \int_0^{\infty} \frac{e^{-z/s}}{s+1} ds$
と $\hat{\phi}$ を漸近展開に持つ関数 $\phi$ を得る． $\phi$ は積分が計算できず初等関数で書くことができない．
ラプラス変換の積分路は $\arg s = 0$ としたが，特異点は $s = -1$ なので $\arg s = -1$ を除く任意の方向にラプラス変換できる．よって，この漸近展開は広い角領域で成り立つ．つまり， $\hat{\phi}$ は $\phi$ に一意に漸近展開可能である．

さて，この意味で形式ベキ級数 $\hat{\phi}$ に対して関数 $\phi$ が一意に定まるが，これに $z = 1$ を代入することで
$\qquad 1 - 1 + 2 - 6 + \dots + (-1)^n n! + \dots$
は
$\displaystyle \qquad \int_0^{\infty} \frac{e^{-s}}{s+1} ds = 0.59634732...$
に等しいと書いてあることがある．もちろんナイーブには正しくないが，ある意味でこの発散級数にこの数字を対応させるのにはある程度の正当性がある．

参考文献

基本的には
Balser, "From Divergent Power Series to Analytic Functions"
を参考にした．
複素領域の常微分方程式を扱った本にはほぼ必ず漸近展開を書いている．
他には
Sauzin, "Introduction to 1-summability and resurgence"
が分かりやすく最新の結果も書かれていてオススメである．（arXivにもある．）

*1:この $\mathcal{L}$ をラプラス変換というのが嫌ならば， $\hat{\mathcal{B}}$ の方を変更する流儀もある

2018-09-12

フィルターの収束の意味

以前、位相空間におけるフィルターの収束やそれを一般化した収束空間についていくつかの記事を書きました．フィルターの収束は位相空間論で非常に便利な道具ですが，そのイメージが湧きにくいことから，フィルターを使った議論を毛嫌いする人が多いと感じます．そこで，今回はフィルターの収束が非常に直感的で簡単であることを説明します．

フィルターの収束は集合の収束
位相空間における収束空間の役割
数列とフィルターの違い

フィルターの収束は集合の収束

実数直線 $\mathbb{R}$ を考えましょう． $\mathbb{R}$ の部分集合の集まりがある点に収束するとはどういうことかを考えます．

例として，部分集合の集まり $\mathcal{B} = \{ [ -1/n, 1/n ] \mid n \in \mathbb{N} \}$ を考えましょう．これはなんとなく $0$ に収束していると見ることが出来そうです．その定式化は色々あるかもしれませんが，ひとまず次のように定義するといいでしょう．

定義１（集合族の収束）

位相空間 $X$ とその部分集合の族 $\mathcal{B}$ に対して， $\mathcal{B}$ が $a \in X$ に収束するとは，
$a$ の任意の近傍 $V \in \mathcal{V} (a)$ に対して，ある集合 $A \in \mathcal{B}$ が存在して， $A \subset V$ が成り立つことを言う．

イプシロン-デルタ論法の類似なので，イメージしやすいと思います．

さて，数列には点の順番がありますが，集合族には集合間に順番はありません．なので，単に一般に集合族を考えても数列と同じ意味合いを持たせることができません．そこで，以下の性質を満たす集合族を考えます:
$\quad A, B \in \mathcal{B}$ ならば $A\cap B \in \mathcal{B}$
つまり，集合族から二つの集合をとってきたとき，その二つより小さいものも集合族に入っているということです．数列のように一列になっているわけではありませんが，二つの集合をとってきたときそれより小さいものをとることができると言う意味で，小さい集合を生成していけると言うイメージで順番が定まっている感じです．このような集合族をフィルター基と言います．

定義２（フィルター基）

集合 $X$ のその集合族 $\mathcal{B}$ がフィルター基であるとは，
$\quad A, B \in \mathcal{B}$ ならば $A\cap B \in \mathcal{B}$
が成り立つことを言う．

さて，集合族の収束はその定義を見れば分かるように小さい集合のみが本質的です．なので，大きい集合を加えても収束は変わらないことが分かります．

例えば， $\mathcal{B} = \{ [ -1/n, 1/n ] \mid n \in \mathbb{N} \}$ に $[-2, 2]$ を加えて， $\mathcal{B}' = \mathcal{B} \cup [-2.2]$ を考えても， $\mathcal{B}$ も $\mathcal{B}'$ も $0$ のみに収束します．

そこで，加えても問題ない集合を全部加えてしまう操作を考えます．

定義３（生成されたフィルター）

集合 $X$ とその集合族 $\mathcal{B}$ に対して，
$\quad [ \mathcal{B} ] := \{ B \in \mathcal{B} \mid A \subset B$ となる $A \in \mathcal{B}$ が存在する $]$
と定める．特に， $\mathcal{B}$ がフィルター基のとき， $[ \mathcal{B} ]$ を $\mathcal{B}$ で生成されたフィルターという．

命題４

位相空間 $X$ とその集合族 $\mathcal{B}$ に対して， $\mathcal{B}$ が $a$ に収束することと $[\mathcal{B} ]$ が $a$ に収束することが同値．

フィルター基で生成されたフィルターはいくつかの性質を満たすことと同値であり，それを満たす集合族をフィルターと言います．

定義５（フィルター）

集合 $X$ の集合族 $\mathcal{F}$ が フィルターであるとは，以下を満たすことを言う:

(a) $A \in \mathcal{F}$ かつ $A \subset B$ ならば $B \in \mathcal{F}$ ;
(b) $A, B \in \mathcal{F}$ ならば $A \cap B \in \mathcal{F}$ ．

近傍系 $\mathcal{V} (a)$ もフィルターです．わざわざフィルターを導入した理由は以下の性質が成り立つからです．

命題６

位相空間 $X$ とフィルター $\mathcal{F}$ に対して， $\mathcal{F}$ が $a$ に収束することと $\mathcal{V} (a) \subset \mathcal{F}$ が同値．特に，フィルター基 $\mathcal{B}$ が $a$ に収束することと $\mathcal{V} (a) \subset [ \mathcal{B} ]$ が同値．

このように，収束が単に包含関係で表せることは，様々な議論を簡潔で明快なものとしてくれます．

位相空間における収束空間の役割

距離空間では様々な事実を数列で表すことが出来るのでした．

命題７

距離空間 $X$ に対して以下が成り立つ:

(a) 部分集合 $A$ が閉集合であることは， $A$ 上の数列 $\{a_n \}$ が $a \in X$ に収束するなら $a \in A$ となることと同値;

(b) 部分集合 $A$ が開集合であることは，任意の $a \in A$ に対して数列 $\{a_n \}$ が $a \in A$ に収束するならある $N$ が存在して $n \geq N$ に対して $a_n \in A$ となることと同値;

これは一般の位相空間では成り立つとは限りません．しかしフィルターを使えば類似の性質で表現することができます．

命題８

位相空間 $X$ に対して以下が成り立つ:

(a) 部分集合 $A$ が閉集合であることは，フィルター $\mathcal{F}$ で $A \in \mathcal{F}$ となるものが $a \in X$ に収束するなら $a \in A$ となることと同値;

(b) 部分集合 $A$ が開集合であることは，任意の $a \in A$ に対してフィルター $\mathcal{F}$ が $a \in A$ に収束するならある $A \in \mathcal{F}$ となることと同値;

このように，フィルターを使えば，距離空間でできたことを位相空間でも同様に議論することができます．詳しくは以下の記事を見てください．

tetobourbaki.hatenablog.com

数列とフィルターの違い

数列の代わりとしてフィルターを導入しましたが，数列とフィルターはかなり違うものです．

よく言われる違いの一つとしては，数列は可算性に基づいていることです．数列とは自然数を定義域とする写像と見ることができます．そのため，数列で定義できる概念は可算性が密接に関係します．位相空間論を勉強していると，位相空間における閉集合やコンパクト性が数列で定義できるための条件として可算条件が必要となりますが，それは自然なことです．フィルターはその可算条件とは関係なく一般的に閉集合やコンパクト性を特徴付けることができる利点があり，それが数列との大きな違いです．

もう一つの違いとして，これは個人的に感じていることでありまだ正確に言語化できないのですが，数列の収束とフィルターの収束では"どのような順序概念に基づいて収束するか"が本質的に違うということが挙げられます．これはいくつかの結果から感じることなのですが，その一例として部分列の概念をあげましょう．

数列 $\{a_n \}$ の部分列 $\{b_n \}$ とは，狭義単調増加列 $i \colon \mathbb{N} \to \mathbb{N}$ が存在して， $b_n = a_{i(n)}$ と書けることでした．そのフィルターでの類似は単に自分より細かいフィルターです: つまり，フィルター $\mathcal{G}$ がフィルター $\mathcal{F}$ の部分フィルターであるとは， $\mathcal{F} \subset \mathcal{G}$ となることです．直感的には"部分列をとる"操作をフィルターで言い換えると"より細かいフィルターをとる"ことと言い換えることができます．すると，様々な点で数列で言えたこととフィルターで言えることに対応が付きます．対応がつくという意味ではこれでいいのですが，フィルターには数列と同じように自然数上の順序に基づいたものではないので，微妙に順序の情報が落ちてしまいます．部分フィルターの概念を数列で再び言い換えるなら，"数列 $\{a_n \}$ の部分列 $\{b_n \}$ とは，広義単調増加列 $i \colon \mathbb{N} \to \mathbb{N}$ が存在して， $b_n = a_{i(n)}$ と書ける"という定義と整合性があります．集合の集積点と数列の集積点が微妙に違うのもフィルターと数列のこのような差と関係したものだと考えています．

よって，可算性だけで数列とフィルターが一致するわけではありません．また，フィルターは数列の一般化というわけではなく微妙に違うものです．現状の僕の理解をまとめると以下のようになります．

フィルターの収束と数列の収束は全く別の概念である

位相空間ではフィルターの収束で様々な概念を定義したり議論したりすることができる．

距離空間では"たまたま"数列の収束でも概念を定義したり議論したりすることができる．

記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

理想的な物理理論としての電磁気学(3)

連続系のラグランジュ形式

ローレンツ共変な場の理論

ラグランジュ形式によるマクスウェル方程式

理想的な物理理論としての電磁気学(2)

ローレンツ変換

テンソル

ローレンツ共変性

共変形式のマクスウェル方程式

理想的な物理理論としての電磁気学(1)

マクスウェル方程式

ポテンシャル

ゲージ変換

ポテンシャルを用いたマクスウェル方程式

ローレンツゲージ

クーロンゲージ

最後に

オイラー・ポアソン方程式とリー・ポアソン構造

準備

ポアソン構造

リー・ポアソン構造

ラックス形式

オイラー・ポアソン方程式

Kovacicのアルゴリズム

発散級数とBorel-Laplace総和

収束級数と形式的ベキ級数

形式ボレル変換

漸近展開

オイラー 級数

参考文献

フィルターの収束の意味

フィルターの収束は集合の収束

位相空間における収束空間の役割

数列とフィルターの違い