記号の世界ゟ

このブログでは, 数学書などの書評を書きます。また、受験などの勉強法をまとめます。

AならばBの論理は論理的に難しいのか?


「AならばB」という論理は高校数学で学びますが、具体的な内容になると「BならばA」との混同や対偶との同値性が分からないなど、けっこう難しいものです。
今回は、「AならばB」に関する心理学の話題を紹介します。


数学教育に興味がある人にはぜひ読んでほしいです。


途中で紹介している結果は『進化心理学を学びたいあなたへ』3.2節で論文が引用されているので、気になった方は確認してください。

ウェイソンの選択問題


さっそくですが、ウェイソンの選択課題と呼ばれる以下の問題を考えてみてください。

問題A
カードがあり、片面にアルファベット、片面に数字が書いてるとする。
 ルール: 片面に母音が書かれているならば、もう片面の数字は偶数である
このルールが成り立っているかどうかを確認するには、以下のカードのうちどのカードの裏面を見る必要があるか?
f:id:tetobourbaki:20210220173836j:plain

下に正解を書くので考えてみてください。













正解は
「A」「1」です。
「A」「6」だと思った方も多いと思いますが、これは間違いです。
この正誤に関する解説は、調べれば出るのでここでは説明しません。


実験によると、この問いはだいたい10%程度しか正解する人がいないということが明らかにされています。
これを聞くと、「AならばB」の推論は人間には難しいものであると思われるかもしれません。
しかし、事情はもう少し複雑なのです。

主題内容効果


同じ形式の問題を、2つ連続してお見せします。考えてみてください。
(同じ形式にするため、無理やりカードで問題を作っています。)

問題B
カードがあり、片面にお酒を飲むかどうか、片面に年齢が書いてるとする。
 ルール: お酒を飲むならば、成人でなければいけない
このルールが成り立っているかどうかを確認するには、以下のカードのうちどのカードの裏面を見る必要があるか?
f:id:tetobourbaki:20210220173844j:plain


問題B
カードがあり、噛まれた犬の種類、片面に狂犬病ワクチンをうつかどうかを書いてるとする。
 ルール: 野犬に噛まれたら、ワクチンをうたなければいけない
このルールが成り立っているかどうかを確認するには、以下のカードのうちどのカードの裏面を見る必要があるか?
f:id:tetobourbaki:20210220173915j:plain


問題Bと問題Cは、問題Aと同じ位置のカードが正解のカードです。


問題Aに比べて、問題Bや問題Cの方が分かりやすかったのではないでしょうか?
(問題Aの後なので、分かりやすいのは当たり前ですが、もう一度見返して読み返しても、問題Aより問題Bや問題Cが分かりやすいと感じる方が多いと思います。)


「身近な題材の場合、正答率が上がる」という効果を「主題内容効果」と呼びます。
主題内容効果が生じるとき、正答率は50%~80%になると言われています。
これは、分かりやすさを説明する一つの仮説ですが、身近な話題にも関わらず、正答率が上がらないことがあることも知られています。


今回は別の理由を説明します。

「社会契約」と「予防措置」


問題Bのように、「もし利益を得るならば、そのための必要条件を満たしていなければいけない」という形のルールを「社会契約」と呼びます。
社会契約の選択問題を解くことは、「ルールが破られることを見抜く」=「裏切り者を検知するアルゴリズム」に対応するため、正答率が上がるという仮説があります。
実験により、たしかに社会契約問題は正答率が上がりますが、そうでない問題でも正答率が上がることも知られていました。


問題Cのように、「もし危険が迫ったら、身を守る行動をとらなければいけない」という形のルールを「予防措置」といいます。
予防措置の選択問題を解くことは、身の危険を守ることを意味するため、正答率が上がるという仮説があります。


この社会契約と予防措置が選択問題の正答率が上がる基本的な理由であるという研究があります。
この二つは、恣意的な分類ではありません。


まず、社会契約と予防措置では問題を解くときに働く脳の部位が違うことが知られています。


次に、社会契約が裏切り者を見破る能力に対応し、予防措置が危険予知能力に対応するならば、人の性格によって正答率も変わりそうです。
実際、6因子モデル(HEXACO)による性格分類によって、社会契約と予防措置のルールを違反する傾向の個人差を予測できるそうです。


このように、「AならばB」の推論であっても、その問いの形式によって脳の働き方が違うことが明らかになっているのです。

まとめ


社会契約と予防措置というのは、人間が生き残るうえで有利な思考だからこそ、進化の過程で身についた本能的なものだと考えられています。
よって、「AならばB」の論理であっても、後天的に身につく論理的なものとして捉えては、あまりにも見落としが大きいと思います。
例えば、数学教育でこの視点は大事だと思っています。


今回は、社会契約と予防措置の観点での説明をしました。
心理学の実験として正当なものかどうかを考えるには、もっと細かい表現の問題、例えばルールに「must」が使われているかなど注意しなければいけません。
認知バイアス』という本では、確証バイアスの観点で説明しているので興味があれば読んでみてください。


また、最近のコロナで言えば、「飲食店は20時までしか営業できない」というルールから、「20時前なら飲食店に行っても安全」のように解釈してしまう人がいるようですが、これは社会契約の認知に関する一つの研究になる気がします。

参考文献

進化心理学を学びたいあなたへ』東京大学出版
鈴木宏昭『認知バイアス』Blue Backs

『TIS-100』オリジナルプログラム言語によるパズル

これは以下のアドカレ12/15用の記事です。

adventar.org

今回は『TIS-100』を紹介します。
このゲームはオリジナルプログラミング言語で問題を解くゲームです。
store.steampowered.com

問題例を貼っておきます。
左の数列が上から流れて来るので、ノードで加工しながら下のノードに数列を返します。
この問題の場合は、数字をそれぞれ二倍したものを返すことが出来れば成功です。
f:id:tetobourbaki:20201215195921p:plain

ここで使われるオリジナル言語の仕様を簡単に言えば、「ノードベースのアセンブラ」です。
これが良くできていて、以下の点が特に面白いところです。

  • 一つのノードは、「コードを記述するスペース」と「データを受け渡す経路」の二つの役割がある
  • データは隣接するノードにしか送受信できない(ランダムアクセスメモリがない)
  • ノードに書けるコード量が決まっている


普通の言語にある機能が全然ないので、一から自力で考える必要があるのがこのゲームの面白いところです。
一見むずかしそうに見えますが、実際に難しくて、簡単そうな問題を一問解くのに数時間使ったりします。
逆に言えば、プログラミングの常識が通用しないので、最初のルールさえ覚えてしまえば誰でも楽しめます。


最初は、アルゴリズムをデータを受け渡すという仕組みで実現するところで引っかかると思います。
最後の方になると、一つのノードに書けるノード量の限界で困るようになります。


クリアした結果はランキングが出るのも面白いところです。
使ったノード数や処理実行回数などいろんな指標でランキングが付くので、やり込み要素も豊富です。
f:id:tetobourbaki:20201215200416p:plain


最後に、このゲームにはストーリーがあるのですが、これがどこで判明するのか全然わかりませんでした。
各問題に使えないノードがあるのですが、ここのDEBUGボタンを押すと、変な文字列が表示されます。
実は、問題を解いていくとこの文字列が正しい文章に修正されていきます。
f:id:tetobourbaki:20201215200829p:plain

『SOFT SKILLS ソフトウェア開発者の人生マニュアル』備忘録

『SOFT SKILLS ソフトウェア開発者の人生マニュアル』はすごくいい本なのですが、久しぶりに読み直すと忘れてしまってる内容が多いです。
分量も多いので、特に読み返したい章をメモっておきます。
「ソフトウェア開発者」をターゲットにした本ではあるものの、独立や自分の売り出し方も詳しく書かれているため、イラストや学術系の「クリエイター」も得るところが多い本だと思います。
興味がある人は是非読んでください。


以下、「当たり前だけど忘れがち」「言われるまで気が付かなかった納得できる」事柄が書かれている章のまとめ。
(逆に、自分的には当たり前で身についているものはスキップします。)

第一部 キャリアを築こう

  • 4章 社交術:考えている以上のものが必要だ
  • 6章 雇用形態:三つの選択肢を理解する
  • 7章 あなたはどのタイプのソフトウェア開発者か
  • 11章 自由を得る:仕事の辞め方
  • 18章 テクノロジーに対して頑なな態度を取るな

第二部 自分を売り込め!

  • 19章 コードモンキーのためのマーケティング基礎講座
  • 20章 自分だと気づいてもらえるブランドを確立しよう
  • 22章 最大の目標:他人のために価値を生み出せ!

第三部 学ぶことを学ぼう

  • 31章 メンターを探す:あなたのヨーダを見つける
  • 35章 知識の中の隙間を見つける

第四部 生産力を高めよう

第五部 お金に強くなろう

  • 49章 給料をどのように運用するか

第七部 負けない心を鍛えよう

  • 68章 恋愛と人間関係:コンピュータはあなたの手を握れない

解けるの三様~可積分系を学ぶ際の注意点~

数学において、「~は解ける」「~は解けないと証明されている」などと気軽に言われます。例えば、「三体問題は解けないと証明されている」などです。しかし、「解ける」はいろんな意味で使われることが多く、定義を確認しておかないと、ほぼ情報のない文章になりがちです。

今回は可積分系の分野での「解ける」についてまとめます。根拠がある話ではなく、単に自分の感覚に基づいた説明なので、勉強や研究で使う際には鵜呑みにせず自分なりに考えながら参考にしてください。違和感を感じた場合、逆に、この分類にない考え方を発明してみていただけると面白いかと思います。

「解ける」の三様

今回は微分方程式を扱います。(広い意味での)可積分系あるいは力学系の文脈において、「解ける」は以下の三つのうちいずれかを意味していることが多いです。

(I) 微分方程式自体がいい構造を持つ
(対称性、ラックス形式など)
(II) 解自体がいい性質を持つ
(運動が単純、パンルヴェ性を持つなど)
(III) 解の形が陽に書ける
(初等関数で書けるなど)

可積分系とはこの三つの意味の関係性を調べる分野と捉えてもいいと思います。また、これら三つを混同すると、定理を間違えて解釈してしまうことがあります。これらについて、一つずつ説明していきます。注意として、(I) (II) (III)についても、それぞれで具体的に何を意味するかは状況に応じて定義が必要であることを覚えておいてください。(I) (II) (III)は考え方の分類なのです。

(I) 微分方程式自体がいい構造を持つ

強烈にいい構造を持つ微分方程式は「解ける」と言うことがあります。現在の可積分系の分野は主にここに属していると言っていいでしょう。例えば、「解ける」方程式は背後にある構造を使うことで、線形の方程式に帰着できることが多いです。『可積分系の数理』の中では、中村先生が可積分系の本質を「ビルトインされた線形性」と呼んでいます。詳しく知りたい人にはこの本がオススメです。

具体例として、ハミルトン系の完全可積分性を挙げましょう。ハミルトニアン  H を持つ自由度  m のハミルトン系が完全可積分であるとは、 H を含めた  m 個の関数の組  H_1 (= H), H_2, \dots, H_m が存在して、それぞれがポアソン可換、つまり、 \{ H_i, H_j \} = 0 が成り立つことを言います。 ざっくり言えば、十分な個数のハミルトン系による対称性を持つ、ということができます。

「三体問題が解けない」というポアンカレの証明は、この意味での解けないです。(しかも、細かく言えば、  H_1, H_2, \dots, H_m にもかなり特殊な仮定をおいたものであり、けっこうややこしい。)つまり、「対称性が十分にない」ということを証明しただけであり、「解が複雑」とか「解が書けない」ことを証明したわけではありません。ここを勘違いしている人が多いのですが、まさに三様の混同が原因なんだと思います。残りの概念も見てみましょう。

(II) 解自体がいい性質を持つ

具体例として「解が単純」であることを「解ける」と言うことがあります。逆に、「解が複雑である(カオス)」ことを「解けない」と言うことがある、の方がピンとくるのではないでしょうか?カオスも様々な定義があることに注意してください。

力学系におけるLiouville-Arnoldの定理は、(I)の意味で「解ける」なら(II)の意味で「可積分」であることを主張するものだと捉えることができます。Liouville-Arnoldの定理は、ざっくり言うと、完全可積分なハミルトン系は、トーラス上の線形運動に帰着される、という定理です。線形運動は非常に単純なので(II)の意味で解けることを意味します。(とはいえ、異なるトーラスとの関係は自明ではなく、運動の考察が終わるわけではない。)

三体問題で言えば、(I)の意味で解けないことの証明がされていますが、Liouville-Arnoldの定理を用いても(II)の意味で解けないこと、つまり、解が簡単ではないことを意味するわけではないことに注意してください。しかし、Liouville-Arnoldの定理の対偶を用いれば、解が複雑(カオス)であれば(I)の意味で解けないことが導かれることになります。このように、(I)と(II)の関係だけでもけっこう面白いことが言えるのです。

パンルヴェ方程式の解がパンルヴェ性を持つ」も(I)と(II)の関係を主張するものだと思えます。パンルヴェ方程式について詳しく説明しません。一から勉強するなら岡本和夫『パンルヴェ方程式』がオススメです。他にも新しい本があるのですが、問題意識とか考え方が納得できるように書かれた本は岡本先生の本を除いてないと感じています。(今後に期待!)

(III) 解の形が陽に書ける

たとえば、 \int e^{-x^2} dx は初等関数で書けない、というのは有名だと思います。(この事実については過去の記事で何度も触れています。)このように、解自体が知っている関数で書けるときに、「解ける」と表現することがあります。解の存在定理により、(普通の)微分方程式は局所的には解が存在します。しかも、局所的には微分方程式は線形方程式に帰着することもできます(flow box theorem)。なので、解が「どのような形で書けるか」が常に重要な問題となります。しかし、初等関数や既知関数はかなり人間の捉え方に依存しており、数学として綺麗ではなく、あまり発展していない分野だと思います。

とはいえ、(I)と(III)の関係を研究する分野として「微分ガロア理論」が存在します。微分ガロア群は微分方程式の対称性を表すものであり、(I)に位置するものだと言えます。線形微分ガロア理論の有名な定理として、微分ガロア群(の単位成分)が可換なら、解は初等関数で書ける、という定理があります。つまり、(I)ならば(III)を表す定理です。この定理を応用することで、「 \int e^{-x^2} dx は初等関数で書けない」も証明できます。(実は微分ガロア理論を使わない証明の方が普通。)

最後に

この記事の目的は、「解ける」にまつわる勘違いの原因を解明し、今後間違えないように分かりやすい視点を提供することでした。また、上の説明を読むだけでも、さまざまな数学の研究が(I)(II)(III)の関係を調べているものであることも知ることができるでしょう。今回の捉え方で理解できる他の具体例があればぜひ教えておしいです(できればTwitterで)。また、読者の誰かが(I)(II)(III)の新たな関係を発見し、新たな結果を出していただけると嬉しいです。あるいは、今回の記事を否定し、(I)(II)(III)の関係性に囚われない新しい視点を提示し、新しい数学の分野を開拓してもらえるともっと嬉しいです。

超幾何方程式の特性指数の差をずらす操作について

ガウスの超幾何方程式が代数解を持つものは、シュワルツによりリスト化されています.ここで、リストの右の付加条件が気になります.実はこの条件は方程式を簡単なものに変換するための条件と関係するのです.つまり,整数の差はおおむね無視することができるのです.今回はこの変換について簡単に説明します.

f:id:tetobourbaki:20200329191632p:plain
代数解を持つ方程式のリスト
参考文献 河野実彦『微分方程式と数式処理』(図もこの本から引用したものです)

前提知識


リーマンのぺー関数  \wp (t) は特性指数をもちいて

\displaystyle \quad \wp\left\{
\begin{matrix}
0 & 1 & \infty & \\
\lambda & \mu & \nu &; t\\
\lambda' & \mu' & \nu' &\\
\end{matrix}
\right\}
のように書かれるが,ブログでこれを書くのは大変なので簡略化して

\displaystyle \quad \wp\left\{
\begin{matrix}
\lambda & \mu & \nu\\
\lambda' & \mu' & \nu\\
\end{matrix}
\right\}
と表すことにする. t^{-\lambda} (t-1)^{-\mu} をかけると、
 
\displaystyle \quad t^{-\lambda} (t-1)^{-\mu} \wp\left\{
\begin{matrix}
\lambda & \mu & \nu\\
\lambda' & \mu' & \nu'\\
\end{matrix}
\right\}
=
\wp\left\{
\begin{matrix}
0 & 0 & \nu + \lambda + \mu\\
\lambda' - \lambda & \mu' - \mu & \nu' + \lambda + \mu\\
\end{matrix}
\right\}
となる.そこで,特性指数の差  \alpha = \lambda' - \lambda, \beta = \beta' - \beta, \gamma = \nu' -\nu とおくと、

\displaystyle \quad
\wp\left\{
\begin{matrix}
0 & 0 & \rho\\
\alpha & \beta &\rho +  \gamma\\
\end{matrix}
\right\}
と書ける.ここで、フックスの関係式より, \rho = (1 - \alpha -\beta -\gamma)/2 と定まる.この形の解(つまり、 t = 0,1 の特性指数のうち一つは 0 となるもの)を持つ方程式はガウスの超幾何方程式である.また,特性指数の差  (\alpha, \beta, \gamma) で完全に特徴づけることができることも分かる.ただし,差を取るときの順序はどちらでもいいので, \alpha, \beta, \gamma のどれかに  (-1) を書けても同じ方程式を表してると思える.


さて,独立変数に一次分数変換をほどこすことで,特異点  0, 1, \infty は別の3点に移すことができる.特に, 0,1, \infty を位置を入れ替えてもよく,それは特性指数の差を入れ替えてもいいことを意味する.

基本操作

主結果の証明で使う性質を紹介する.証明は面倒であるが、特性指数が解の先頭項のべきを表していることを思い出せば,成り立つことは納得ができるものばかりである.

(命題)
 
\displaystyle \quad t^{s} \wp\left\{
\begin{matrix}
\lambda & \mu & \nu\\
\lambda' & \mu' & \nu'\\
\end{matrix}
\right\}
=
\wp\left\{
\begin{matrix}
\lambda +s& \mu & \nu -s\\
\lambda' +s& \mu' & \nu' -s\\
\end{matrix}
\right\} \\
\displaystyle \quad (t-1)^{s} \wp\left\{
\begin{matrix}
\lambda & \mu & \nu\\
\lambda' & \mu' & \nu'\\
\end{matrix}
\right\}
=
\wp\left\{
\begin{matrix}
\lambda & \mu +s& \nu -s\\
\lambda' & \mu' +s& \nu' -s\\
\end{matrix}
\right\} \\

この操作を
 
\displaystyle \quad \wp\left\{
\begin{matrix}
\lambda & \mu & \nu\\
\lambda' & \mu' & \nu'\\
\end{matrix}
\right\}
\left(\rightarrow^{\times t^{s} } \right)
\wp\left\{
\begin{matrix}
\lambda +s& \mu & \nu -s\\
\lambda' +s& \mu' & \nu' -s\\
\end{matrix}
\right\} \\
\displaystyle  \quad \wp\left\{
\begin{matrix}
\lambda & \mu & \nu\\
\lambda' & \mu' & \nu'\\
\end{matrix}
\right\}
\left( \rightarrow^{\times (t-1)^{s} }\right)
\wp\left\{
\begin{matrix}
\lambda & \mu +s& \nu -s\\
\lambda' & \mu' +s& \nu' -s\\
\end{matrix}
\right\} \\
のように書くことにする.

(命題)
 
\displaystyle \quad \frac{d}{dt} \wp\left\{
\begin{matrix}
0 & 0 & \rho\\
\alpha & \beta & \rho + \gamma\\
\end{matrix}
\right\}
=
 \wp\left\{
\begin{matrix}
0 & 0 & \rho + 1\\
\alpha - 1 & \beta - 1 & \rho + \gamma + 1\\
\end{matrix}
\right\}\\
\displaystyle \quad - t^2 \frac{d}{dt} \wp\left\{
\begin{matrix}
\rho & 0 & 0\\
\rho + \alpha & \beta & \gamma\\
\end{matrix}
\right\}
=
\wp\left\{
\begin{matrix}
\rho + 1 & 0 & 0\\
\rho + \alpha + 1 & \beta - 1 & \gamma - 1\\
\end{matrix}
\right\}

後者の公式は, t = 1/\tau とおいて  \displaystyle -t^2 \frac{d}{dt} = \frac{d}{d\tau} を思い出せば, 0, \infty を入れ替えて前者の公式を使ったものだと思える.

証明

(主結果)
特性指数の差が  (\alpha, \beta, \gamma) = (\alpha_1 + p, \beta_1 + q, \gamma_1 +r), p,q,r \in \mathbb{Z} と書けるとする.
 p+q+r が偶数ならば,特性指数の差が  (\alpha_1, \beta_1, \gamma_1) となる方程式に変換することができる.
さらに, \alpha_1, \beta_1, \gamma_1 のいずれかが  \frac{1}{2} ならば  p+q+r が奇数でも変換することができる.

(証明)
まず、特性指数の差に  (-1) をかけてもいいことから, p \geq 0 , q \geq 0, r \geq 0 としてもよい.また,特異点の位置を交換することで, p \geq q \geq r \geq 0 としてよい.
 
\displaystyle \qquad \wp\left\{
\begin{matrix}
0 & 0 & \rho\\
\alpha & \beta & \rho + \gamma\\
\end{matrix}
\right\} \\
\displaystyle \quad \left(\rightarrow^{\times t^{- \rho}} \right) \wp\left\{
\begin{matrix}
\rho & 0 & 0\\
\alpha + \rho & \beta & \gamma\\
\end{matrix}
\right\} \\
\displaystyle \quad
\left( \rightarrow^{\frac{d^r}{d \tau^r} } \right)
\wp\left\{
\begin{matrix}
\rho + r & 0 & 0\\
\alpha + \rho + r & \beta - r & \gamma - r\\
\end{matrix}
\right\} \\
\displaystyle \quad 
\left(\rightarrow^{ t^{-\rho - r} }\right)
 \wp\left\{
\begin{matrix}
0 & 0 & \rho + r\\
\alpha  & \beta - r & \gamma + \rho\\
\end{matrix}
\right\} \\
\displaystyle \quad
\left( \rightarrow^{\frac{d^m}{dt^m} } \right)
\wp\left\{
\begin{matrix}
0 & 0 & \rho + r + m\\
\alpha -m & \beta - r - m & \gamma + \rho + m\\
\end{matrix}
\right\} \\
\displaystyle \quad 
\left(\rightarrow^{ \times (t-1)^{-\beta + r + m } } \right)
\wp\left\{
\begin{matrix}
0 & -\beta + r + m & \rho + \beta\\
\alpha -m & 0 & \gamma + \rho + \beta - r\\
\end{matrix}
\right\} \\
\displaystyle \quad 
\left(\rightarrow^{\frac{d^n}{dt^n} } \right)
 \wp\left\{
\begin{matrix}
0 & 0 & \rho + \beta + n\\
\alpha -m - n & -\beta + r + m - n & \gamma + \rho + \beta - r + n\\
\end{matrix}
\right\} \\
\displaystyle \quad 
\left(\rightarrow^{\times (t-1)^{\beta - r - m + n} } \right)
 \wp\left\{
\begin{matrix}
0 & \beta - r - m + n & \rho +r + m\\
\alpha -m - n & 0 & \gamma + m + \rho\\
\end{matrix}
\right\}
以上により特性指数の差が  (\alpha, \beta, \gamma) から  (\alpha - m - n, \beta - r - m - n, \gamma - r) に移る.そこで,

\displaystyle \quad m = \frac{1}{2} (p + q - r) \\
\displaystyle \quad n = \frac{1}{2} (p- q + r)
とおけばいいが, m, n微分の回数だったので非負の整数でなければならない.まず, p \geq 0 , q \geq 0, r \geq 0 より非負であることが分かる.また, p + q+ r が偶数だったので,m,n が整数であることが分かる.以上により, (\alpha, \beta, \gamma) から  (\alpha_1, \beta_1, \gamma_1) へ変換できた.まとめるとここで行った変換は,
 \displaystyle
\quad \frac{d^n}{dt^n} (t-1)^{-\beta + r + m} \frac{d^m}{dt^m} t^{-\rho - r} \frac{d^r}{d\tau^r} t^\rho \wp\left\{
\begin{matrix}
0 & 0 & \rho\\
\alpha & \beta & \rho + \gamma\\
\end{matrix}
\right\} \\
\displaystyle \quad=  \wp\left\{
\begin{matrix}
0 & 0 & \rho +r + m\\
\alpha -m - n & \beta - r - m + n & \gamma + m + \rho\\
\end{matrix}
\right\}
という変換を行っている.

最後に, \alpha = 1/2 の場合で  p+q+r が奇数の場合を考える.
 
\displaystyle \qquad \wp\left\{
\begin{matrix}
0 & 0 & \rho\\
\frac{1}{2} & \beta & \rho + \gamma\\
\end{matrix}
\right\} \\
\displaystyle \quad \left( \rightarrow^{ \frac{d}{dt} } \right)
 \wp\left\{
\begin{matrix}
0 & 0 & \rho + 1\\
 - \frac{1}{2} & \beta - 1 & \rho + \gamma + 1\\
\end{matrix}
\right\} \\
\displaystyle \quad \left(\rightarrow^{\times t^{1/2} }\right) 
 \wp\left\{
\begin{matrix}
\frac{1}{2} & 0 & \rho + \frac{1}{2}\\
0 & \beta - 1 & \rho + \gamma + \frac{1}{2}\\
\end{matrix}
\right\}
すると特性指数の差は,(\alpha, \beta, \gamma) から  (\alpha, \beta - 1, \gamma) と移るので,これから見れば  p+q+r は偶数となり、同じ変換を行うことができる.\square

特異解のある方程式について


常微分方程式の一般解や特異解という用語は、ときどき教科書に説明があったりするものの曖昧なことが多いです。
微分代数的な定義は西岡『微分体の理論』やRitt, "Differential Algebra"などに書かれていますが、この定義は非常に抽象的で意味が分かりづらいです。Rittを読んで、何がやりたいか少し分かってきましたが、詳細を書くのは大変なので、今回は簡単な例を通して発想を初等的に説明します。

今回は

\quad \displaystyle \left( \frac{dy}{dx} \right)^2 - 4y = 0
を考えます。


(誤った解法)
まず、

\quad \displaystyle  \frac{dy}{dx} = 2 \sqrt{y}
として、

\quad \displaystyle  \frac{1}{\sqrt{y}}\frac{dy}{dx} = 2
とすれば、積分できることが分かる。

\quad \displaystyle \int \frac{1}{\sqrt{y}} dy = 2x + c\\
\quad \displaystyle 2\sqrt{y} = 2x + c
となるので、計算して定数を置きなおすと、

\quad \displaystyle y = (x + C)^2
となる。


この解法はいろいろダメですが、一番の問題なのは  y = (x + C)^2 以外の解  y=0 を見落としています。原因は  y=0 かもしれないのに両辺を \sqrt{y} で割ったところです。とは言え、最初に微分方程式の授業で求積法を習ったばかりだと、こういった計算をしてしまってもおかしくありません。定数に依存しない特別な解  y=0 が出てきた原因は、一階微分 y' に関して1次じゃないからです。このような微分方程式を非正規微分方程式というのでした。よく考えてみると、方程式を微分していけばいつか正規方程式の形にすることができます。そうやって解いてみましょう。


(解答)
与えられた方程式

\quad \displaystyle \left( \frac{dy}{dx} \right)^2 - 4y = 0
微分すると、

\quad \displaystyle y'y''-2y' = 0
つまり、

\quad \displaystyle y'(y''-2) = 0
となる。よって、解はy' = 0y'' = 2 を満たしている。
y' = 0のとき
解は  y=a と書けるが、方程式に代入すると  a=0 が分かる。よって、解  y=0 を得る。
y'' = 2のとき
解は y =x^2+ bx + c と書けるが、方程式に代入すると、

\quad \displaystyle (2x+b)^2 - 4(x^2 + bx + c) = 0
つまり、

\quad \displaystyle b^2 - 4c = 0
となる。よって、 y = x^2 + b x + b^2/4 = (x + b/2)^2 となり、定数を置き換えて  y=(x+C)^2 を得る。


この解法の勝因は、微分することで正規方程式に帰着できたことです。これらの解しかないこともはっきりしてます。


最後に、この解法の背景を説明します。結局、解は  y=0, y=(x+C)^2 と二つの"図形"に分けることができました。これは、方程式 \left( \frac{dy}{dx} \right)^2 - 4y = 0 が定める"解空間"が既約ではないことを表しています。方程式を微分することで  y'(y''-2) = 0 と解空間を分離することができました(まさに比喩じゃない因数分解)。Rittの本の定義では、このような分解をしたときに、ある一つの集合が「一般解」と呼ばれるものであり、特別な性質を満たす解を「特異解」と呼びます。一般解ではないものは特異解になりますが、一般解に特異解が含まれることもあります。今回では、 y'' = 2 が一般解を定めており、 y=0 という特異解は一般解に含まれず  y'=0 という部分に含まれます。ざっくりした説明は以上ですが、厳密にやるには「分解とはどういう意味か」、「一般解や特異解の厳密な定義はなんなのか」を考えることになります。「分解とは何か」に関してのヒントをいうと、代数幾何の既約分解を「微分代数的に」やるだけです。


(おまけ)
 \left( \frac{dy}{dx} \right)^2 - 4y^3 = 0 を考えてみます。解は  y=(x+C)^{-2} y=0 があります。Rittの定義によると、両方とも一般解であり、y=0 は特異解となります。すこし不思議な気がしますね。微分方程式微分すると  y' (y'' - 6y^2) = 0 となるので、二つの空間に分離できたように見えますが、 \left( \frac{dy}{dx} \right)^2 - 4y^3 = 0 y' = 0 の四則演算と微分から  y'' - 6y^2 = 0 が作れます。これは、もともと既約な一つの空間だったことを意味します。ここから、解はすべて一般解であることになります。実際、 y=(x+C)^{-2} C\rightarrow \infty すると  y=0 に近づくので、y = 0 が一般解なのはむしろ正しい気がします。このように、特異解が一般解に含まれるような状況もRittの定義ではうまく扱えるのです。

Picard-Vessiot拡大の存在証明

代数的なガロア理論におけるガロア拡大は,微分ガロア理論ではPicard-Vessiot拡大と呼ばれるものになります.特に拡大で定数体が変わらないことが重要なのですが,その部分の証明で普通の微分ガロア理論の本ではシュバレーの定理を用いることがほとんどです.つまり,代数幾何の道具を使うため,まず微分体Kを代数閉体として証明し,そうでない場合でも大丈夫なことをチェックします.ここで,代数閉体を仮定してシュバレーの定理を使うところも代数閉体の仮定を外すところもどちらの議論も少し複雑で分かった気になれません.なので,西岡『微分体の理論』に沿った方法で証明し,自分の中での納得感を上げることがこの記事の目的です.(西岡では万有拡大を使って議論するのですが,今回は万有拡大を登場させずに証明します.)

Picard-Vessiot拡大とPicard-Vessiot環

 K微分体とし,その定数体を  C と表す.以下では,定数体の標数 0 であることと,定数体が代数的閉体であることを基本的に仮定している.以下の微分方程式を考える:

\displaystyle \qquad \text{(E)}\quad  Y^{(n)} + \sum_{j=0}^{n-1} a_j Y^{(j)} = 0, \quad a_n = 1, a_j \in K \,(j=1, \dots, n)
微分体の拡大  L/K が方程式(E)のPicard-Vessiot拡大であるとは,以下の条件を満たすことをいう.

 (a) 定数体が等しい,つまり, C_L = C ;

 (b) (E)の解  y_1, \dots, y_n \in L C 上線形独立なものが存在する;

 (c)  L y_1, \dots, y_n により微分体として  K 上生成である.つまり, L = K\langle y_1, \dotsm y_n \rangle

この定義の(b)において, y_1, \dots, y_n C 上線形独立であることは,ロンスキアン  \mathrm{wr} (y_1, \dots, y_n) が非ゼロであることと同値であることは重要である.

もしPicard-Vessiot拡大が存在すれば, K 上の  L 微分同型写像のなす群が微分ガロア群になるのであったが,今回はPicard-Vessiot拡大の存在のみを議論する.そのために,Picard-Vessiot環を導入する.

微分R が方程式(E)のPicard-Vessiot環であるとは,以下の条件を満たすことをいう.

 (i)  R K微分拡大環である;

 (ii)  R は単純微分環である.つまり,R微分イデアルは自明なものしか存在しない;

 (iii) (E)の解  y_1, \dots, y_n \in R C 上線形独立なものが存在する;

 (iv)  R y_i^{(j)} ( i = 1, \dots, n,  j=0, \dots, n) とロンスキアンの逆元  \mathrm{wr} (y_1, \dots, y_n)^{-1} によって環として  K 上生成.つまり, R = K [ \{y_i^{(j)} \}, \mathrm{wr} (y_1, \dots, y_n)^{-1}]


Picard-Vessiot環は,単純微分環であることと解により環として有限生成であるところが,Picard-Vessiot体との違いである.

さて,Picard-Vessiot環が存在すれば,Picard-Vessiot体は簡単に構成できる.まず,零因子の集まりが微分イデアルとなるこてゃ簡単に分かるので,単純微分環であることからPicard-Vessiot環が整域になる.Picard-Vessiot環  R は単純微分環であることから,整域となることが分かる.よって, R の商体  L の定数体が C であることを示すことができれば, L/K は (E)のPicard-Vessiot拡大であることが分かる.定数体が変わらないことは以下の定理から分かる.

(定理)
K の定数体 C標数 0代数的閉体とする. R微分 K微分拡大環とする.R環として  K 上有限生成で,かつ, R が単純微分環ならば, R の商体  L に対して, C_L = C となる.

この定理は以下の補題により証明できる.

補題

F標数 0 の体,R= F[t_1, \dots, t_n ]  F 上有限生成な整域とする.
このとき,x \in RF 上超越的なら,(x-c)^{-1} \notin R となる  c \in \mathbb{Q} が存在する.

(定理の証明)x \in C_L をとる.このとき,I = \{a \in R \mid ax \in R\}微分イデアルとなる.x = q/pq, p \in R)と表示すれば,p\in I が分かるので,I\{0\} ではない.よって,単純微分環であることから, I = Rとなる. よって,x \in R となる.xK 上超越的と仮定すると補題により  (x - c)^{-1} \notin R となる  c \in \mathbb{Q} は存在する.しかし, (x-c)^{-1} は定数だから, (x-c)^{-1} \in C \subset R となり矛盾.よって, xK 上代数的である.よって, xC 上超越的となり,C代数的閉体だから  x \in C となる. \square

最終目標は補題の証明である.その前に,Picard-Vessiot環の構成法を説明する.

ちなみに,Picard-Vessiot拡大であることと,Picard-Vessiot環の商体で書けることは同値である.

(Remark)この補題と対応するものはMagid『Lectures on Differential Galois theory』では補題1.16にある.そこでもシュバレーの定理を用いて証明している.

Picard-Vessiot環の存在証明

方程式(E)のPicard-Vessiot環を構成する.まず, n^2 個の不定 Y_{i, j} ( i=1, \dots, n, j = 0, \dots n -1) を用意し,その微分

\displaystyle \qquad Y_{i, j}' = Y_{i, j+1} \qquad j = 0, \dots, n-2 \\
\displaystyle \qquad Y_{i, n-1}' = - \sum_{j=0}^{n-1} Y_{i, j}
と定める.すると, R_1 = K[\{Y_{i,j}, \mathrm{wr} (Y_{1,0}, \dots, Y_{n,0})^{-1}]  K 上環として有限生成で, (Y_{1,0}, \dots, Y_{n,0} C 上独立な解となる微分環となる.ここで, R_1 の極大微分イデアル J として, R = R_1/J とおけば, R_1 はPicard-Vessiot環となる.ここでのポイントは,もし,  K[\{Y_{i,j}] を考えたなら, \mathrm{wr} (Y_{1,0}, \dots, Y_{n,0}) が極大微分イデアルに入った場合,イデアルで割ったときに解が独立にはならなくなってしまうというところである.このような理由があるためあらかじめ  \mathrm{wr} (Y_{1,0}, \dots, Y_{n,0})^{-1} を添加することで,ロンスキアンを可逆にしておくのである.

ちなみに,一つの方程式に対して二つのPicard-Vessiot環があればそれらは微分同型であることも分かる.つまり,Picard-Vessiot環はこの意味で一意である.

また,Picard-Vessiot環の定義において,ロンスキアンの逆数で生成されているという仮定は必要がないようにも思えるが,ロンスキアン  \mathrm{w} が可逆でない場合  w で生成されるイデアルが非自明な微分イデアルとなる.よって単純微分環にするためには  \mathrm{w}^{-1} を加えておく必要がある.

補題の証明

少し準備をする. R を整域, K R の商体とする.このとき, R K付値環であるとは,全ての  x \in K に対して, x \in R または  x^{-1} \in R となることをいう.付値環は局所環になっている.

(命題1)
 K を体,AK の部分環で  P を極大イデアルに持つ局所環 A とする.このとき, K の付値環 R A \subset R かつ, R の極大イデアル  M A \cap M = P となるものが存在する.

(証明) A を含む  K の部分環  B 1 \notin PB となるものの全体を  \mathcal{S} とおく. A \in \mathcal{S} であり,ツォルンの補題の仮定を満たすことはすぐに分かるので, \mathcal{S} は極大元  R を持つ.1 \notin PR より, PR を含む R の極大イデアル  M が存在する.RM による局所化  R_M の極大イデアル  M R_M  1 を含まないので, 1 \notin PR \subset M R_M となり, R_M R を含む  \mathcal{S} の元である. R の極大性により.R_M = R だから R は局所環である. A \cap M P を含む  Aイデアルであり,P A の極大イデアルだから  A\cap M = P である.

最後に, RK の付値環であることを示す. x \in K x \notin R とする.R の極大性により, R[x] \notin \mathcal{S} だから, 1 \in P R[x] である.よって,

\displaystyle \qquad 1 = a_0 + a_1 x + \dots + a_n x^n, \quad a_j \in PR \subset M
とかける. 1 - a_0 \in R \setminus M だから  1-a_0 R の単元であり,

\displaystyle (\star) \quad 1 = b_1 x + \dots + b_n x^n, \quad b_j \in M
と書き直すことができる.このように書ける最小の  n を取る.もし, x \notin R ならば同様の議論により,

\displaystyle \qquad 1 = c_{1} x + \dots + c_m x^{-m}, \quad c_j \in M
と書ける最小の  m をとる. n \geq m ならば,

\displaystyle \qquad b_n x^n = b_n c_{1} x^{n-1} + \dots + b_n c_m x^{n-m}
となるので, (\star) 式の  b_n x^n を消せば, n の最小性に矛盾する. n < m の場合も同様である.よって, x \in R である.よって, R K の付値環である.  \square

(Remark)この命題はアティヤ・マクドナルド『可換代数入門』の5章の演習問題27と関係する命題である.

(系)
 K を体,AK の部分環で  PA の素イデアルとする.このとき, K の付値環 R A \subset R かつ, R の極大イデアル  M A \cap M = P となるものが存在する.

(証明)A P による局所化  A_P に対して命題1を用いると, A_P \subset R かつ  A_P \cap M = P A_P となる付値環  R が存在する. A \cap M = P が簡単に分かるので証明が終わる. \square

この系を用いて補題を証明する.

補題

F標数 0 の体,R= F[t_1, \dots, t_n ]  F 上有限生成な整域とする.
このとき,x \in RF 上超越的なら,(x-c)^{-1} \notin R となる  c \in \mathbb{Q} が存在する.

(証明) x, x_1, \dots, x_m R の商体  KF 上の超越基底とする. E = F(x_1, \dots, x_m), R' = E [ t_1, \dots, t_n] とおく. x E 上でも超越的である. c \in \mathbb{Q} とする. (x-c) E [ x ]  E [ x ] の素イデアルだから,系により, K の付値環  S とその極大イデアル  M E [ x ] \subset S かつ  E [ x ] \cap M = (x-c) E [ x ] となるものが存在する.ここで,  (x-c)^{-1} \in R \subset R' とする.さらに,全ての  t_1, \dots, t_n S に含まれるとすると, R' \subset RS \subset S となり  (x-c)^{-1} \in S.よって, 1 = (x-c) (x-c)^{-1} \in M となり矛盾.したがって, t_j \notin S となる  j が存在する.S が付値環なので, t_j^{-1} \in M である.ところで  t_j E [ x ] 上代数的だから,
 
\displaystyle \qquad a^{(j)}_d (x) t_j^d + \dots + a^{(j)}_0 (x) = 0, \quad a^{(j)}_i (x) \in E [x ], a_d (x) \neq 0
となる.
 
\displaystyle \qquad a^{(j)}_{d_j} (x)= - a^{(j)}_{d_j-1} t_j^{-1} + \dots - a^{(j)}_0 (x) t_j^{-d} , \quad a^{(j)}_i (x) \in E [x ]
なので, a^{(j)}_{d_j} (x) \in E [x ] \cap M = (x-c) E [x ] となる.つまり, a^{(j)}_{d_j} (c) = 0 となる.

以上をまとめると, c \in \mathbb{Q} に対して, (x-c)^{-1} \in R ならばある j に対して, a^{(j)}_{d_j} (c) = 0 となる.しかし,  a^{(1)}_{d_1} (x)=0, \dots,  a^{(n)}_{d_n} (x)=0 のいずれかの解となるものは有限個しかないので, (x - c)^{-1} \notin R となる  c \in \mathbb{Q} が存在する(無限個存在することも分かる). \square

おまけ

途中で,微分体の拡大  L/ K に対して, c \in C_L K 上代数的ならば  C_K 上代数的であることを使った.これは簡単に分かる. y_1, \dots y_n \in KC_K 上一次独立であることは,ロンスキアンが非零であることと同値だから  C_L 上一次独立であることと同値である.よって, K C_L C_K 上線形無関連である.よって, K C_LC_K 上代数的無関連である.よって, C_K 上代数的独立な  C_L の元は  K 上でも代数的独立である.対偶をとると, K 上代数的な  C_L の元は  C_K 上でも代数的である.