Appearance
生成モデルの数理 5 —— 最小確率流法からシュレーディンガー方程式へ
これまでの章では、ランジュバン方程式に従って個々の粒子が動く様子と、それが全体としてどのように分布の変化(フォッカー・プランク方程式)をもたらすかを見てきました。 本章では、分布の「流れ(確率流)」を最小化することでスコアマッチングが導かれるという「最小確率流法」の概念から出発します。さらに、粒子の軌跡の確率を定式化する「オンサーガー・マハルプ積分」を経て、この確率的なダイナミクスが、なんと量子力学の「シュレーディンガー方程式(超対称量子力学)」と完全に一致するという、物理学とデータ科学を繋ぐ壮大な数理を解き明かします。
1. 最小確率流法(連続の式)とスコアマッチング
確率分布 の時間変化は、確率の「流れ(確率流 )」を用いた連続の式として記述されます。
フォッカー・プランク方程式における確率流 は、ポテンシャル の傾きによる力と、温度 による拡散の力を合わせて次のように書けます。
ここで、確率流の式を確率分布 でくくり出し、微分の連鎖律()を用います。
確率流を分布で割った「確率の流速 」を定義します。
モデルが真のデータ分布に完全に一致(定常状態に到達)したとき、この確率の流れはゼロ()になります。つまり、この流速の二乗を最小化するようなモデルを作ればよいことになります。 これは、前章で学んだ「モデルのスコア()」と「データのスコア()」を一致させる「スコアマッチングの目的関数 」と本質的に全く同じものなのです。
2. 経路の確率とオンサーガー・マハルプ積分
定常分布 を持つモデルの背後(ウラ)にある、ランジュバン方程式に基づくダイナミクスを考えます(簡単のため温度 に相当する係数を置きます)。
ここで、微小時間 の間のノイズ を逆算します。
ノイズ は標準正規分布に従うため、時刻 から までの経路全体の確率 は、次のように書けます。
積分の二乗を展開します。
ここで、真ん中の項 は、単なる始点と終点のエネルギー差 (表面項)になるように見えます。 しかし、第3章で学んだ「伊藤ルール(再・伊藤ルール)」により、確率微積分においては となるノイズの補正(バルクの補正)が生じます。この補正項 が組み合わさることで、経路確率は次の「オンサーガー・マハルプ積分」として結実します。
3. シュレーディンガー方程式への変換
個々の粒子の軌跡ではなく、確率分布 全体の時間発展を記述する「フォッカー・プランク方程式」を考えます()。
この方程式の形は、量子力学における波動関数 の時間発展を記述する「シュレーディンガー方程式」と酷似しています。
両者を結びつけるため、定常分布の平方根を抜き出すような変数変換 を導入します(量子力学において確率が であることへのアナロジーです)。 これをフォッカー・プランク方程式に代入して微分を計算します。
すべての項を整理すると、 や の一部が相殺され、次の美しい方程式が現れます。
これはまさに、ポテンシャル を持つ「虚時間のシュレーディンガー方程式」そのものです。オンサーガー・マハルプ積分の積分項の中に現れた「バルクの補正」が、量子力学のポテンシャルとして完璧に対応しています。
4. 超対称量子力学と演算子の分解
このシュレーディンガー方程式に現れた演算子(ハミルトニアン)は、さらに美しく分解できます。 次のような「生成・消滅演算子」に似た2つの演算子 と を定義します。
これらを掛け合わせてみましょう。まず は次のようになります。
次に、順番を入れ替えた を計算します。
見事に、変換後のフォッカー・プランク方程式の演算子と完全に一致しました。
この と のペアは、物理学において「超対称量子力学(SUSY QM)」と呼ばれる深遠な対称性を形成します。 機械学習のスコアモデルや確率的サンプリングを突き詰めた結果、その背後に量子力学や素粒子物理学の究極の対称性が潜んでいるという事実は、データ科学と理論物理学が完全に一つの数理で繋がっていることを証明しています。