Home
1571 words
8 minutes
『The Matrix Cookbook』Page 16完全解読:テープリッツ行列の微分と構造化行列の総括

last_modified: 2026-01-10

生成AIによる自動生成記事に関する免責事項: 本記事は、Petersen & Pedersen著 The Matrix Cookbook (Nov 15, 2012 edition) のPage 16の内容(公式143〜144)を骨子とし、数理的な証明と応用例を大幅に加筆して再構成した解説記事です。筆者の学習目的で生成したものです。正確な内容は必ず一次情報で確認してください。

1. 序論:時系列データの構造を捉える#

ついに最終ページ、Page 16 です。ここでは テープリッツ行列(Toeplitz Matrix) という特殊な構造化行列の微分を扱います。

テープリッツ行列は、対角線上の成分がすべて同じ値を持つ行列です。

T=[t0t1t2t1t0t1t2t1t0]T = \begin{bmatrix} t_0 & t_{-1} & t_{-2} \\ t_1 & t_0 & t_{-1} \\ t_2 & t_1 & t_0 \end{bmatrix}

この構造は、時系列データの自己相関行列や、畳み込み演算(Convolution)を行列形式で書いたときに現れます。そのため、ARモデル(自己回帰モデル)の推定やフィルタ設計などの最適化問題において、この行列での微分が必要不可欠となります。


2. テープリッツ行列の微分 (Eq. 143)#

テープリッツ行列 TT に関するトレースの微分は、単純な転置では得られません。対角成分同士が「連動」しているため、それらを足し合わせる操作が必要になります。

2.1 一般公式と α(A)\alpha(A) の定義#

【公式】

Tr(AT)T=Tr(TA)T=α(A)(143)\frac{\partial \text{Tr}(AT)}{\partial T} = \frac{\partial \text{Tr}(TA)}{\partial T} = \alpha(A) \tag{143}

ここで α(A)\alpha(A) は、行列 AA を元に作られる特別なテープリッツ行列です。

α(A)\alpha(A) の生成ルール】 α(A)\alpha(A) の各対角線上の成分は、元の行列 AA(および ATA^T)の対応する対角線上の成分の総和になります。

  • 主対角成分: AA のトレース(対角成分の総和) Tr(A)\text{Tr}(A)
  • 副対角成分: ATA^T の対応する対角線の成分和。

具体的には、α(A)\alpha(A) 自体もテープリッツ構造を持ち、その kk 番目の対角成分 hkh_k は以下のように計算されます。

hk=iAi,i+k(あるいは AT の成分和)h_k = \sum_{i} A_{i, i+k} \quad (\text{あるいは } A^T \text{ の成分和})

※ 原典の記述は少し複雑ですが、要するに**「連動している成分(同じ対角線上の成分)に対応する AA の係数をすべて合計する」**という操作です。

【導出のロジック:連鎖律の応用】 Page 15 の連鎖律(Eq. 133, 137)を思い出してください。

ftk=ijfTijTijtk\frac{\partial f}{\partial t_k} = \sum_{ij} \frac{\partial f}{\partial T_{ij}} \frac{\partial T_{ij}}{\partial t_k}

テープリッツ行列では、ある変数 tkt_k は行列 TTkk 番目の対角線上のすべての成分に現れます。 したがって、tkt_k で微分すると、その対角線上にあるすべての位置の「仮の勾配(AA の成分)」が足し合わされることになります。これが α(A)\alpha(A) の正体です。


3. 対称テープリッツ行列 (Symmetric Toeplitz) (Eq. 144)#

さらに制約が加わり、テープリッツかつ対称(T=TTT = T^T)である場合です。これは自己共分散行列などで頻繁に現れる構造です。

3.1 公式#

【公式】

Tr(AT)T=α(A)+α(A)Tα(A)I(144)\frac{\partial \text{Tr}(AT)}{\partial T} = \alpha(A) + \alpha(A)^T - \alpha(A) \circ I \tag{144}

【解説】 これは、以下の2段階の補正を組み合わせたものです。

  1. テープリッツ補正: まず構造を無視して、テープリッツ性だけを考慮した勾配 α(A)\alpha(A) を作る(Eq. 143)。
  2. 対称性補正: Page 15 Eq. 138 の対称行列の微分公式 G+GTGIG + G^T - G \circ I を適用する。

つまり、α(A)\alpha(A) を「仮の勾配 GG」と見なして、対称化処理を行っているわけです。 これにより、テープリッツ構造(対角連動)と対称構造(転置連動)の両方を満たす正しい勾配が得られます。


4. シリーズ総括:行列微分の全体像#

これにて『The Matrix Cookbook』の微分セクション(Page 8〜16)の解説が完了しました。全体を振り返ると、以下の3つの層で理解できます。

  1. 基本の層(Page 8-12):

    • 行列式や逆行列の微分。
    • 重要なのは lnX=XT\partial \ln|X| = X^{-T}X1=X1(dX)X1\partial X^{-1} = -X^{-1} (dX) X^{-1}
  2. 実用の層(Page 13):

    • 二次形式とトレースの微分。機械学習の損失関数はほぼこれ。
    • 重要なのは Tr(XTX)=2X\partial \text{Tr}(X^T X) = 2X(正則化の勾配)。
  3. 構造の層(Page 14-16):

    • 対称行列、対角行列、テープリッツ行列。
    • 重要なのは 「構造があると、単純な微分(Naive Gradient)を足し合わせたり(射影)、成分を引いたり(重複補正)する必要がある」 という連鎖律の考え方。

この体系を頭に入れておけば、どんな複雑な行列演算を含むAIモデルや物理シミュレーションでも、自力で勾配を導出し、実装することができるはずです。

参考文献#

  1. Petersen, K. B., & Pedersen, M. S. (2012). The Matrix Cookbook. Technical University of Denmark. (Page 16, Eqs 143-144)
  2. Gray, R. M. (2006). Toeplitz and Circulant Matrices: A Review. Now Publishers. (Toeplitz matrices in physics and signal processing)

補足:テープリッツ行列微分の直感(配線図ふたたび)#

Page 15 で導入した「スイッチと電球」のアナロジーは、テープリッツ行列でこそ真価を発揮します。

1. 一般の行列(独立)#

  • スイッチ X11X_{11} は電球 (1,1)(1,1) だけを点ける。
  • スイッチ X22X_{22} は電球 (2,2)(2,2) だけを点ける。
  • 感度: それぞれ A11,A22A_{11}, A_{22}

2. テープリッツ行列(連動)#

  • スイッチ t0t_0(主対角成分用の変数)を押すと、対角線上の全電球 (1,1),(2,2),(3,3),(1,1), (2,2), (3,3), \dots が一斉に点灯します。
  • 感度: したがって、t0t_0 に対する感度は、個々の場所の感度の総和になります。 ft0=A11+A22+A33+=Tr(A)\frac{\partial f}{\partial t_0} = A_{11} + A_{22} + A_{33} + \dots = \text{Tr}(A)
  • これが α(A)\alpha(A) の対角成分が Tr(A)\text{Tr}(A) になる理由です。

3. 結論#

構造化行列の微分とは、結局のところ**「変数が共有されている(Wiringされている)部分の感度を足し合わせる」**という操作に他なりません。 難解な数式 α(A)\alpha(A) も、この物理的なイメージを持てば、「ああ、単に対角線に沿って足しているだけか」と瞬時に理解できるはずです。

『The Matrix Cookbook』Page 16完全解読:テープリッツ行列の微分と構造化行列の総括
https://ss0832.github.io/posts/20260110_the_matrix_cookbook_10/
Author
ss0832
Published at
2026-01-10
License
CC BY-NC-SA 4.0

Related Posts

『The Matrix Cookbook』Page 9完全解読:複合行列式の微分と逆行列の摂動論
2026-01-10
『The Matrix Cookbook』Page 9に記載された複合関数の行列式微分(二次形式、線形形式)および逆行列の汎用微分公式(Eq. 49-59)を完全網羅。ウィシャート分布の解析、ガウス過程回帰、準ニュートン法への応用を含め、数理的背景から実務実装までを体系的に論じる包括的解説書。
『The Matrix Cookbook』Page 12完全解読:勾配・ヘッセ行列・トレース微分の基礎
2026-01-10
『The Matrix Cookbook』Page 12に記載された一般化レイリー商の微分、勾配とヘッセ行列の定義、およびトレース微分の基礎公式(Eq. 92-105)を完全網羅。ニュートン法による最適化、信号処理における固有値解析への応用を含め、数理的背景から実務実装までを体系的に論じる包括的解説書。
『The Matrix Cookbook』Page 14完全解読:逆行列トレース・ベクトルノルム・構造化行列
2026-01-10
『The Matrix Cookbook』Page 14に記載された逆行列を含む複雑なトレース微分(Eq. 124-128)、ベクトルノルムの微分と射影行列(Eq. 129-131)、および構造化行列(対称行列など)に対する微分の連鎖律(Eq. 133)を完全網羅。幾何学的最適化や物理シミュレーションへの応用を含め、数理的背景から実務実装までを体系的に論じる包括的解説書。
『The Matrix Cookbook』Page 15完全解読:構造化行列の微分公式と連鎖律
2026-01-10
『The Matrix Cookbook』Page 15に記載された構造化行列(対称行列・対角行列)の微分公式(Eq. 134-142)を完全網羅。構造行列 S^ij の定義、一般的な連鎖律、および対称行列における「対角成分の重複補正」の数理的背景から、共分散行列推定や対角スケーリング層への応用までを体系的に論じる包括的解説書。
『The Matrix Cookbook』Page 8完全解読:行列微分の構造・証明・応用
2026-01-10
『The Matrix Cookbook』Page 8を起点に、行列式の微分(ヤコビの公式)の完全証明(固有値分解・行列指数関数)、対数行列式の凸性解析、そして統計学(多変量正規分布の最尤推定)・物理学(連続体力学)・最適制御(D-最適計画)への具体的応用までを体系的に論じる。公式の羅列を超え、数理的背景と実用性を兼ね備えた包括的な解説書。
『The Matrix Cookbook』Page 11完全解読:二次形式・高次形式・最小二乗法の微分
2026-01-10
『The Matrix Cookbook』Page 11に記載された二次形式(ベクトル・行列)、最小二乗法関連の微分、複素LMSアルゴリズム、および行列のn乗(高次形式)の微分公式(Eq. 76-91)を完全網羅。統計的推定や制御理論、機械学習の損失関数設計への応用を含め、数理的背景から実務実装までを体系的に論じる包括的解説書。