
応用数理総論 / Random matrix theory and high-dimensional statistics

後期 金曜日 2講時. 単位数/Credit(s): 2. 担当教員/Instructor : 赤間 陽二. 学期/Semester: 後期. 開講年度/Year: 2024.





Random matrix theory and high-dimensional statistics


ランダム行列理論は成分がランダムな行列を研究し、Wigner, Marchenko, PasturやDysonなどの核物理学者によって基本的な研究がされ、数学・物理・工学に広く応用されている。確率論の大数の法則・中心極限定理は、ランダム行列理論ではどのような形を取るであろうか。我々は、物理学者が研究してきた行列の代表的な様式に対して、行列のサイズの極限における、行列の固有値分布、最大(最小)固有値の場所、最大固有値の変動、これら各々の確率分布を理解することを最初の目的とする。ところでランダム行列は、多変数統計学における標本共分散行列・標本相関行列としても現れる。この観点で近年Bai, Fan, Jiangなどがランダム行列理論を大規模高次元データの統計学に応用している。データの典型的な生成メカニズムに対して、データ行列の行数(データの次元)と列数(サンプルのサイズ)の典型的な関係を保った極限において、標本共分散行列・標本相関行列の固有値分布、最大(最小)固有値の場所、最大固有値の変動、これら各々の確率分布を理解することを次の目的とする。大規模データの統計学において、標本相関行列次元を用いてデータの次元を削減する。大規模データの近年の膾炙に伴い、削減する次元の目安が活発に提案されている。その目安の振る舞いをランダム行列理論で解明し、時系列解析への関連を展望する。


Random matrix theory studies matrices whose elements are random, and was initiated and studied by nuclear physicists Wigner, Dyson, Marchenko, and Pastur. Since then, deep research has been studied across mathematics, physics, and engineering. Does random matrix theory have any counterparts to the Law of Large Numbers and the Central Limit Theorem of the probability theory? For matrices physicists have extensively studied, in the limit of matrix sizes, we will understand the distributions of eigenvalues, the locations of the maximum (minimum) eigenvalues, the fluctuation distributions of the maximum eigenvalues. Random matrices also appear as sample covariance matrices and sample correlation matrices in multivariate statistics. Recently, Bai, Fan, and Jiang have applied the theory of random matrices to the statistics of large-scale high-dimensional data. For typical generation mechanisms (Factor model,...) of data, we will understand the distributions of eigenvalues of sample covariance matrices and sample correlation matrices, the locations of the maximum (minimum) eigenvalues, the fluctuation distributions of the maximum eigenvalues, in the limit of the number of rows (the dimension of the data) and the number of columns (the size of the sample). In the statistics of large-scale data, we often reduce the dimension of data. The criteria on the reduced dimensions are now actively proposed and studied, because of recent big data. We elucidate the behavior of typical dimension reduction criteria and to explore their relevance to time series analysis.




Understanding Wigner semicircle law and Marchenko-Pastur distribution.
Understanding the behavior of limiting spectral distributions under additive/multiplicative random matrix perturbation.


(1) 序論
(2) 確率分布の収束
(3) 多変数統計学の基礎
(4) 極限固有値分布とスティルチェス変換
(5) Wigner行列の極限固有値分布(Wigner半円則)
(6) 標本分散行列の極限固有値分布(Marchenko-Pastur分布)
(7) Fisher行列の極限固有値分布
(8) 標本分散行列の最大固有値の極限分布(Tracy-Widom分布)
(9) 加法的/乗法的ランダム行列摂動に関する極限分布の振る舞い
(10) 次元削減としての主成分分析
(11) 本質的データ次元の基準 I: Guttman-Kaiser法
(12) 本質的データ次元の基準 II: Jolliffe法
(13) 本質的データ次元の基準 III: Broken-stick法
(14) 母分散行列の固有値モデル
(15) 時系列予測と高次元モデリング

Contentsandprogressscheduleofthe class

(1) Introduction
(2) Convergences of probability distribution
(3) Basics of multivariate statistics
(4) Limiting spectral distribution and Stieltjes transform
(5) LSD of Wigner matrix (Wigner semicircle law)
(6) LSD of sample covariance matrix S (Marchenko-Pastur law)
(7) LSD of Fisher matrix
(8) LSD of the largest eigenvalue of S (Tracy-Widom law)
(9) Behavior of limiting distributions by additive/multiplicative random matrix perturbations
(10) Principal component analysis for the reduction of data dimension
(11) Criteria of significant data dimension I: Guttman-Kaiser rule
(12) Criteria of significant data dimension II: Jolliffe rule
(13) Criteria of significant data dimension III: Broken-stick rule
(14) Spiked eigenvalues model of population covariance matrix
(15) Time-series forecasting and high-dimensional modeling






Bai, Z. D. & Silverstein, J. W. (2010), Spectral analysis of large dimensional random matrices, New York : Springer.

Horn, R. A. & Johnson, C. R. (2013), Matrix analysis, 2nd edn, Cambridge University Press, Cambridge.

J. Yao, S. Zheng & Z. Bai (2015), Large Sample Covariance Matrices and High-Dimensional Data Analysis. New York, NY: Cambridge University Press.

Books required/referenced

Preparation and review

Basic Linear algebra and basic analysis.

