Processing math: 0%

субота, 19 вересня 2020 р.

Жорданова нормальна форма і мінімальний многочлен.

Мінімальний многочлен

Нехай задана дійсна матриця A розміром n \times n.

Лема М1
Існує дійсний многочлен p такий, що p(A) = 0.
Простір M_{n\times n}(\mathbb R) - це n^2-вимірний векторний простір. Візьмімо \mathbf I, \mathbf A, \mathbf A^2, \dots, \mathbf A^{n^2}. Всього маємо n^2 + 1 елементів, отже вони лінійно залежні: \mu_0 \mathbf I + \mu_1 \mathbf A + \dots + \mu_{n^2}\mathbf A^{n^2} = 0. Тоді можна записати многочлен \ p(t) = \sum \mu t^i такий, що p(A) = 0.

Нехай серед усіх таких многочленів такий, щоб мав найменший степінь і був нормованим, тобто перший коефіцієнт був 1. Називатимемо такий многочлен *мінімальним многочленом* матриці \mathbf A.

Лема М2
Мінімальний многочлен - унікальний.
Якби ми мали два таких многочлени, то остача від їхнього ділення була б многочленом меншого степеня, що давав би нуль для \mathbf A.
Лема М3
Якщо p це деякий многочлен, для якого p(A) = 0, тоді m ділить p.
Зрозуміло, що \deg(p) \ge \deg(m), тоді можна записати таке: p = mq + r для певних многочленів q, r таких, що \deg(r) < \deg(m). Тоді r(\mathbf A) = p(\mathbf A) - m(\mathbf A)q(\mathbf A) = 0, але ж r має меншу степінь ніж m, це протирічить мінімальності m.
Лема М4
Якщо \lambda це в-значення \mathbf A, тоді воно корінь m.
Для певного v \ne 0 маємо, що \mathbf Av = \lambda v. Також \mathbf A^k v^k = \mathbf A^{k-1} \lambda v = \cdots = \lambda^k v, для будь-кого цілого k \ge 0. Отже, для будь-якого многочлена p(A)v = p(\lambda)v, в тому числі і для мінімального. З того, що m(\mathbf A) = 0 і v \ne 0 випливає, що m(\lambda) = 0.

Теорема Гамільтона — Келі: Нехай \chi(t) = \det(\mathbf A - t\mathbf I) буде характеристичним многочленом \mathbf A. Тоді \chi(\mathbf A) = 0.

Лема М5
Якщо \chi(t) = \prod_{i=1}^r (t-\lambda_i)^{a_i}, то що ми можемо сказати про m(t)?
Згідно з Гамільтоном — Келі, М3 і М4 маємо, що m може мати лише такий вигляд \prod_{i=1}^r(t-\lambda_i)^{c_i}, де 1 \le c_i \le a_i.
Лема М6
\chi(t) і m(t) - інваріанти щодо зміни базису.
Нехай \mathbf B = \mathbf P^{-1} \mathbf A \mathbf P. Зауважимо, що для довільного многочлена p(\mathbf A) = \mathbf P^{-1}p(\mathbf B) \mathbf P, бо \mathbf B^k = \mathbf P^{-1} \mathbf A^k \mathbf P. Тому p(\mathbf A) = 0 тоді і тільки тоді, коли p(\mathbf B) = 0. Отже мінімальні многочлени для \mathbf A і \mathbf B ділять один одного і, відповідно, рівні.

Жорданові клітини і жорданова нормальна форма

\mathbf J = \begin{pmatrix} a & 1 & & \\ & a & 1 \\ & & a & 1 \\ & & & a \\ \end{pmatrix} - жорданова клітина, \begin{pmatrix} \mathbf J_1 & & & \\ & \mathbf J_2 & & \\ & & \ddots & \\ & & & \mathbf J_k \\ \end{pmatrix} - жорданова нормальна форма.

Лема Ж1: Нехай \mathbf J - жорданова клітина з \lambda на діагоналі. Тоді \lambda - єдине в-значення з власним простором розмірності 1.

Лема Ж2: Нехай \mathbf J це жорданова клітина розміру k \times k, тоді (\mathbf J - \lambda \mathbf I)^n = 0 для n = k і не рівна нулю для n < k.

Лема Ж3: Якщо A, B це блочні матриці з однаковими розмірами блоків, тоді

\begin{pmatrix} \mathbf A_1 & & \\ & \ddots & \\ & & \mathbf A_n \end{pmatrix} \begin{pmatrix} \mathbf B_1 & & \\ & \ddots & \\ & & \mathbf B_n \end{pmatrix} = \begin{pmatrix} \mathbf A_1\mathbf B_1 & & \\ & \ddots & \\ & & \mathbf A_n\mathbf B_n \end{pmatrix}
Теорема
Припустимо, що задана \mathbf A в нормальній жордановій формі. Припустимо, що відмінні діагональні елементи це \lambda_1, \dots, \lambda_k, і \lambda_i з'являється a_i раз. Припустимо, що кількість жорданових клітин з \lambda_i на діагоналі становить g_i. І припустимо, що найбільша жорданова клітина з \lambda_i на діагоналі має розмір c_i. Тоді
  1. \chi(t) = \prod_{i=1}^k(t-\lambda_i)^{a_i}
  2. m(t) = \prod_{i=1}^k(t-\lambda_i)^{с_i} (степінь (t-\lambda_i) в m(t) це розмір найбільшої \lambda_i-клітини)
  3. \dim\ker(\mathbf A - \lambda_i \mathbf I) = g_i (вимірність в-простору \lambda_i це кількість \lambda_i-клітин)
  1. Раз \mathbf A в ЖНФ, то вона верхньотрикутна, отже її в-значення у неї на головній діагоналі.
  2. Згідно з першим пунктом і М4 маємо, що m(t) = \prod_{i=1}^k(t-\lambda_i)^{k_i} для деяких k_i. Тепер, для того, щоб _вбити_ найбільшу клітину для j-го в-значення потрібно \mathbf A - \lambda_j \mathbf I піднести до c_j степеня. Отже, якщо k_i = c_i, то в (A-\lambda_i)^{k_i} всі \lambda_i-клітини нульові. Отже, використовуючи Ж3, щоб отримати нулі для \lambda_p і \lambda_q нам треба взяти (\mathbf A - \lambda_p \mathbf I)^{c_p}(\mathbf A - \lambda_q \mathbf I)^{c_q}. Роблячи це для всіх в-значень ми отримуємо нульову матрицю.
  3. Згідно з Ж1 маємо по одному виміру в-простору для кожної жорданової клітини.