행렬의 대각화

Last Updated on 2024-10-13 by BallPen

행렬의 대각화(diagonalization of matrices)란 대칭 선형 변환 행렬 AA에 고유벡터로 구성된 직교행렬 MM을 아래 식과 같이 적용하면, 고유값 λ\lambda로 구성된 대각행렬 DD가 얻어지는 것을 말합니다.

M1AM=D(D1)\tag{D1} M^{-1}AM = D

이 글에서는 위 (D1)식이 어떻게 유도되고, 행렬의 대각화 의미와 예제를 풀어보겠습니다.

아래는 이번 글의 목차입니다.

어떤 벡터 x\vec x를 행렬 AA선형변환했을 때 그 결과가 벡터 x\vec x의 스칼라 λ\lambda 배를 만족하는 경우가 있어요.

이를 식으로 쓰면 아래 (1-1)식과 같고, 이것을 고유값 문제(또는 고유치 문제)라고 해요.

Ax=λx(1-1)\tag{1-1} A \vec x = \lambda \vec x

위 식에서 λ\lambda는 행렬 AA의 고유값, x\vec xλ\lambda에 대응하는 고유벡터라고 해요.

예를 들어 행렬 AA가 3×3행렬이고 벡터 x\vec xx1, x2, x3x_1,~ x_2,~ x_3의 방향성분으로 구성된 3차원 벡터라고 했을 때 (1-1)식은 다음과 같아요.

(a11a12a13a21a22a23a31a32a33)(x1x2x3)=λ(x1x2x3)(1-2)\tag{1-2} \begin{pmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33} \end{pmatrix} \begin{pmatrix} x_1\\ x_2 \\ x_3 \end{pmatrix} =\lambda \begin{pmatrix} x_1\\ x_2\\ x_3 \end{pmatrix}

그리고 고유값 문제를 푼다는 의미는 윗 식을 만족하는 세개의 고유값 λ1, λ2, λ3\lambda_1,~\lambda_2, ~\lambda_3를 구하고, 그에 대응하는 세개의 고유벡터 x, y, z\vec x,~\vec y, ~\vec z를 구하 것을 의미하죠.

x=(x1x2x3),   y=(y1y2y3),   z=(z1z2z3)(1-3)\tag{1-3} \begin{align} \vec x = \begin{pmatrix} x_1 \\ x_2 \\ x_3 \end{pmatrix} ,~~~ \vec y = \begin{pmatrix} y_1 \\ y_2 \\ y_3 \end{pmatrix} ,~~~ \vec z = \begin{pmatrix} z_1 \\ z_2 \\ z_3 \end{pmatrix} \end{align}

구체적인 풀이 과정은 이전 고유값 문제에 대한 글을 참고해 주세요.

고유값 문제를 복습했으니 이제부터는 행렬의 대각화 이야기를 시작합니다. 먼저 행렬 대각화를 하는 이유부터 알아봐야겠죠.

(1-2)식에 주어진 3×3행렬을 대각행렬로 바꿀 수 있다면 (1-2)식은 다음과 같아요. 이때 원래의 행렬이 대각행렬로 바뀌었으므로 벡터 x\vec xx1, x2, x3x_1,~ x_2,~ x_3의 성분들도 x1, x2, x3x_1^{\prime},~ x_2^{\prime},~ x_3^{\prime}으로 바뀌었어요.

(a11000a22000a33)(x1x2x3)=λ(x1x2x3)(2-1)\tag{2-1} \begin{pmatrix} {a_{11}}^{\prime} & 0 & 0\\ 0 & {a_{22}}^{\prime} &0 \\ 0 & 0 & {a_{33}}^{\prime} \end{pmatrix} \begin{pmatrix} {x_1}^{\prime}\\ {x_2}^{\prime} \\ {x_3}^{\prime} \end{pmatrix} =\lambda \begin{pmatrix} {x_1}^{\prime}\\ {x_2}^{\prime}\\ {x_3}^{\prime} \end{pmatrix}

그리고 (2-1)식을 전개하면 다음과 같이 대각행렬의 각 성분이 고유값이 된다는 것을 알 수 있습니다.

a11x1=λ1x1a22x2=λ2x2a33x3=λ1x3(2-2)\tag{2-2} \begin{align} &{a_{11}}^{\prime} {x_1}^{\prime} = \lambda_1 {x_1}^{\prime}\\ &{a_{22}}^{\prime} {x_2}^{\prime} = \lambda_2 {x_2}^{\prime}\\ &{a_{33}}^{\prime} {x_3}^{\prime} = \lambda_1 {x_3}^{\prime} \end{align}
a11=λ1a22=λ2a33=λ3(2-3)\tag{2-3} \begin{align} & {a_{11}}^{\prime} = \lambda_1\\ & {a_{22}}^{\prime} = \lambda_2\\ &{a_{33}}^{\prime} = \lambda_3 \end{align}

그렇다면 선현 변환행렬을 어떻게 대각행렬로 바꿀 수 있을까요? 이에 대해서는 아래에 계속 설명드리겠습니다.

고유값 문제 (1-1)을 아래에 다시 쓸게요.

Ax=λx(2-4)\tag{2-4} A \vec x = \lambda \vec x

그리고 이 식을 변형해 볼텐데요.

좌변에서 행렬 AA와 벡터 x\vec x 사이에 직교행렬(orthogonal matrix) MM에 대한 MM1M M^{-1}를 넣어주어도 식은 달라지지 않아요. 그 이유는 MM1M M^{-1}이 단위행렬이 되기 때문이죠.

A(MM1)x=λx(2-5)\tag{2-5} A (M M^{-1}) \vec x = \lambda \vec x

이번에는 위식의 양변 왼쪽에 M1M^{-1}를 곱해주어 보세요. 이때 λ\lambda는 스칼라이므로 곱해지는 행렬과 순서를 바꾸어도 상관없어요.

M1A(MM1)x=λM1x(2-6)\tag{2-6} M^{-1} A (M M^{-1}) \vec x = \lambda M^{-1} \vec x

그리고 곱셈 순서는 바꾸지 말고 결합만 아래와 같이 새롭게 해봐요.

(M1AM)(M1x)=λ(M1x)(2-7)\tag{2-7} (M^{-1} A M )(M^{-1} \vec x) = \lambda (M^{-1} \vec x)

그리고 좌변의 M1AMM^{-1} A MAA^{\prime}으로, M1xM^{-1} \vec x x\vec x^{\prime}로 치환한다면 다음 식처럼 표현됩니다.

Ax=λx(2-8)\tag{2-8} A^{\prime} \vec{x^{\prime}} = \lambda \vec{x^{\prime}}

위 식을 구체적으로 표현한 것이 (2-1)식이 되는거에요.

이때 M1AMM^{-1} A MAA^{\prime}로 변환하는 것을 닮음변환(similarity transformation)이라고 합니다. 여기서 닮음이란 크기는 변하되 모양은 변하지 않는 것을 뜻하는데요. 이것이 선형변환을 의미하는 것으로 보면 좋아요.

일단 형태적으로 (2-8)식은 (2-1)식과 모양이 같지만, 궁금한게 있을 거에요. 정말 (2-8)식의 AA^{\prime}이 (2-1)식처럼 대각행렬이 되느냐 하는 것이죠.

이 말은 선형 변환행렬 AA가 어떤 조건을 가질 때 대각행렬이 되느냐와 같은 질문이에요. 이를 직교 대각화 문제(orthogonal diagonalization problem)라고 불러요.

위 (2-8)식에서 M1AMM^{-1} A MAA^{\prime}으로 치환했는데요. 이 AA^{\prime}이 대각행렬이 될 AA의 조건을 찾고자 해요.

우선 AA^{\prime}이 대각행렬이므로 기호 DD로 바꾸어 표현하겠습니다. 그리고 MM이 직교행렬인데 (1-3)식의 고유벡터들로 구성되었다고 생각해봐요.

그러면 MM은 다음과 같아요.

M=(x1y1z1x2y2z2x3y3z3)(2-9)\tag{2-9} M = \begin{pmatrix} x_1 & y_1 & z_1\\ x_2 & y_2 & z_2 \\ x_3 & y_3 & z_3 \end{pmatrix}

그러면 다음 식이 성립하기 위한 AA의 조건을 살펴보겠습니다.

M1AM=D(2-10)\tag{2-10} M^{-1} A M = D

위식의 양변 왼쪽에 MM을 곱해주고, 오른쪽에 M1M^{-1}을 곱해주면 다음 식이 성립합니다.

M(M1AM)M1=MDM1(2-11)\tag{2-11} \begin{align} M(M^{-1} AM)M^{-1}= MDM^{-1}\\ \end{align}

그러면 좌변은 AA가 되고, 직교행렬은 전치행렬과 역행렬이 같으므로 MT=M1M^T = M^{-1}이 성립하여 아래와 같이 표현할 수 있어요.

A=MDMT(2-12)\tag{2-12} A = MDM^T

그런데 위 식만 보아서는 AA의 필요 조건이 정확히 보이지 않을 거에요. 그래서 이번에는 AA의 전치를 해봐요.

AT=(MDMT)T=(MT)TDTMT(2-13)\tag{2-13} \begin{align} A^T &= (MDM^T)^T\\ &=(M^T)^T D^T M^T \end{align}

이때 DD는 대각행렬이면서 대칭행렬이에요. 그래서 DT=DD^T = D가 성립합니다. 그래서 이 관계를 반영하면 윗 식은 다음과 같아요.

AT=MDMT(2-14)\tag{2-14} \begin{align} A^T = M D M^T \end{align}

그런데 위 (2-14)식을 잘 보면 (2-12)식의 AA와 같아요. 그래서 다음 관계가 성립합니다.

AT=A(2-14)\tag{2-14} A^T = A

이것이 바로 M1AMM^{-1} A M이 대각행렬이 되기 위한 AA의 조건입니다. 이 조건을 만족하는 행렬은 대칭행렬이에요.

정리하면 행렬 AA가 대칭행렬일 때 다음 관계가 성립합니다.

A=M1AM(3-1)\tag{3-1} A^{\prime} = M^{-1} A M

여기서 MM은 고유벡터로 구성된 직교행렬이며, AA^{\prime}은 고유값으로 구성된 대각행렬입니다.

[예제]

어떤 선형 변환행렬이 다음과 같이 주어졌을 때 대각행렬을 구하여 고유값을 구해 보세요.

A=(5222)(4-1)\tag{4-1} A = \begin{pmatrix} 5 & -2\\ -2 & 2 \end{pmatrix}

이 선형 변환행렬의 고유값에 대응하는 고유벡터들은 다음과 같아요.

x=15(21),   y=15(12)(4-2)\tag{4-2} \vec x = {1 \over {\sqrt{5}}} \begin{pmatrix} -2\\ 1 \end{pmatrix} ,~~~ \vec y = {1 \over {\sqrt{5}}} \begin{pmatrix} 1\\ 2 \end{pmatrix}
[Solution]

고유벡터로 구성된 직교행렬 MM을 정의하면 다음과 같습니다. (2-9)식을 적용하면 됩니다.

M=15(2112)(4-3)\tag{4-3} M = {1 \over {\sqrt{5}}} \begin{pmatrix} -2 & 1\\ 1 & 2 \end{pmatrix}

이제 행렬의 대각화 계산을 해봐요. (3-1)식을 적용하면 됩니다.

M1AM=15(2112)(5222)15(2112)=15(2112)(12162)=15(30005)(4-4)\tag{4-4} \begin{align} M^{-1} A M &= {1 \over {\sqrt{5}}} \begin{pmatrix} -2 & 1\\ 1 & 2 \end{pmatrix} \begin{pmatrix} 5 & -2\\ -2 & 2 \end{pmatrix} {1 \over {\sqrt{5}}} \begin{pmatrix} -2 & 1\\ 1 & 2 \end{pmatrix}\\[10pt] &={1 \over 5} \begin{pmatrix} -2 & 1\\ 1 & 2 \end{pmatrix} \begin{pmatrix} -12 & 1\\ 6 & 2\\ \end{pmatrix}\\[10pt] &={1 \over 5} \begin{pmatrix} 30 & 0 \\ 0 & 5 \end{pmatrix} \end{align}

윗 식에서 대각선에 있는 두 값이 고유값에 해당합니다. 그러므로 두 고유값은 다음과 같아요.

λ1=6,   λ2=1(4-5)\tag{4-5} \lambda_1 = 6,~~~\lambda_2 = 1

흥미롭고 도움이 되는 글이었나요? 리뷰를 부탁드립니다.
[Total: 1 Average: 5]

1 thought on “행렬의 대각화”

Leave a Comment