-
내적공간에서 선형변환의 수반변환(Adjoint)수학/선형대수학 2024. 6. 14. 06:36반응형
정의1
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 벡터공간이 $(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$일때
수반변환 :
$(V,+_V,\cdot_V,\vec{0}_V)$에서 $(W,+_W,\cdot_W,\vec{0}_W)$로의 선형변환 $T :V\to W$가
모든 $v\in V$와 모든 $w\in W$에 대해 $\langle T(v),w\rangle_W = \langle v,T^*(w)\rangle_V$가 되는
$(W,+_W,\cdot_W,\vec{0}_W)$에서 $(V,+_V,\cdot_V,\vec{0}_V)$로의 선형변환 $T^* :W\to V$를
$(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T$의 수반변환으로 정의한다.
$(V,+_V,\cdot_V,\vec{0}_V)$가 유한차원이면 아래 정리로 $T$에 대해 $T^*$는 유일하게 존재한다.
수반연산자 :
$(V,+_V,\cdot_V,\vec{0}_V)$의 선형연산자 $T :V\to V$에 대해
$(V,\langle\cdot,\cdot \rangle_V)$와 $(V,\langle\cdot,\cdot \rangle_V)$에서 $T$의 수반변환 $T^*:V\to V$를 $(V,\langle\cdot,\cdot \rangle_V)$에서 $T$의 수반연산자로 정의한다.
정리1
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 $n\in \mathbb{N}$차원인 벡터공간 $(V,+_V,\cdot_V,\vec{0})$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$일때
$(V,+_V,\cdot_V,\vec{0})$에서 $1$-순서쌍 $F$-벡터공간 $(F,+_1,\cdot_1,0)$로의 선형변환 $f : V\to F$는
어떤 $y \in V$가 유일하게 존재하여 모든 $x \in V$에 대해 $f(x) =\langle x,y\rangle_V$이다.
증명
$n = 0$이면 $V = \{ \vec{0}\}$이므로
선형변환 정리와 내적정리로 $\vec{0} \in V$에 대해 모든 $x \in V$는 $f(x) =f(\vec{0})= 0 = \langle \vec{0},\vec{0}\rangle_V =\langle x,\vec{0}\rangle_V$이다.
$n\ge 1$이면
내적공간 정리로 $(V,\langle\cdot,\cdot \rangle_V)$의 정규직교기저 $\{ v_1,v_2,\cdots,v_n\}$이 존재하므로 $\displaystyle y = \sum_{i=1}^n\overline{f(v_i)}\cdot_V v_i$로 둘때
모든 $x \in V$에 대해 $g(x) =\langle x,y\rangle_V$인 함수 $g:V\to F$는
내적의 성질로 $(V,+_V,\cdot_V,\vec{0})$에서 $(F,+_1,\cdot_1,0)$로의 선형변환이고
$(V,\langle\cdot,\cdot \rangle_V)$의 노름이 $\lVert \cdot\rVert_V : V\to [0,\infty)$일때
모든 $j = 1,2,\cdots,n$에 대해 내적정리와 정규직교집합의 정의와 복소수 정리로
$\begin{align*} g(v_j) &=\langle v_j,y\rangle_V\\[0.5em] &= \left\langle v_j, \sum_{i=1}^n\overline{f(v_i)}\cdot_Vv_i\right\rangle_V \\[0.5em]&= \sum_{i=1}^n\overline{\overline{f(v_i)}}\cdot \langle v_j, v_i\rangle_V \\[0.5em]&= \sum_{i=1}^nf(v_i)\cdot \langle v_j, v_i\rangle_V \\[0.5em]&=f(v_j)\cdot \langle v_j, v_j\rangle_V \\[0.5em]&=f(v_j)\cdot \lVert v_j\rVert_V^2 \\[0.5em]&=f(v_j) \text{ 가 되어} \end{align*}$
선형변환 정리로 $f = g$이므로 모든 $x \in V$에 대해 $f(x) =g(x)=\langle x,y\rangle_V$인 $\displaystyle y = \sum_{i=1}^n\overline{f(v_i)}\cdot_V v_i$가 존재한다.
또 모든 $x \in V$에 대해 $\langle x,y_1\rangle_V =f(x) =\langle x,y_2\rangle_V$인 $y_1,y_2\in V$가 존재하면 내적정리로 $y_1 = y_2$이다.
정리2
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 벡터공간이 $(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$일때
$(V,+_V,\cdot_V,\vec{0}_V)$에서 $(W,+_W,\cdot_W,\vec{0}_W)$로의 선형변환 $T :V\to W$에 대해 다음이 성립한다.
1. $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T$의 수반변환 $T^* :W\to V$가 존재하면 유일하다.
2. $(V,+_V,\cdot_V,\vec{0}_V)$가 유한차원이면 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T$의 수반변환 $T^* :W\to V$가 존재한다.
3. $(V,\langle\cdot,\cdot \rangle_V)$에서 $(V,+_V,\cdot_V,\vec{0}_V)$의 항등변환 $I_V : V\to V$의 수반연산자 $I_V^*:V\to V$가 존재하고 $I_V^* =I_V$이다.
증명
1.
모든 $v\in V$에 대해 모든 $w\in W$에 대해
$ \langle v,U_1(w)\rangle_V= \langle T(v),w\rangle_W = \langle v,U_2(w)\rangle_V$인 함수 $U_1,U_2:W\to V$가 존재하면
$ \langle v,U_1(w)\rangle_V= \langle v,U_2(w)\rangle_V$이므로 내적정리로 $U_1(w) = U_2(w)$가 되어 함수의 상등으로 $U_1 = U_2$이다.
따라서 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T$의 수반변환 $T^* :W\to V$가 존재하면 유일하다.
2.
모든 $v\in V$에 대해 모든 $w\in W$에 대해
$f_w(v) =\langle T(v),w\rangle_W$인 함수가 $f_w :V\to F$이고 $1$-순서쌍 $F$-벡터공간이 $(F,+_1,\cdot_1,0)$일때
임의의 $v_1,v_2\in V$와 임의의 $c \in F$에 대해 선형변환의 정의와 내적의 정의로
$\begin{align*}f_w(c\cdot_Vv_1+_Vv_2) & = \langle T(c\cdot_Vv_1 +_Vv_2),w\rangle_W \\[0.5em]&= \langle c\cdot_W T(v_1) +_W T(v_2),w\rangle_W \\[0.5em]&=c\cdot \langle T(v_1),w\rangle_W +\langle T(v_2),w\rangle_W \\[0.5em]&=c\cdot f_w(v_1) +f_w(v_2) \\[0.5em]&=c\cdot_1f_w(v_1)+_1f_w(v_2) \text{ 이므로}\end{align*}$
선형변환 정리로 $f_w$는 $(V,+_V,\cdot_V,\vec{0}_V)$에서 $(F,+_1,\cdot_1,0)$로의 선형변환이고 $(V,+_V,\cdot_V,\vec{0}_V)$가 유한차원임에 따라
위 정리로 어떤 $T^*(w) \in V$가 유일하게 존재하여 모든 $v \in V$에 대해 $f_w(v) = \langle v, T^*(w)\rangle_V$이므로
함수정리로 $\langle T(v),w\rangle_W=f_w(v) = \langle v, T^*(w)\rangle_V$인 함수 $T^*:W\to V$가 존재한다.
또 임의의 $w_1,w_2\in W$와 임의의 $c \in F$에 대해 내적정리로
$\begin{align*}\langle v, T^*(c\cdot_W w_1+_Ww_2)\rangle_V &= \langle T(v),c\cdot_W w_1+_W w_2\rangle_W\\[0.5em]& = \overline{c}\cdot \langle T(v),w_1\rangle_W +\langle T(v),w_2\rangle_W \\[0.5em]& =\overline{c}\cdot \langle v,T^*(w_1)\rangle_V +\langle v,T^*(w_2)\rangle_V \\[0.5em] &= \langle v,c\cdot_V T^*(w_1) +_V T^*(w_2)\rangle_V \text{ 이므로} \end{align*}$
내적정리로 $T^*(c\cdot_W w_1 +_W w_2) = c\cdot_V T^*(w_1)+_V T^*(w_2)$가 되어
선형변환 정리로 $T^*$는 $(W,+_W,\cdot_W,\vec{0}_W)$에서 $(V,+_V,\cdot_V,\vec{0}_V)$로의 선형변환이고
$(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T$의 수반변환이다.
3.
모든 $x,y\in V$에 대해 $\langle I_V(x),y\rangle_V=\langle x,y\rangle_V = \langle x,I_V(y)\rangle_V$이므로
1번으로 $(V,\langle\cdot,\cdot \rangle_V)$에서 $I_V $의 수반연산자 $I_V^*$는 $I_V^* =I_V$이다.
정리3
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 벡터공간이 $(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$일때
$(V,+_V,\cdot_V,\vec{0}_V)$에서 $(W,+_W,\cdot_W,\vec{0}_W)$로의 선형변환 $T :V\to W$에 대해
$(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T$의 수반변환 $T^* :W\to V$가 존재하면 다음이 성립한다.
1. 모든 $w\in W$와 모든 $v\in V$에 대해 $\langle w,T(v)\rangle_W = \langle T^*(w),v\rangle_V $이다
2. 임의의 $v\in V$에 대해 $(T^* \,$$\circ$ $ T)(v) = \vec{0}_V$이기 위한 필요충분조건은 $T(v) = \vec{0}_W$인 것이다.
3. $N(T^*\circ T) = $ $N(T)$
4. $\underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp}$ $ = N(T)$
증명
1.
수반변환의 정의와 내적의 정의로 $\langle w,T(v)\rangle_W = \overline{\langle T(v),w\rangle_W} =\overline{\langle v,T^*(w)\rangle_V} = \langle T^*(w),v\rangle_V $이다.
2.
$(T^*\circ T)(v) = \vec{0}_V$이면 $(W,\langle\cdot,\cdot \rangle_W)$의 노름 $\lVert \cdot\rVert_W : W\to [0,\infty)$에 대해
1번과 내적정리로 $\lVert T(v)\rVert^2_W = \langle T(v),T(v)\rangle_W = \langle T^*(T(v)),v\rangle_V =\langle (T^*\circ T)(v),v\rangle_V = \langle \vec{0}_V,v\rangle_V = 0$이 되어
$\lVert T(v)\rVert = 0$이므로 노름정리로 $T(v) = \vec{0}_W$이다.
역으로 $T(v) = \vec{0}_W$이면 선형변환 정리로 $(T^*\circ T)(v) =T^*(T(v)) = T^*(\vec{0}_W) = \vec{0}_V$이다.
3.
선형변환 정리로 $T^* \circ T : V\to V$는 $(V,+_V,\cdot_V,\vec{0}_V)$의 선형연산자이므로
핵의 정의와 2번으로 $N(T^*\circ T) = \{ v\in V : (T^*\circ T)(v) = \vec{0}_V\} = \{ v\in V: T(v) = \vec{0}_W\} = N(T)$이다.
4.
임의의 $w \in W$에 대해 $T^*(w) \in T^*(W)=R(T^*)$이므로
모든 $v \in \underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp}$는 수반변환의 정의와 내적정리로 $\langle\vec{0}_W,w\rangle_W =0 = \langle v,T^*(w)\rangle_V = \langle T(v),w\rangle_W$이고
내적정리로 $T(v) = \vec{0}_W$가 되어 $v \in N(T)$이므로 $\underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp}\subseteq N(T)$이다.
또 모든 $v \in N(T)$는 $\langle v,T^*(w)\rangle_V =\langle T(v),w\rangle_W =\langle \vec{0}_W,w\rangle_W =0$이므로 $v \in \underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp}$이고
$N(T)\subseteq \underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp}$가 되어 집합정리로 $\underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp}=N(T)$이다.
정리4
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 벡터공간 $(V,+_V,\cdot_V,\vec{0}_V),(W,+_W,\cdot_W,\vec{0}_W),(Z,+_Z,\cdot_Z,\vec{0}_Z)$위의
내적공간이 $(V,\langle\cdot,\cdot \rangle_V),(W,\langle\cdot,\cdot \rangle_W),(Z,\langle\cdot,\cdot\rangle_Z)$일때
선형변환 $T: V\to W$와 $U : W\to Z$의 수반변환 $T^* : W\to V$와 $U^* : Z\to W$가 존재하면
합성함수 $U \circ T : V\to Z$의 수반변환 $(U\circ T)^*:Z\to V$가 존재하고 $(U\circ T)^* = T^*\circ U^*$이다.
증명
선형변환 정리로 $U \circ T $는 $(V,+_V,\cdot_V,\vec{0}_V)$에서 $(Z,+_Z,\cdot_Z,\vec{0}_Z)$로의 선형변환이고
임의의 $v\in V$와 임의의 $z\in Z$에 대해 수반변환의 정의로
$\begin{align*}\langle (U\circ T)(v),z\rangle_Z = \langle U(T(v)),z\rangle_Z = \langle T(v),U^*(z)\rangle_W =\langle v,T^*(U^*(z))\rangle_V =\langle v,(T^*\circ U^*)(z)\rangle_V \end{align*}$이므로
$T^*\circ U^* : Z\to V$는 $(V,\langle\cdot,\cdot \rangle_V)$와 $(Z,\langle\cdot,\cdot \rangle_Z)$에서 $U \circ T $의 수반변환이 되어 위 정리로 $(U\circ T)^* = T^*\circ U^*$이다.
정리5
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 벡터공간이 $(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$일때
선형변환 $F$-벡터공간 $(L(V\to W),+_1,\cdot_1,\vec{0}_1)$와 $(L(W\to V),+_2,\cdot_2,\vec{0}_2)$에 대해 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서
임의의 $T,U\in L(V\to W)$의 수반변환 $T^*,U^* \in L(W\to V)$가 존재하면 다음이 성립한다.
1. $(T+_1 U)^* = T^* +_2 U^*$
2. 임의의 $c \in F$에 대해 $(c\cdot_1 T)^* = \overline{c}\cdot_2 T^*$이다.
3. $(T^*)^* = T$
5. $T$와 $T^*$가 가역이면 $T$와 $T^*$의 역함수 $T^{-1} : W\to V$과 $(T^*)^{-1}:V\to W$에 대해
$(W,\langle\cdot,\cdot \rangle_W)$와 $(V,\langle\cdot,\cdot \rangle_V)$에서 $T^{-1}$의 수반변환 $(T^{-1})^* : V\to W$가 존재하고 $(T^{-1})^* = (T^*)^{-1}$이다.
증명
1.
임의의 $v\in V$와 임의의 $w\in W$에 대해 내적의 정의와 수반변환의 정의로
$\begin{align*}\langle (T+_1 U)(v),w\rangle_W &= \langle T(v) +_W U(v),w\rangle_W \\[0.5em] & = \langle T(v),w\rangle_W+\langle U(v),w\rangle_W \\[0.5em]& =\langle v,T^*(w)\rangle_V + \langle v,U^*(w)\rangle_V \\[0.5em]& =\langle v,T^*(w)+_V U^*(w)\rangle_V \\[0.5em] & = \langle v,(T^*+_2U^*)(w)\rangle_V \text{ 이므로}\end{align*}$
$T^* +_2 U^*\in L(W\to V)$는 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $T+_1U\in L(V\to W)$의 수반변환이 되어
위 정리로 $(T+_1 U)^* = T^* +_2 U^*$이다.
2.
임의의 $v\in V$와 임의의 $w\in W$에 대해 내적정리와 수반변환의 정의로
$\begin{align*}\langle (c\cdot_1 T)(v),w\rangle_W &= \langle c\cdot_VT(v) ,w\rangle_W \\[0.5em] & = c\cdot \langle T(v),w\rangle_W \\[0.5em]& =c\cdot \langle v,T^*(w)\rangle_V \\[0.5em]& =\langle v,\overline{c}\cdot T^*(w)\rangle_V \\[0.5em] & = \langle v,(\overline{c}\cdot_2T^*)(w)\rangle_V \text{ 이므로}\end{align*}$
$\overline{c}\cdot_2T^* \in L(W\to V)$는 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$에서 $c\cdot_1T\in L(V\to W)$의 수반변환이 되어
위 정리로 $(c\cdot_1 T)^* = \overline{c}\cdot_2 T^*$이다.
3.
임의의 $w\in W$와 임의의 $v\in V$에 대해 위 정리로 $\begin{align*}\langle T^*(w),v\rangle_V &= \langle w,T(v) \rangle_W \end{align*}$이므로
$T \in L(V\to W)$는 $(W,\langle\cdot,\cdot \rangle_W)$와 $(V,\langle\cdot,\cdot \rangle_V)$에서 $T^*\in L(W\to V)$의 수반변환이 되어
위 정리로 $(T^*)^* = T$이다.
4.
전사의 정의로 모든 $w \in W$에 대해 $T(v) = w$인 $v \in V$가 존재하여
$T^*(w_1) = T^*(w_2)$인 임의의 $w_1,w_2\in W$는 수반변환의 정의로
$\langle w,w_1\rangle_W =\langle T(v), w_1\rangle_W= \langle v,T^*(w_1)\rangle_V = \langle v,T^*(w_2)\rangle_V = \langle T(v),w_2\rangle_W = \langle w,w_2\rangle_W$이므로
내적정리로 $w_1 = w_2$이고 $T^*$는 단사이다.
5.
$T^{-1}$은 선형변환 정리로 $(W,+_W,\cdot_W,\vec{0}_W)$에서 $(V,+_V,\cdot_V,\vec{0}_V)$로의 선형변환이므로
역함수의 정의와 수반변환의 정의로 모든 $v\in V$와 모든 $w\in W$에 대해
$\langle T^{-1}(w), v\rangle_V = \langle T^{-1}(w) , T^*((T^*)^{-1}(v))\rangle_V = \langle T(T^{-1}(w)),(T^*)^{-1}(v)\rangle_W = \langle w,(T^*)^{-1}(v)\rangle_W$가 되어
$(T^{*})^{-1}$은 $(W,\langle\cdot,\cdot \rangle_W)$와 $(V,\langle\cdot,\cdot \rangle_V)$에서 $T^{-1}$의 수반변환이고 위 정리로 $(T^{-1})^* = (T^*)^{-1}$이다.
정리6
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 벡터공간이 $(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$일때
$(V,+_V,\cdot_V,\vec{0}_V)$가 유한차원이고 선형변환 $T:V\to W$의 수반변환이 $T^*:W\to V$이면 다음이 성립한다.
1. $T$가 가역이면 $T^*$도 가역이고 $(T^*)^{-1} = (T^{-1})^*$이다.
2. $\underset{(V,\langle\cdot,\cdot\rangle_V)}{N(T)^\perp}$ $ = $ $R(T^*)$
3. $\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T^*\circ T)} = $ $\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)}$
4. $\underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T^*)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)}$
5. $T$가 단사이면 $T^* $ $\circ$ $ T : V\to V$는 가역이다.
6. $(W,+_W,\cdot_W,\vec{0}_W)$가 유한차원이면 $\underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T\circ T^*)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)}$이다.
7. $(W,+_W,\cdot_W,\vec{0}_W)$가 유한차원일때 $T$가 전사이면 $T\circ T^* : W\to W$는 가역이다.
증명
1.
$T$가 가역이므로 역함수 정리로 $T$는 전단사가 되어 위 정리로 $T^*$는 단사이고
선형변환 정리로 $\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(V)}= \underset{(W,+_W,\cdot_W,\vec{0}_W)}{\dim(W)}$이므로 선형변환 정리로 $T^*$는 전사가 되어
역함수 정리로 $T^*$의 역함수 $(T^*)^{-1}:V\to W$이 존재하고 위 정리로 $(T^*)^{-1} = (T^{-1})^*$이다.
2.
상공간의 정의로 $(R(T^*),+_V,\cdot_V,\vec{0}_V)$는 $(V,+_V,\cdot_V,\vec{0}_V)$의 부분공간이므로
부분공간 정리로 $(R(T^*),+_V,\cdot_V,\vec{0}_V)$는 유한차원이 되어
위 정리와 직교여공간 정리로 $R(T^*) = (\underset{(V,\langle\cdot,\cdot\rangle_V)}{\underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)}}^\perp)^\perp =\underset{(V,\langle\cdot,\cdot\rangle_V)}{N(T)^\perp}$이다.
3.
$T$의 수반변환 $T^*$는 $(W,+_W,\cdot_W,\vec{0}_W)$에서 $(V,+_V,\cdot_V,\vec{0}_V)$로의 선형변환이므로
선형변환 정리로 $T^*\circ T : V\to V$는 $(V,+_V,\cdot_V,\vec{0}_V)$의 선형연산자가 되어
차원정리로 $\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T)} + \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)} =\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(V)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T^*\circ T)} + \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T^*\circ T)} $이고
위 정리로 $\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T)} =\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(N(T))} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(N(T^*\circ T))} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T^*\circ T)} $이므로
$ \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T^*\circ T)} $이다.
4.
상공간의 정의로 $(R(T^*),+_V,\cdot_V,\vec{0}_V)$는 $(V,+_V,\cdot_V,\vec{0}_V)$의 부분공간이므로
부분공간 정리로 $(R(T^*),+_V,\cdot_V,\vec{0}_V)$는 유한차원이 되어 위 정리와 직교여공간 정리와 차원정리로
$\begin{align*} \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)}+\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T)}= \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(V)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(R(T^*))} +\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(\underset{(V,\langle\cdot,\cdot\rangle_V)}{R(T^*)^\perp})} = \underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T^*)}+\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(N(T))} = \underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T^*)}+\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T)} \text{ 이고}\end{align*}$
$\underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T^*)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)}$이다.
5.
$T$가 단사이면 선형변환 정리와 차원의 정의로 $\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T)} = 0$이 되어
차원정리와 3번으로 $ \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\dim(V)}= \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}( T)} +\underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{nullity}(T)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)} = \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T^*\circ T)}$이므로
선형변환 정리로 $T^*\circ T$는 가역이다.
6.
위 정리로 $T^*$의 수반변환은 $T$이므로 3, 4번으로 $\underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T\circ T^*)} = \underset{(W,+_W,\cdot_W,\vec{0}_W)}{\operatorname{rank}(T^*)}= \underset{(V,+_V,\cdot_V,\vec{0}_V)}{\operatorname{rank}(T)}$이다.
7.
$T$가 전사이면 위 정리로 $T^*$는 단사이고 $(T^*)^* = T$이므로 5번으로 $T\circ T^* = (T^*)^*\circ T^*$는 가역이다.
정리7
실수체 또는 복소수체 $(F,+,\cdot,0,1)$위의 $n,m\in \mathbb{Z}^+$차원인 벡터공간이 $(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$와 $(W,+_W,\cdot_W,\vec{0}_W)$위의 내적공간이 $(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$일때
$(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$의 정규직교순서기저가 $\beta = (v_1,v_2,\cdots,v_n)$와 $\gamma = (w_1,w_2,\cdots,w_m)$이고
$(V,+_V,\cdot_V,\vec{0}_V)$에서 $(W,+_W,\cdot_W,\vec{0}_W)$로의 선형변환 $T:V\to W$의 수반변환이 $T^*:W\to V$이면
$\beta,\gamma$에 대한 $T$의 행렬표현 $[T]_\beta^\gamma\in M_{m\times n}(F)$의 켤레전치행렬은 $([T]_\beta^\gamma)^* = [T^*]_\gamma^\beta$이다.
증명
행렬표현의 정의로 임의의 $i = 1,2,\cdots, m$와 임의의 $j = 1,2,\cdots, n$에 대해
$\begin{align*}T(v_j) = \sum_{k=1}^m([T]_\beta^\gamma)_{k,j}\cdot_Ww_k\end{align*}$와 $\begin{align*}T^*(w_i) = \sum_{k=1}^n([T^*]_\gamma^\beta)_{k,i}\cdot_Vv_k\end{align*}$가 성립하여
$(V,\langle\cdot,\cdot \rangle_V)$와 $(W,\langle\cdot,\cdot \rangle_W)$의 노름 $\lVert\cdot\rVert_V :V\to [0,\infty)$와 $\lVert\cdot\rVert_W :W\to [0,\infty)$에 대해
$\begin{align*} \langle T(v_j),w_i\rangle_W & = \left\langle \sum_{k=1}^m([T]_\beta^\gamma)_{k,j}\cdot_W w_k,w_i \right\rangle_W \\[0.5em] & = \sum_{k=1}^m([T]_\beta^\gamma)_{k,j}\cdot \langle w_k,w_i \rangle_W \\[0.5em] &= ([T]_\beta^\gamma)_{i,j}\cdot \langle w_i,w_i \rangle_W \\[0.5em] &= ([T]_\beta^\gamma)_{i,j}\cdot \lVert w_i \rVert_W^2 \\[0.5em] & = ([T]_\beta^\gamma)_{i,j} \text{ 이고}\end{align*}$
$\begin{align*} \langle v_j,T^*(w_i)\rangle_V &= \left\langle v_j ,\sum_{k=1}^n([T^*]_\gamma^\beta)_{k,i}\cdot_Vv_k \right\rangle_V \\[0.5em] & = \sum_{k=1}^n \overline{([T^*]_\gamma^\beta)_{k,i}}\cdot \langle v_j ,v_k \rangle_V \\[0.5em] & = \overline{([T^*]_\gamma^\beta)_{j,i}}\cdot \langle v_j ,v_j \rangle_V \\[0.5em] & = \overline{([T^*]_\gamma^\beta)_{j,i}}\cdot \lVert v_j \rVert_V^2 \\[0.5em] & = \overline{([T^*]_\gamma^\beta)_{j,i}} \\[0.5em]&=\overline{(([T^*]_\gamma^\beta)^t)_{i,j}} \\[0.5em] &=(\overline{([T^*]_\gamma^\beta)^t})_{i,j} \\[0.5em] & = (([T^*]_\gamma^\beta)^*)_{i,j} \text{ 이므로}\end{align*}$
수반변환의 정의로 $([T]_\beta^\gamma)_{i,j} = \langle T(v_j),w_i\rangle_W = \langle v_j,T^*(w_i)\rangle_V =(([T^*]_\gamma^\beta)^*)_{i,j}$가 되어
행렬의 상등으로 $[T]_\beta^\gamma = ([T^*]_\gamma^\beta)^*$이고 켤레전치행렬 정리로 $([T]_\beta^\gamma)^* = (([T^*]_\gamma^\beta)^*)^* = [T^*]_\gamma^\beta$이다.
정리8
실수체 또는 복소수체 $(F,+,\cdot,0,1)$의 행렬 $A \in M_{m\times n}(F)$의 좌측곱변환이 $L_A:M_{n\times 1}(F)\to M_{m\times 1}(F)$일때
행렬 $F$-벡터공간 $(M_{n\times 1}(F),+_n,\cdot_n,O_n)$과 $(M_{m\times 1}(F),+_m,\cdot_m,O_m)$위의
행렬 내적공간 $(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)$과 $(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)$에서 $L_A$의 수반변환 $L_A^*:M_{m\times 1}(F)\to M_{n\times 1}(F)$와
$A$의 켤레전치행렬 $A^*\in M_{n\times m}(F)$와 행렬곱 $\bullet$에 대해 다음이 성립한다.
1. 행렬정리에 나온 $(M_{n\times 1}(F),+_n,\cdot_n,O_n)$의 순서기저 $\beta$는 $(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)$의 정규직교순서기저이다.
2. $A^*$의 좌측곱변환 $L_{A^*}:M_{m\times 1}(F)\to M_{n\times 1}(F)$에 대해 $L_A^* = L_{A^*}$이다.
3. $\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A^*\bullet A)} =$ $\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)}$ $=\underset{(M_{m\times 1}(F),+_m,\cdot_m,O_m)}{\operatorname{rank}(A\bullet A^*)}$
4. $\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)} = n$이면 $A^*\bullet A\in M_{n\times n}(F)$는 가역이다.
5. 임의의 $x\in M_{n\times 1}(F)$와 임의의 $y\in M_{m\times 1}(F)$에 대해 $\langle A\bullet x,y\rangle_m = \langle x,A^*\bullet y\rangle_n$이다.
6. 임의의 $x\in M_{n\times 1}(F)$와 임의의 $y\in M_{m\times 1}(F)$에 대해 $\langle A^*\bullet y,x\rangle_n = \langle y,A\bullet x\rangle_m$이다.
7. 임의의 $i,j = 1,2,\cdots, n$에 대해 $a_j = \begin{bmatrix} A_{1,j}\\A_{2,j} \\ \vdots \\ A_{m,j}\end{bmatrix} \in M_{m\times 1}(F)$일때 $(A^*\bullet A)_{i,j} = \langle a_j,a_i\rangle_m$이다.
8. $A^*\bullet A$가 대각행렬이기 위한 필요충분조건은 $i\ne j$인 모든 $i,j = 1,2,\cdots, n$에 대해 $\langle a_j,a_i\rangle_m =0$인 것이다.
증명
1.
$\beta = (e_1,e_2,\cdots, e_n)$일때
$(F,+,\cdot,0,1)$의 크로네커델타 $\delta$는 임의의 $i,j = 1,2,\cdots, n$에 대해 $\delta_{i,j} \in \mathbb{R}$이므로 복소수 정리로
$\begin{align*} \langle e_i,e_j\rangle_n & = (e_j^*\bullet e_i)_{1,1} \\[0.5em] & = \left (\begin{bmatrix} \delta_{1,j}\\\delta_{2,j} \\ \vdots \\ \delta_{n,j} \end{bmatrix}^* \bullet \begin{bmatrix} \delta_{1,i}\\ \delta_{2,i} \\ \vdots \\ \delta_{n,i}\end{bmatrix}\right )_{1,1} \\[0.5em] & = \left (\begin{bmatrix} \overline{\delta_{1,j}}& \overline{\delta_{2,j}} & \cdots & \overline{\delta_{n,j}} \end{bmatrix} \bullet \begin{bmatrix} \delta_{1,i}\\ \delta_{2,i} \\ \vdots \\ \delta_{n,i}\end{bmatrix}\right )_{1,1} \\[0.5em] &= \sum_{k=1}^n \overline{\delta_{k,i}}\cdot \delta_{k,j} \\[0.5em] &= \sum_{k=1}^n \delta_{k,i}\cdot \delta_{k,j} \\[0.5em] &= \delta_{i,i}\cdot \delta_{i,j} \\[0.5em] &= 1 \cdot \delta_{i,j} \\[0.5em] &= \delta_{i,j} \text{ 가 되어} \end{align*}$
정규직교 정리로 $\beta$는 $(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)$의 정규직교순서기저이다.
2.
1번에 나온 $(M_{n\times 1}(F),+_n,\cdot_n,O_n)$와 $(M_{m\times 1}(F),+_m,\cdot_m,O_m)$의 정규직교순서기저가 $\beta$와 $\gamma$일때
위 정리와 좌측곱변환 정리로 $[L_{A^*}]_\gamma^\beta = A^* = ([L_A]_\beta^\gamma)^* = [L_A^*]_\gamma^\beta$이므로
행렬표현 정리로 선형변환의 행렬표현이 전단사임에 따라 $L_A^* = L_{A^*}$이다.
3.
행렬정리로 $(M_{n\times 1}(F),+_n,\cdot_n,O_n)$와 $(M_{m\times 1}(F),+_m,\cdot_m,O_m)$는 유한차원이므로
함수의 합성 $\circ$에 대해 위 정리와 행렬의 랭크의 정의와 좌측곱변환 정리와 2번으로
$\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A^*\bullet A)} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(L_{A^*\bullet A})} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(L_{A^*} \circ L_A)} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(L_{A}^* \circ L_A)} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(L_A)} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)} \text{ 이고}$
$\underset{(M_{m\times 1}(F),+_m,\cdot_m,O_m)}{\operatorname{rank}(A\bullet A^*)} = \underset{(M_{m\times 1}(F),+_m,\cdot_m,O_m)}{\operatorname{rank}(L_{A\bullet A^*})} = \underset{(M_{m\times 1}(F),+_m,\cdot_m,O_m)}{\operatorname{rank}(L_{A} \circ L_{A^*})} = \underset{(M_{m\times 1}(F),+_m,\cdot_m,O_m)}{\operatorname{rank}(L_{A} \circ L_A^*)} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(L_A)} = \underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)} \text{ 이므로}$
$\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A^*\bullet A)} =\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)}=\underset{(M_{m\times 1}(F),+_m,\cdot_m,O_m)}{\operatorname{rank}(A\bullet A^*)}$이다.
4.
3번으로 $\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A^*\bullet A)} =\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)}=n$이므로 행렬의 랭크 정리로 $A^*\bullet A\in M_{n\times n}(F)$는 가역이다.
5.
$A\bullet x \in M_{m\times 1}(F)$이고 $A^*\bullet y\in M_{n\times 1}(F)$이므로 행렬내적공간의 정의와 켤레전치행렬 정리로
$\langle A\bullet x,y\rangle_m = (y^*\bullet (A\bullet x))_{1,1} = ((y^*\bullet A)\bullet x)_{1,1} = (((y^*\bullet A)^*)^*\bullet x)_{1,1} =((A^* \bullet (y^*)^*)^*\bullet x)_{1,1} = ((A^*\bullet y)^*\bullet x)_{1,1} = \langle x,A^*\bullet y\rangle_n \text{ 이다.}$
6.
2번과 위 정리로 $\langle A^*\bullet y,x\rangle_n = \langle L_{A^*}(y),x\rangle_n = \langle L_A^*(y),x\rangle_n = \langle y,L_A(x)\rangle_m = \langle y,A\bullet x\rangle_m$이다.
7.
임의의 $i ,j = 1,2,\cdots,n$에 대해 행렬내적공간의 정의와 켤레전치행렬의 정의로
$\begin{align*} \langle a_j,a_i\rangle_m & = (a_i^* \bullet a_j)_{1,1} \\[0.5em] & = \left (\begin{bmatrix} A_{1,i}\\A_{2,i} \\ \vdots \\ A_{m,i} \end{bmatrix}^* \bullet \begin{bmatrix} A_{1,j}\\ A_{2,j} \\ \vdots \\ A_{m,j}\end{bmatrix}\right )_{1,1} \\[0.5em] &= \left(\begin{bmatrix} \overline{A_{1,i}} & \overline{A_{2,i}}&\cdots & \overline{A_{m,i}} \end{bmatrix} \bullet \begin{bmatrix} A_{1,j}\\ A_{2,j} \\ \vdots \\ A_{m,j}\end{bmatrix} \right )_{1,1} \\[0.5em] &= \sum_{k=1}^m \overline{A_{k,i}}\cdot A_{k,j} \\[0.5em] &= \sum_{k=1}^m \overline{(A^t)_{i,k}}\cdot A_{k,j} \\[0.5em] &= \sum_{k=1}^m (\overline{A^t})_{i,k}\cdot A_{k,j} \\[0.5em] &= \sum_{k=1}^m (A^*)_{i,k}\cdot A_{k,j} \\[0.5em] &= (A^*\bullet A)_{i,j} \text{ 이다.} \end{align*} $
8.
7번과 대각행렬의 정의로 정리가 성립한다.
정리9(최소 제곱법[least square approximation])
실수체 또는 복소수체 $(F,+,\cdot,0,1)$의 행렬이 $A \in M_{m\times n}(F)$이고 임의의 열벡터가 $y \in M_{m\times 1}(F)$일때
행렬 $F$-벡터공간 $(M_{m\times 1}(F),+_m,\cdot_m,O_m)$위의 행렬 내적공간이 $(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)$이면
$(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)$의 노름 $\lVert \cdot\lVert_m:M_{m\times 1}(F)\to [0,\infty)$과 행렬곱 $\bullet$와 $A$의 켤레전치행렬 $A^* \in M_{n\times m}(F)$에 대해
어떤 $x_0 \in M_{n\times 1}(F)$이 존재하여 $A^*\bullet A\bullet x_0 = A^*\bullet y$이고
모든 $x \in M_{n\times 1}(F)$에 대해 $\lVert A\bullet x_0-y\rVert_m \le \lVert A\bullet x-y\rVert_m$이 성립한다.
이때 $\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)}$ $=n$이면 $x_0 = (A^*\bullet A)^{-1}\bullet A^*\bullet y$이다.
증명
$A$의 좌측곱변환 $L_A : M_{n\times 1}(F) \to M_{m\times 1}(F)$에 대해
상공간 $(R(L_A),+_m,\cdot_m,O_m)$는 $(M_{m\times 1}(F),+_m,\cdot_m,O_m)$의 부분공간이므로 부분공간 정리로
직교여공간 $(\underset{(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)}{R(L_A)^\perp},+_m,\cdot_m,O_m)$도 $(M_{m\times 1}(F),+_m,\cdot_m,O_m)$의 부분공간이다.
직교여공간 정리로 $y = u+_m z$인 $u \in R(L_A) $와 $z\in \underset{(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)}{R(L_A)^\perp}$가 존재하고
모든 $v \in R(L_A)$에 대해 $\lVert y - u\rVert_m \le \lVert y -v\lVert_m $이므로 치역의 정의로 $R(L_A)=L_A(M_{n\times 1}(F))$에 대해
$u = A\bullet x_0$인 $x_0\in M_{n\times 1}(F)$이 존재하고 모든 $x\in M_{n\times 1}(F)$에 대해 $A\bullet x\in L_A(M_{n\times 1}(F))=R(L_A)$임에 따라
노름정리로 $\lVert A\bullet x_0 - y\rVert_m=\lVert y - A\bullet x_0\rVert_m \le \lVert y -A\bullet x\lVert_m = \lVert A\bullet x-y\rVert_m$이다.
$(A\bullet x_0) +_m (y - (A\bullet x_0)) = y = u+_m z = (A\bullet x_0) +_m z$이므로 $y - (A\bullet x_0) = z\in \underset{(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)}{R(L_A)^\perp}$가 되어
벡터공간의 정의로 $(A\bullet x_0) -y=-(y - (A\bullet x_0)) \in \underset{(M_{m\times 1}(F),\langle\cdot,\cdot\rangle_m)}{R(L_A)^\perp}$이고 직교여공간의 정의와 위 정리로
모든 $x\in M_{n\times 1}(F)$에 대해 $\langle x,O_n\rangle_n = 0=\langle A\bullet x, (A\bullet x_0) -y\rangle_m =\langle x,A^*\bullet ((A\bullet x_0) - y)\rangle_n$이므로
내적정리와 행렬정리로 $A^*\bullet A\bullet x_0 - A^*\bullet y = A^*\bullet ((A\bullet x_0) - y) =O_n$이 되어 $A^*\bullet A\bullet x_0 = A^*\bullet y$이다.
또 $\underset{(M_{n\times 1}(F),+_n,\cdot_n,O_n)}{\operatorname{rank}(A)} =n$이면 위 정리로 $A^*\bullet A$는 가역이므로 $x_0 = (A^*\bullet A)^{-1}\bullet A^*\bullet y$이다.
정리10(연립일차방정식의 최소해)
실수체 또는 복소수체 $(F,+,\cdot,0,1)$의 행렬이 $A \in M_{m\times n}(F)$이고 임의의 열벡터가 $b \in M_{m\times 1}(F)$일때
행렬곱 $\bullet$에 대해 연립일차방정식의 해집합 $K =\{ x\in M_{n\times 1}(F): A\bullet x = b\}$가 $K\ne \emptyset$이고
행렬 $F$-벡터공간 $(M_{n\times 1}(F),+_n,\cdot_n,O_n)$위의 행렬내적공간이 $(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)$이면
$(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)$의 노름 $\lVert\cdot\rVert_n:M_{n\times 1}(F)\to [0,\infty)$과
$A$의 켤레전치행렬 $A^* \in M_{n\times m}(F)$의 좌측곱변환 $L_{A^*}:M_{m\times 1}(F)\to M_{n\times 1}(F)$에 대해 다음이 성립한다.
1. 어떤 $s\in K$가 유일하게 존재하여 모든 $u\in K$에 대해 $\lVert s\rVert_n\le \lVert u\rVert_n$이다.
2. 1번의 $s$는 $L_{A^*}$의 치역 $R(L_{A^*})$에 대해 $R(L_{A^*})\cap K = \{ s\}$이다.
3. 1번의 $s$는 $A\bullet A^*\bullet z =b$인 임의의 $z \in M_{m\times 1}(F)$에 대해 $s = A^*\bullet z$이다.
증명
상공간 $(R(L_{A^*}),+_n,\cdot_n,O_n)$은 $(M_{n\times 1}(F),+_n,\cdot_n,O_n)$의 부분공간이므로 부분공간 정리로 유한차원이고
$A$의 좌측곱변환 $L_A:M_{n\times 1}(F)\to M_{m\times 1}(F)$에 대해 위 정리로 $L_A^* = L_{A^*}$가 되어
위 정리로 $R(L_{A^*}) = R(L_A^*) = \underset{(M_{n\times1}(F),\langle\cdot,\cdot\rangle_n)}{N(L_A)^\perp}$이고 위 정리로 $\underset{(M_{n\times1}(F),\langle\cdot,\cdot\rangle_n)}{R(L_{A^*})^\perp} = N(L_A)$이다.
1.
$K\ne \emptyset$이므로 $x\in K$가 존재하여
직교여공간 정리로 $x = s+_n y$인 $s\in R(L_{A^*})$와 $y \in \underset{(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)}{R(L_{A^*})^\perp} = N(L_A)$가 존재하고 행렬정리와 핵의 정의로
$b = A\bullet x = A\bullet (s+_n y) = (A\bullet s)+_m (A\bullet y) = (A\bullet s) +_m O_m = A\bullet s$이므로 $s\in K$이다.
연립일차방정식 정리와 동차연립일차방정식 정리로 임의의 $u\in K$는
$u = s+_n v$인 $v \in \{ x\in M_{n\times 1}(F):A\bullet x = O_m\} = N(L_A)$가 존재하여 $s\in R(L_A^*) = \underset{(M_{n\times1}(F),\langle\cdot,\cdot\rangle_n)}{N(L_A)^\perp}$임에 따라
피타고라스 정리로 $\lVert u\rVert_n^2 = \lVert s+_n v\rVert_n^2 = \lVert s\rVert_n^2 + \lVert v\rVert_n^2\ge \lVert s\rVert_n^2$이다.
또 모든 $u\in K$에 대해 $\lVert s_1\rVert_n\le \lVert u\rVert_n$이고 $\lVert s_2\rVert_n\le \lVert u\rVert_n$인 $s_1,s_2\in K$가 존재하면
$\lVert s_1\rVert_n\le \lVert s_2\rVert_n$이고 $\lVert s_2\rVert_n\le \lVert s_1\rVert_n$이므로 $\lVert s_1\rVert_n= \lVert s_2\rVert_n$이 되어
위와 비슷하게 $s_1 = s_2 +_n v$인 $v \in N(L_A)$가 존재하고 $\lVert s_1\rVert_n^2 = \lVert s_2+_n v\rVert_n^2 = \lVert s_2\rVert_n^2 + \lVert v\rVert_n^2\ge \lVert s_2\rVert_n^2$임에 따라
$\lVert v\rVert_n = 0$이므로 내적정리로 $v = O_n$이 되어 $s_1 = s_2+_n v = s_2+_n O_n = s_2$이다.
2.
1번에서 $s\in R(L_{A^*})\cap K$임을 보였으므로 임의의 $v \in R(L_{A^*})\cap K$에 대해 벡터공간의 정의로 $v-s\in R(L_{A^*})$이고
$v,s \in K$이므로 행렬정리로 $A\bullet (v-s) = (A\bullet v) -(A\bullet s) = b-b = O_m$이 되어 $v-s\in N(L_A)$이다.
따라서 직교여공간 정리로 $v-s\in R(L_{A^*})\cap N(L_A) = R(L_{A^*}) \cap \underset{(M_{n\times 1}(F),\langle\cdot,\cdot\rangle_n)}{R(L_{A^*})^\perp} = \{ O_n\}$이므로
$v-s =O_n$이고 $v =s$가 되어 $R(L_{A^*})\cap K = \{ s\}$이다.
3.
$A\bullet A^*\bullet z =b$인 임의의 $z \in M_{m \times 1}(F)$에 대해
$A^*\bullet z \in K$이고 $A^*\bullet z \in R(L_{A^*})$이므로 2번으로 $A^*\bullet z \in R(L_{A^*})\cap K = \{ s\}$가 되어 $s = A^*\bullet z$이다.
정리11(라그랑주[Lagrange] 다항식)
체 $(F,+_F,\cdot_F,0_F,1_F)$의 분수다항식체가 $(Q(F),+_Q,\cdot,f_{-1}(x),x^0)$이고 다항식스칼라곱이 $\cdot_Q$일때
$n\in \mathbb{N}$인 $n+1$개의 서로 다른 $c_0,c_1,\cdots,c_n\in F$과 임의의 $i = 0,1,\cdots, n$에 대해 $f_i(x) \in Q(F)$가
$f_i(x) = \begin{cases} x^0 & (n = 0) \\[0.5em] \dfrac{(x^1-c_0\cdot_Q x^0)\cdot \; \cdots \; \cdot (x^1-c_{i-1}\cdot_Q x^0)\cdot (x^1-c_{i+1}\cdot_Q x^0) \cdot \; \cdots \; \cdot (x^1 -c_n\cdot_Q x^0)}{(c_i\cdot_Q x^0 -c_0\cdot_Q x^0)\cdot \;\cdots \; \cdot(c_i\cdot_Q x^0 - c_{i-1}\cdot_Q x^0)\cdot (c_i\cdot_Q x^0 - c_{i+1}\cdot_Q x^0)\cdot\;\cdots\;\cdot (c_i\cdot_Q x^0 - c_n \cdot_Q x^0) }& (n\ge 1) \end{cases} \text{ 이면 다음이 성립한다.}$
1. $f_i(x)$는 $n$차다항식이다
2. $f_i(x)$에 대한 다항함수 $f_i : F\to F$는 임의의 $j = 0,1,\cdots, n$에 대해 $f_i(c_j) = \begin{cases} 0_F &(i\ne j)\\ 1_F & (i=j)\end{cases}$이다.
3. $\{f_0(x),f_1(x),\cdots,f_n(x)\}$는 $n$차이하다항식 $F$-벡터공간 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$의 기저이다.
4. 임의의 $n$차이하다항식 $f(x)\in P_n(F)$에 대한 다항함수가 $f: F\to F$일때
$f(x)$는 $f(x) = f(c_0)\cdot_Q f_0(x) +_Q f(c_1)\cdot_Q f_1(x) +_Q\cdots +_Q f(c_n)\cdot_Q f_n(x)$이고
$f$는 모든 $t\in F$에 대해 $f(t) =\displaystyle \sum_{i=0}^n f(c_i)\cdot_F f_i(t)$이다.
5. 임의의 $f(x)\in P_n(F)$에 대해 $T(f(x)) = (f(c_0),f(c_1),\cdots ,f(c_n))$로 정의되는 함수 $T : P_n(F)\to F^{n+1}$는
$(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$에서 $n+1$-순서쌍 $F$-벡터공간 $(F^{n+1},+_{n+1},\cdot_{n+1},\vec{0})$로의 선형변환이다.
6. $(F,+_F,\cdot_F,0_F,1_F)$가 무한체이면 $T$는 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$에서 $(F^{n+1},+_{n+1},\cdot_{n+1},\vec{0})$로의 동형사상이다.
7. 다항식 정리에 나온 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$의 순서기저가 $\beta = (x^0,x^1,\cdots, x^n)$이고
벡터공간 정리에 나온 $(F^{n+1},+_{n+1},\cdot_{n+1},\vec{0})$의 순서기저가 $\gamma = (e_1,e_2,\cdots,e_{n+1})$일때
$\beta,\gamma$에 대한 $T$의 행렬표현은 $[T]_\beta^\gamma = \begin{bmatrix} c_0^{0} & c_0^1 & \cdots & c_0^{n} \\ c_1^{0}& c_1^1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ c_n^{0}& c_n^1&\cdots & c_n^{n} \\ \end{bmatrix} = \begin{bmatrix} 1_F & c_0 & \cdots & c_0^{n} \\ 1_F& c_1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ 1_F& c_n&\cdots & c_n^{n} \\ \end{bmatrix} \in M_{(n+1)\times (n+1)}(F) $이다.
증명
1.
$n = 0$이면 스칼라곱정리로 $f_i(x) = x^0 = 1_F\cdot_Q x^0$이므로 $f_i(x)$는 $0$차다항식이다
$n\ge 1$이면 $c_0,\cdots, c_{i-1},c_{i+1},\cdots,c_n\in F$는 $n$개이므로 다항식 정리로
$g_i(x) = (x^1-c_0\cdot_Q x^0)\cdot \; \cdots \; \cdot (x^1-c_{i-1}\cdot_Q x^0)\cdot (x^1-c_{i+1}\cdot_Q x^0) \cdot \; \cdots \; \cdot (x^1 -c_n\cdot_Q x^0)$는 $n$차다항식이고
$i\ne j$인 임의의 $j = 0,1,\cdots, n$에 대해 $c_i\ne c_j$이므로 $c_i - c_j \ne 0_F$이고 체 정리로
$((c_i -c_0)\cdot_F \;\cdots\; \cdot_F (c_i-c_{i-1})\cdot_F (c_i-c_{i+1})\cdot_F\; \cdots\;\cdot_F (c_i-c_n))^{-1} \ne 0_F$가 되어
$\begin{align*} f_i(x) & = \frac{(x^1-c_0\cdot_Q x^0)\cdot \; \cdots \; \cdot (x^1-c_{i-1}\cdot_Q x^0)\cdot (x^1-c_{i+1}\cdot_Q x^0) \cdot \; \cdots \; \cdot (x^1 -c_n\cdot_Q x^0)}{(c_i\cdot_Q x^0 -c_0\cdot_Q x^0)\cdot \;\cdots \; \cdot(c_i\cdot_Q x^0 - c_{i-1}\cdot_Q x^0)\cdot (c_i\cdot_Q x^0 - c_{i+1}\cdot_Q x^0)\cdot\;\cdots\;\cdot (c_i\cdot_Q x^0 - c_n \cdot_Q x^0) } \\[0.5em] & = \frac{(x^1-c_0\cdot_Q x^0)\cdot \; \cdots \; \cdot (x^1-c_{i-1}\cdot_Q x^0)\cdot (x^1-c_{i+1}\cdot_Q x^0) \cdot \; \cdots \; \cdot (x^1 -c_n\cdot_Q x^0)}{((c_i-c_0)\cdot_F \;\cdots \; \cdot_F(c_i\ - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i- c_n ))\cdot_Q x^0 } \\[0.5em] & = (((c_i-c_0)\cdot_F \;\cdots \; \cdot_F(c_i\ - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i- c_n ))\cdot_Q x^0 )^{-1}\cdot g_i(x) \\[0.5em] & = (((c_i-c_0)\cdot_F \;\cdots \; \cdot_F(c_i\ - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i- c_n ))^{-1}\cdot_Q (x^0)^{-1} )\cdot g_i(x) \\[0.5em] & = (((c_i-c_0)\cdot_F \;\cdots \; \cdot_F(c_i\ - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i- c_n ))^{-1}\cdot_Q x^0 )\cdot g_i(x) \\[0.5em] & = ((c_i-c_0)\cdot_F \;\cdots \; \cdot_F(c_i\ - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i- c_n ))^{-1}\cdot_Q (x^0 \cdot g_i(x)) \\[0.5em] & = ((c_i-c_0)\cdot_F \;\cdots \; \cdot_F(c_i\ - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i- c_n ))^{-1}\cdot_Q g_i(x) \text{ 이므로} \end{align*} $
유한다항식 정리로 $f_i(x)$는 $n$차다항식이다.
2.
$n = 0$이면 $i= j = 0$이고 $f_i(x) = x^0$이므로 거듭제곱의 정의로 $f_i(c_j) = c_j^0 = 1_F$이다.
$n\ge 1$일때 $i\ne j$이면 $c_j - c_j = 0_F$인 항이 존재하여
$f_i(c_j) = \dfrac{(c_j-c_0)\cdot_F \; \cdots \; \cdot_F (c_j-c_{i-1})\cdot_F (c_j-c_{i+1}) \cdot_F \; \cdots \; \cdot_F (c_j -c_n)}{(c_i -c_0)\cdot_F \;\cdots \; \cdot_F(c_i - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i - c_n) } =0_F$이고
$i = j$이면 $f_i(c_j) = f_i(c_i) = \dfrac{(c_i-c_0)\cdot_F \; \cdots \; \cdot_F (c_i-c_{i-1})\cdot_F (c_i-c_{i+1}) \cdot_F \; \cdots \; \cdot_F (c_i -c_n)}{(c_i -c_0)\cdot_F \;\cdots \; \cdot_F(c_i - c_{i-1})\cdot_F (c_i - c_{i+1})\cdot_F\;\cdots\;\cdot_F (c_i - c_n) } =1_F$이다.
3.
$f_i(x) = f_j(x)$이고 $i\ne j$인 $i,j=0,1,\cdots, n$가 존재하면
다항함수의 정의로 모든 $c\in F$에 대해 $f_i(c) = f_j(c)$인데 2번으로 $f_i(c_j) =0_F \ne 1_F = f_j(c_j)$이므로 모순이 되어
$\{f_0(x),f_1(x),\cdots,f_n(x)\}$는 $n+1$개의 원소를 갖는 유한집합이다.
영다항식 $f_{-1}(x)$에 대해
$a_0\cdot_Q f_0(x) +_Q a_1\cdot_Q f_1(x) +_Q\cdots +_Q a_n\cdot_Q f_n(x) = f_{-1}(x)$인 $a_0,a_1,\cdots,a_n \in F$이 존재하면
임의의 $i=0,1,\cdots, n$에 대해 다항함수의 정의와 2번으로
$a_i =a_i\cdot_F 1_F = a_i\cdot_F f_i(c_i) = a_0\cdot_F f_0(c_i) +_F a_1\cdot_F f_1(c_i) +_F\cdots +_F a_n\cdot_F f_n(c_i) = f_{-1}(c_i) = 0_F$이므로
일차독립 정리로 $\{f_0(x),f_1(x),\cdots,f_n(x)\}$는 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$에서 일차독립이고
다항식 정리로 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$의 차원이 $n+1$임에 따라
기저정리로 $\{f_0(x),f_1(x),\cdots,f_n(x)\}$는 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$의 기저이다.
4.
3번과 기저정리로 어떤 $a_0,a_1,\cdots,a_n\in F$이 유일하게 존재하여
$f(x) = a_0\cdot_Q f_0(x) +_Q a_1\cdot_Q f_1(x) +_Q\cdots +_Q a_n\cdot_Q f_n(x)$이고
모든 $i = 0,1,\cdots, n$에 대해 다항함수의 정의와 2번으로
$f(c_i) = a_0\cdot_F f_0(c_i) +_F a_1\cdot_F f_1(c_i) +_F\cdots +_F a_n\cdot_F f_n(c_i) = a_i\cdot_F f_i(c_i) = a_i\cdot_F 1_F = a_i$이므로
$f(x) = f(c_0)\cdot_Q f_0(x) +_Q f(c_1)\cdot_Q f_1(x) +_Q\cdots +_Q f(c_n)\cdot_Q f_n(x)$가 되어 다항함수의 정의로
모든 $t \in $에 대해 $f(t) = f(c_0)\cdot_F f_0(t) +_F f(c_1)\cdot_F f_1(t) +_F\cdots +_F f(c_n)\cdot_F f_n(t) =\displaystyle \sum_{i=0}^n f(c_i)\cdot_F f_i(t)$이다.
5.
임의의 $f(x),g(x)\in P_n(F)$에 대한 다항함수 $f,g : F\to F$와 임의의 $a\in F$에 대해
$\begin{align*} T(a\cdot_Q f(x) +_Q g(x)) &= (a\cdot_Ff(c_0)+_F g(c_0), a\cdot_F f(c_1)+_F g(c_1),\cdots,a\cdot_F f(c_n)+_F g(c_n) ) \\[0.5em] &= (a\cdot_Ff(c_0), a\cdot_F f(c_1),\cdots,a\cdot_F f(c_n) ) +_{n+1}( g(c_0), g(c_1),\cdots, g(c_n) ) \\[0.5em] &= a\cdot_{n+1} (f(c_0), f(c_1),\cdots,f(c_n) ) +_{n+1}( g(c_0), g(c_1),\cdots, g(c_n) ) \\[0.5em] &= a\cdot_{n+1} T(f(x))+_{n+1}T(g(x)) \text{ 이므로} \end{align*}$
선형변환 정리로 $T$는 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$에서 $(F^{n+1},+_{n+1},\cdot_{n+1},\vec{0})$로의 선형변환이다.
6.
$(f(c_0),f(c_1),\cdots,f(c_n)) = T(f(x)) = T(g(x)) = (g(c_0),g(c_1),\cdots,g(c_n))$라고 가정하면
$n+1$-순서쌍의 상등으로 모든 $i = 0,1,\cdots,n$에 대해 $f(c_i) = g(c_i)$이므로
4번으로 $f_i(x)$에 대한 다항함수 $f_i:F\to F$와 모든 $t\in F$에 대해
$f(t) = \displaystyle \sum_{i=0}^n f(c_i) \cdot_F f_i(t) = \sum_{i=0}^ng(c_i)\cdot_F f_i(t) = g(t)$가 되어
$(F,+_F,\cdot_F,0_F,1_F)$가 무한체임에 따라 다항함수 정리로 $f(x) = g(x)$이고 $T$는 단사이다.
임의의 $(a_0,a_1,\cdots,a_n) \in F^{n+1}$에 대해 2번과 다항식 정리로
$h(x) = a_0\cdot_Q f_0(x) +_Q a_1\cdot_Q f_1(x) +_Q \cdots+_Q a_n\cdot_Q f_n(x) \in P_n(F)$이고 $h(x)$에 대한 다항함수 $h:F\to F$는
$h(c_i) = a_0\cdot_F f_0(c_i) +_F a_1\cdot_F f_1(c_i) +_F \cdots+_F a_n\cdot_F f_n(c_i) = a_i\cdot_F f_i(c_i) = a_i \cdot_F 1_F = a_i$가 되어
$T(h(x)) = (h(c_0),h(c_1),\cdots,h(c_n)) = (a_0,a_1,\cdots, a_n)$이므로 $T$는 전사이다.
따라서 역함수 정리로 $T$는 가역이므로 $T$는 $(P_n(F),+_Q,\cdot_Q,f_{-1}(x))$에서 $(F^{n+1},+_{n+1},\cdot_{n+1},\vec{0})$로의 동형사상이다.
7.
행렬표현의 정의와 다항함수의 정의로 임의의 $j = 1,2,\cdots, n+1$에 대해
$(c_0^{j-1},c_1^{j-1},\cdots, c_n^{j-1}) = T(x^{j-1}) = \displaystyle \sum_{i= 1}^{n+1}([T]_\beta^\gamma)_{i,j}\cdot_{n+1} e_i = (([T]_\beta^\gamma)_{1,j},([T]_\beta^\gamma)_{2,j},\cdots, ([T]_\beta^\gamma)_{n+1,j})$이므로
$[T]_\beta^\gamma = \begin{bmatrix} c_0^{0} & c_0^1 & \cdots & c_0^{n} \\ c_1^{0}& c_1^1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ c_n^{0}& c_n^1&\cdots & c_n^{n} \\ \end{bmatrix} = \begin{bmatrix} 1_F & c_0 & \cdots & c_0^{n} \\ 1_F& c_1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ 1_F& c_n&\cdots & c_n^{n} \\ \end{bmatrix} \in M_{(n+1)\times (n+1)}(F) $이다.
정리12(방데르몽드[Vandermonde] 행렬)
체가 $(F,+_F,\cdot_F,0_F,1_F)$이고 임의의 자연수가 $m,n\in \mathbb{N}$일때 $m+1$개의 임의의 $c_0,c_1,\cdots,c_m\in F$과
행렬 $V = \begin{bmatrix} c_0^{0} & c_0^1 & \cdots & c_0^{n} \\ c_1^{0}& c_1^1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ c_m^{0}& c_m^1&\cdots & c_m^{n} \end{bmatrix} = \begin{bmatrix} 1_F & c_0 & \cdots & c_0^{n} \\ 1_F& c_1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ 1_F& c_m&\cdots & c_m^{n} \end{bmatrix} \in M_{(m+1)\times (n+1)}(F) $에 대해 다음이 성립한다.
1. $m =n$일때 임의의 $i = 0,1,\cdots, n$에 대해 $d_i = \begin{cases} 1_F & (n = 0)\\ (c_{i+1}-c_{i}) \cdot_F (c_{i+2}-c_i)\cdot_F \; \cdots \; \cdot_F (c_n -c_i) & (n\ge 1)\end{cases}$이면
$V\in M_{(n+1)\times (n+1)}(F)$의 행렬식은 $\det(V) = d_0\cdot_F d_1\cdot_F\;\cdots \; \cdot_F d_n$이다.
2. $m\le n$일때 $V$의 랭크가 $\underset{(M_{(n+1) \times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}= m+1$이기 위한 필요충분조건은
$i\ne j$인 모든 $i,j = 0,1,\cdots,m$에 대해 $c_i\ne c_j$인 것이다.
3. $n\le m$일때 $V$의 랭크가 $\underset{(M_{(n+1) \times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}= n+1$이기 위한 필요충분조건은
$i\ne j$인 모든 $i,j = 0,1,\cdots,n$에 대해 $c_i\ne c_j$인 것이다.
증명
일반성을 잃지 않고 1, 2번만 증명한다.
1.
$n\in \mathbb{N}$에 대한 귀납법을 사용한다.
$n = 0$이면 행렬식의 정의와 거듭제곱의 정의로 $\det(V) = \det(\begin{bmatrix} c_0^0\end{bmatrix}) = c_0^0 = 1_F = d_0$이다.
모든 $k\in \mathbb{N}$에 대해 정리가 성립할때 $k+2$개의 $c_0,c_1,\cdots,c_k,c_{k+1}\in F$와
모든 $i = 0,1,\cdots,k,k+1$에 대해 $d_i = (c_{i+1}-c_i)\cdot_F (c_{i+2}-c_i)\cdot_F \;\cdots\; \cdot_F (c_k -c_i)\cdot_F (c_{k+1}-c_i)$이고
$V = \begin{bmatrix} 1_F & c_0 & c_0^2 & \cdots & c_0^{k}&c_0^{k+1} \\ 1_F& c_1 &c_1^2 & & c_1^{k}&c_1^{k+1} \\ \vdots& && \ddots & & \vdots \\ 1_F& c_k& c_k^2 && c_k^{k}&c_k^{k+1} \\ 1_F & c_{k+1} &c_{k+1}^2 & \cdots & c_{k+1}^k & c_{k+1}^{k+1} \end{bmatrix} \in M_{(k+2)\times (k+2)}(F) $이면
행렬식 열연산 정리와 행렬식 정리와 행렬식의 선형성과 체 정리와 귀납가정으로
$\begin{align*} \det(V) &= \det(\begin{bmatrix} 1_F & c_0 & c_0^2 & \cdots & c_0^{k}&c_0^{k+1} \\ 1_F& c_1 &c_1^2 & & c_1^{k}&c_1^{k+1} \\ \vdots&& & \ddots & & \vdots \\ 1_F& c_k& c_k^2 && c_k^{k}&c_k^{k+1} \\ 1_F & c_{k+1} &c_{k+1}^2 & \cdots & c_{k+1}^k & c_{k+1}^{k+1} \end{bmatrix} ) \\[0.5em] &= \det(\begin{bmatrix} 1_F & c_0 & c_0^2 & \cdots & c_0^{k}&c_0^{k+1}- c_0\cdot_F c_0^{k} \\ 1_F& c_1&c_1^2 & & c_1^{k} &c_1^{k+1} - c_0\cdot_F c_1^{k} \\ \vdots&& & \ddots & & \vdots \\ 1_F& c_k & c_k^2 && c_k^{k} &c_k^{k+1} - c_0\cdot_F c_k^{k} \\ 1_F & c_{k+1} &c_{k+1}^2 & \cdots & c_{k+1}^k & c_{k+1}^{k+1}- c_0\cdot_F c_{k+1}^{k} \end{bmatrix} ) \\[2em] & \mspace{12em}\vdots \\[2em] &= \det(\begin{bmatrix} 1_F & c_0 -c_0 & c_0^2 - c_0\cdot_F c_{0} & \cdots & c_0^{k}- c_0\cdot_F c_0^{k-1}&c_0^{k+1}- c_0\cdot_F c_0^{k} \\ 1_F& c_1-c_0 &c_1^2 - c_0\cdot_F c_{1} & & c_1^{k} - c_0\cdot_F c_1^{k-1}&c_1^{k+1} - c_0\cdot_F c_1^{k} \\ \vdots&& & \ddots & & \vdots \\ 1_F& c_k -c_0& c_k^2 - c_0\cdot_F c_{k} && c_k^{k} - c_0\cdot_F c_k^{k-1} &c_k^{k+1} - c_0\cdot_F c_k^{k} \\ 1_F & c_{k+1}-c_0 &c_{k+1}^2 - c_0\cdot_F c_{k+1} & \cdots & c_{k+1}^k - c_0\cdot_F c_{k+1}^{k-1} & c_{k+1}^{k+1}- c_0\cdot_F c_{k+1}^{k} \end{bmatrix} ) \\[0.5em] &= \det(\begin{bmatrix} 1_F & c_0 -c_0 & c_0^2 - c_0^2 & \cdots & c_0^{k}- c_0^{k}&c_0^{k+1}- c_0^{k+1} \\ 1_F& c_1-c_0 &c_1^2 - c_0\cdot_F c_{1} & & c_1^{k} - c_0\cdot_F c_1^{k-1}&c_1^{k+1} - c_0\cdot_F c_1^{k} \\ \vdots&& & \ddots & & \vdots \\ 1_F& c_k -c_0& c_k^2 - c_0\cdot_F c_{k} && c_k^{k} - c_0\cdot_F c_k^{k-1} &c_k^{k+1} - c_0\cdot_F c_k^{k} \\ 1_F & c_{k+1}-c_0 &c_{k+1}^2 - c_0\cdot_F c_{k+1} & \cdots & c_{k+1}^k - c_0\cdot_F c_{k+1}^{k-1} & c_{k+1}^{k+1}- c_0\cdot_F c_{k+1}^{k} \end{bmatrix} ) \\[0.5em] &= \det(\begin{bmatrix} 1_F & 0_F & 0_F & \cdots & 0_F& 0_F \\ 1_F& c_1-c_0 & c_1\cdot_F(c_1 - c_{0}) & & c_1^{k-1} \cdot_F (c_1 - c_0)& c_1^{k}\cdot_F (c_1 - c_0) \\ \vdots&& & \ddots & & \vdots \\ 1_F& c_k -c_0& c_{k}\cdot_F (c_k - c_0) && c_k^{k-1}\cdot_F (c_k - c_0) &c_k^{k}\cdot_F (c_k - c_0) \\ 1_F & c_{k+1}-c_0 &c_{k+1}\cdot_F (c_{k+1} - c_0) & \cdots & c_{k+1}^{k-1} \cdot_F (c_{k+1}- c_0) &c_{k+1}^{k}\cdot_F (c_{k+1} - c_0) \end{bmatrix} ) \\[0.5em] &= (-1_F)^{1+1}\cdot_F \det(\begin{bmatrix} c_1-c_0 & c_1\cdot_F(c_1 - c_{0}) & \cdots& c_1^{k-1} \cdot_F (c_1 - c_0)& c_1^{k}\cdot_F (c_1 - c_0) \\ \vdots& & \ddots & & \vdots \\ c_k -c_0& c_{k}\cdot_F (c_k - c_0) && c_k^{k-1}\cdot_F (c_k - c_0) &c_k^{k}\cdot_F (c_k - c_0) \\ c_{k+1}-c_0 &c_{k+1}\cdot_F (c_{k+1} - c_0) & \cdots & c_{k+1}^{k-1} \cdot_F (c_{k+1}- c_0) &c_{k+1}^{k}\cdot_F (c_{k+1} - c_0) \end{bmatrix} ) \\[0.5em] &= 1_F \cdot_F \det(\begin{bmatrix} 1_F \cdot_F(c_1-c_0) & c_1\cdot_F(c_1 - c_{0}) & \cdots& c_1^{k-1} \cdot_F (c_1 - c_0)& c_1^{k}\cdot_F (c_1 - c_0) \\ \vdots& & \ddots & & \vdots \\ 1_F \cdot_F( c_k -c_0)& c_{k}\cdot_F (c_k - c_0) && c_k^{k-1}\cdot_F (c_k - c_0) &c_k^{k}\cdot_F (c_k - c_0) \\ 1_F \cdot_F(c_{k+1}-c_0) &c_{k+1}\cdot_F (c_{k+1} - c_0) & \cdots & c_{k+1}^{k-1} \cdot_F (c_{k+1}- c_0) &c_{k+1}^{k}\cdot_F (c_{k+1} - c_0) \end{bmatrix} ) \\[0.5em] &= (c_1-c_0)\cdot_F \;\cdots\; \cdot_F(c_k -c_0)\cdot_F (c_{k+1} - c_0)\cdot_F \det(\begin{bmatrix} 1_F & c_1 & \cdots& c_1^{k-1} & c_1^{k} \\ \vdots& & \ddots & & \vdots \\ 1_F & c_{k} && c_k^{k-1}&c_k^{k} \\ 1_F &c_{k+1} & \cdots & c_{k+1}^{k-1} &c_{k+1}^{k} \end{bmatrix} ) \\[0.5em] &= d_0 \cdot_F \det(\begin{bmatrix} 1_F & c_1 & \cdots& c_1^{k-1} & c_1^{k} \\ \vdots& & \ddots & & \vdots \\ 1_F & c_{k} && c_k^{k-1}&c_k^{k} \\ 1_F &c_{k+1} & \cdots & c_{k+1}^{k-1} &c_{k+1}^{k} \end{bmatrix} ) \\[0.5em] &= d_0 \cdot_Fd_1 \cdot_F \; \cdots \; \cdot_F d_k\cdot_F d_{k+1} \text{ 이다.} \end{align*}$
따라서 모든 $n \in \mathbb{N}$에 대해 정리가 성립한다.
2.
$\underset{(M_{(n+1) \times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}= m+1$일때
$c_i = c_j$이고 $i\ne j$인 $i,j = 0,1,\cdots, m$가 존재하면 임의의 $k = 0,1,\cdots,m$에 대해
$v_{k} = \begin{bmatrix} 1_F & c_k& \cdots & c_k^n\end{bmatrix} \in M_{1\times (n+1)}(F)$인 집합 $\{ v_0,v_1,\cdots, v_{m}\}$은 행렬 정리로 원소개수가 $m+1$개인데
$v_{i} = \begin{bmatrix} 1_F & c_i& \cdots & c_i^n\end{bmatrix} = \begin{bmatrix}1_F & c_j&\cdots & c_j^n \end{bmatrix} = v_j$이므로 원소개수가 $m$개이하가 되어 유일성 정리에 모순이다.
역으로 $i\ne j$인 모든 $i,j = 0,1,\cdots,m$에 대해 $c_i\ne c_j$이면
$c_i - c_j \ne 0_F$이므로 $ A = \begin{bmatrix} 1_F & c_0 & \cdots & c_0^{m} \\ 1_F& c_1 & & c_1^{m} \\ \vdots& & \ddots & \vdots \\ 1_F& c_m&\cdots & c_m^{m} \end{bmatrix} \in M_{(m+1)\times (m+1)}(F)$에 대해 1번으로 $\det(A)\ne 0_F$가 되어
행렬식 정리와 행렬의 랭크 정리로 $\underset{(M_{(m+1) \times 1}(F),+_{m+1},\cdot_{m+1},O_{m+1})}{\operatorname{rank}(A)}= m+1$이다.
임의의 $k = 0,1,\cdots,m$에 대해 $u_{k} = \begin{bmatrix} 1_F & c_k& \cdots & c_k^m\end{bmatrix} \in M_{1\times (m+1)}(F)$일때
집합 $\{ u_0,u_1,\cdots,u_m \}$은 행렬 정리로 $m+1$개의 원소를 갖고
행렬 $F$-벡터공간 $(M_{1\times (m+1) }(F),+_{m+1}^t,\cdot_{m+1}^t,O_{m+1}^t)$에서 일차독립이므로
$v_{k} = \begin{bmatrix} 1_F & c_k& \cdots & c_k^m & c_k^{m+1}&\cdots & c_k^n\end{bmatrix} \in M_{1\times (n+1)}(F)$와 $(M_{1\times (n+1) }(F),+_{n+1}^t,\cdot_{n+1}^t,O_{n+1}^t)$에 대해
$a_0 \cdot_{n+1}^t v_0 +_{n+1}^t a_1\cdot_{n+1}^t v_1 +_{n+1}^t \cdots +_{n+1}^t a_m\cdot_{n+1}^t v_m = O_{n+1}^t$인 $a_0,a_1,\cdots, a_m\in F$가 존재하면
$a_0 \cdot_{m+1}^t u_0 +_{m+1}^t a_1\cdot_{m+1}^t u_1 +_{m+1}^t \cdots +_{m+1}^t a_m\cdot_{m+1}^t u_m = O_{m+1}^t$이 되어 일차독립 정리로
$a_0 = a_1= \cdots = a_m = 0_F$이고 $\{ v_0,v_1,\cdots,v_m \}$은 $(M_{1\times (n+1) }(F),+_{n+1}^t,\cdot_{n+1}^t,O_{n+1}^t)$에서 일차독립이다.
따라서 행렬 정리로 $m+1\le \underset{(M_{(n+1) \times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}$이고
행렬의 랭크 정리로 $\underset{(M_{(n+1) \times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}\le m+1$이므로 $\underset{(M_{(n+1) \times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}= m+1$이다.
정리13(최소 제곱인 다항함수)
실수체 또는 복소수체 $(F,+,\cdot,0,1)$와 임의의 $m,n\in \mathbb{N}$과 $m+1$개의 임의의 $c_0,c_1,\cdots, c_m \in F$에 대해
$V = \begin{bmatrix} c_0^{0} & c_0^1 & \cdots & c_0^{n} \\ c_1^{0}& c_1^1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ c_m^{0}& c_m^1&\cdots & c_m^{n} \end{bmatrix} = \begin{bmatrix} 1 & c_0 & \cdots & c_0^{n} \\ 1& c_1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ 1& c_m&\cdots & c_m^{n} \end{bmatrix} \in M_{(m+1)\times (n+1)}(F)$인
행렬 $V$의 랭크가 $\underset{(M_{(n+1)\times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}=n+1$일때
$m+1$개의 임의의 $y_0,y_1,\cdots,y_m\in F$과 행렬곱 $\bullet$과 $V$의 켤레전치행렬 $V^* \in M_{(n+1)\times (m+1)}(F)$에 대해
$(V^*\bullet V)^{-1}\bullet V^*\bullet \begin{bmatrix}y_0 \\ y_1 \\ \vdots \\y_m \end{bmatrix} = \begin{bmatrix} a_{0} \\a_1 \\ \vdots \\ a_{n}\end{bmatrix} \in M_{(n+1)\times 1}(F)$이면
모든 $t\in F$에 대해 $f(t) = a_{n}\cdot t^{n} + \cdots + a_1\cdot t + a_0$인 $n$차이하다항함수 $f: F\to F$는
모든 $n$차이하다항함수 $g: F\to F$에 대해 $\displaystyle \sum_{i =0}^m |y_i - f(c_i)|^2 \le \sum_{i=0}^m |y_i - g(c_i)|^2$이다.
증명
행렬 $F$-벡터공간 $(M_{(m+1)\times 1}(F),+_{m+1},\cdot_{m+1},O_{m+1})$위의 행렬내적공간이 $(M_{(m+1)\times 1}(F),\langle\cdot,\cdot\rangle_{m+1})$일때
$n$차이하다항함수의 정의로 모든 $t\in F$에 대해 $g(t) = b_{n}\cdot t^{n} + \cdots + b_1\cdot t + b_0$인 $b_0,b_1,\cdots,b_n \in F$이 존재하고
$\underset{(M_{(n+1)\times 1}(F),+_{n+1},\cdot_{n+1},O_{n+1})}{\operatorname{rank}(V)}=n+1$이므로
복소수 정리와 위 정리로 $(M_{(m+1)\times 1}(F),\langle\cdot,\cdot\rangle_{m+1})$의 노름 $\lVert \cdot\lVert_{m+1}:M_{(m+1)\times 1}(F)\to [0,\infty)$에 대해
$ \begin{align*} \sum_{i=0}^m |y_i - f(c_i)|^2 & = \sum_{i=0}^m \overline{(y_i - f(c_i))}\cdot (y_i - f(c_i)) \\[0.5em] & = \left (\begin{bmatrix} \overline{y_0 -f(c_0)} & \overline{y_1 -f(c_1)} & \cdots & \overline{y_m -f(c_m)} \end{bmatrix} \bullet \begin{bmatrix}y_0 -f(c_0)\\ y_1 -f(c_1) \\ \vdots \\ y_m-f(c_m) \end{bmatrix}\right)_{1,1} \\[0.5em] & = \left \langle \begin{bmatrix}y_0 -f(c_0)\\ y_1 -f(c_1) \\ \vdots \\ y_m-f(c_m) \end{bmatrix},\begin{bmatrix}y_0 -f(c_0)\\ y_1 -f(c_1) \\ \vdots \\ y_m-f(c_m) \end{bmatrix}\right \rangle_{m+1} \\[0.5em] & = \left \lVert \begin{bmatrix}y_0 -f(c_0)\\ y_1 -f(c_1) \\ \vdots \\ y_m-f(c_m) \end{bmatrix}\right \rVert_{m+1}^2 \\[0.5em] & = \left \lVert \begin{bmatrix} y_0\\y_1 \\ \vdots \\ y_m\end{bmatrix} - \begin{bmatrix}f(c_0)\\ f(c_1) \\ \vdots \\ f(c_m) \end{bmatrix}\right \rVert_{m+1}^2 \\[0.5em] & = \left \lVert \begin{bmatrix} y_0\\y_1 \\ \vdots \\ y_m\end{bmatrix} - \begin{bmatrix} a_{n}\cdot c_0^{n} + \cdots + a_1\cdot c_0 + a_0 \\ a_{n}\cdot c_1^{n} + \cdots + a_1\cdot c_1 + a_0 \\ \vdots \\ a_{n}\cdot c_m^{n} + \cdots + a_1\cdot c_m + a_0 \end{bmatrix}\right \rVert_{m+1}^2 \\[0.5em] & = \left \lVert \begin{bmatrix} y_0\\y_1 \\ \vdots \\ y_m\end{bmatrix} - \begin{bmatrix} a_0 + a_1\cdot c_0 + \cdots + a_{n}\cdot c_0^{n} \\ a_0 + a_1\cdot c_1 + \cdots + a_{n}\cdot c_1^{n} \\ \vdots \\ a_0 + a_1\cdot c_m + \cdots + a_{n}\cdot c_m^{n} \end{bmatrix}\right \rVert_{m+1}^2 \\[0.5em] & = \left \lVert \begin{bmatrix} y_0\\y_1 \\ \vdots \\ y_m\end{bmatrix}- \begin{bmatrix} 1 & c_0 & \cdots & c_0^{n} \\ 1& c_1 & & c_1^{n} \\ \vdots& & \ddots & \vdots \\ 1& c_m&\cdots & c_m^{n} \end{bmatrix} \bullet \begin{bmatrix} a_0\\a_1\\ \vdots \\ a_n \end{bmatrix} \right \rVert_{m+1}^2 \\[0.5em] & = \left \lVert \begin{bmatrix} y_0\\y_1 \\ \vdots \\ y_m\end{bmatrix}- V \bullet \begin{bmatrix} a_0\\a_1\\ \vdots \\ a_n \end{bmatrix} \right \rVert_{m+1}^2 \\[0.5em] & = \left \lVert V\bullet \begin{bmatrix} a_0\\a_1\\ \vdots \\ a_n \end{bmatrix}- \begin{bmatrix} y_0\\y_1 \\ \vdots \\ y_m\end{bmatrix}\right \rVert_{m+1}^2 \\[0.5em] & \le \left \lVert V\bullet \begin{bmatrix}b_0\\ b_1 \\ \vdots \\ b_n \end{bmatrix}-\begin{bmatrix}y_0\\ y_1 \\ \vdots \\ y_m \end{bmatrix}\right \rVert_{m+1}^2 = \sum_{i=0}^m |y_i - g(c_i)|^2 \text{ 이다.} \end{align*}$
-------------------------------------------------------------------------------
정의의 링크 :
https://openknowledgevl.tistory.com/81#def번호
번호는 해당 정의 옆에 붙어있는 작은 숫자입니다.
정리의 링크 :
https://openknowledgevl.tistory.com/81#thm번호
번호는 해당 정리 옆에 붙어있는 작은 숫자입니다.
위 내용은 아래의 출처를 기반으로 정리한 내용입니다.
틀린 내용이 존재할 수 있습니다.
출처(저자 - 제목 - ISBN13)
Stephen H. Friedberg - Linear Algebra - 9780134860244
반응형'수학 > 선형대수학' 카테고리의 다른 글
조르당 표준형(Jordan canonical form) (0) 2024.06.23 정규연산자(Normal operator), 자기수반연산자(Self-adjoint) (0) 2024.06.21 내적공간에서의 직교성(Orthogonality) (0) 2024.06.10 내적공간(Inner product space), 노름공간(Normed space) (0) 2024.06.07 부분공간의 직합(Direct sum), 케일리-해밀턴 정리(Cayley-Hamilton theorem) (0) 2024.06.02