Przestrzenie wektorowe, podprzestrzenie i macierze
Omawiamy definicje przestrzeni wektorowej i podprzestrzeni oraz typowe przykłady: $F^n$, przestrzenie macierzy i funkcji. Skupiamy się na przestrzeniach macierzy i ważnych podprzestrzeniach: macierzach symetrycznych/antysymetrycznych oraz trójkątnych i diagonalnych.
TL;DR
- macierz (matrix)
- element w $i$-tym wierszu i $j$-tej kolumnie macierzy $A$ zapisujemy jako $A_{ij}$ lub $a_{ij}$
- element diagonalny (diagonal entry): element $a_{ij}$ taki, że $i=j$
- elementy $a_{i1}, a_{i2}, \dots, a_{in}$ nazywamy $i$-tym wierszem (row) tej macierzy
- każdy wiersz macierzy można przedstawić jako wektor z $F^n$
- ponadto, wektor wierszowy z $F^n$ można przedstawić jako inną macierz rozmiaru $1 \times n$
- elementy $a_{1j}, a_{2j}, \dots, a_{mj}$ nazywamy $j$-tą kolumną (column) tej macierzy
- każdą kolumnę macierzy można przedstawić jako wektor z $F^m$
- ponadto, wektor kolumnowy z $F^m$ można przedstawić jako inną macierz rozmiaru $m \times 1$
- macierz zerowa (zero matrix): macierz, której wszystkie elementy są równe $0$; oznaczamy ją przez $O$
- macierz kwadratowa (square matrix): macierz, w której liczba wierszy jest równa liczbie kolumn
- dla dwóch macierzy $m \times n$ $A, B$: jeśli dla wszystkich $1 \leq i \leq m$, $1 \leq j \leq n$ zachodzi $A_{ij} = B_{ij}$ (tj. wszystkie odpowiadające sobie elementy są identyczne), to definiujemy, że macierze są równe ($A=B$)
- macierz transponowana (transpose matrix): dla macierzy $m \times n$ $A$ macierzą transponowaną nazywamy macierz $A^T$ rozmiaru $n \times m$, otrzymaną przez zamianę wierszy z kolumnami
- macierz symetryczna (symmetric matrix): macierz kwadratowa $A$ taka, że $A^T = A$
- macierz antysymetryczna (skew-symmetric matrix): macierz kwadratowa $B$ taka, że $B^T = -B$
- macierz trójkątna (triangular matrix)
- macierz górnotrójkątna (upper triangular matrix): macierz, w której wszystkie elementy pod przekątną są równe $0$ (tj. $i>j \Rightarrow A_{ij}=0$); zwykle oznaczana przez $U$
- macierz dolnotrójkątna (lower triangular matrix): macierz, w której wszystkie elementy nad przekątną są równe $0$ (tj. $i<j \Rightarrow A_{ij}=0$); zwykle oznaczana przez $L$
- macierz diagonalna (diagonal matrix): macierz kwadratowa, w której wszystkie elementy poza przekątną są równe $0$ (tj. $i \neq j \Rightarrow M_{ij}=0$ dla macierzy $n \times n$); zwykle oznaczana przez $D$
- reprezentatywne przestrzenie wektorowe
- $n$-tki $F^n$:
- zbiór wszystkich $n$-tek, których składowe należą do ciała $F$
- oznaczamy przez $F^n$; jest to przestrzeń wektorowa nad $F$
- przestrzeń macierzy (matrix space):
- zbiór wszystkich macierzy $m \times n$, których elementy należą do ciała $F$
- oznaczamy przez $\mathcal{M}_{m \times n}(F)$; jest to przestrzeń wektorowa
- przestrzeń funkcji (function space):
- dla niepustego zbioru $S$ oraz ciała $F$: zbiór wszystkich funkcji z $S$ do $F$
- oznaczamy przez $\mathcal{F}(S,F)$; jest to przestrzeń wektorowa
- podprzestrzeń (subspace)
- jeśli podzbiór $\mathbb{W}$ przestrzeni wektorowej nad $F$, $\mathbb{V}$, jest przestrzenią wektorową nad $F$ z tym samym dodawaniem i mnożeniem przez skalar co w $\mathbb{V}$, to $\mathbb{W}$ nazywamy podprzestrzenią (subspace) $\mathbb{V}$
- dla każdej przestrzeni wektorowej $\mathbb{V}$: sama $\mathbb{V}$ oraz $\{0\}$ są podprzestrzeniami; w szczególności $\{0\}$ nazywamy podprzestrzenią zerową (zero subspace)
- jeśli pewien podzbiór przestrzeni wektorowej zawiera wektor zerowy i jest domknięty na kombinacje liniowe (tj. $\mathrm{span}(\mathbb{W})=\mathbb{W}$), to jest on podprzestrzenią
Prerequisites
Przestrzeń wektorowa
Jak krótko widzieliśmy już w tekście Wektory i kombinacje liniowe, definicje wektora i przestrzeni wektorowej jako struktury algebraicznej są następujące.
Definicja
Przestrzeń wektorowa (vector space) lub przestrzeń liniowa (linear space) $\mathbb{V}$ nad ciałem $F$ jest zbiorem wyposażonym w dwa działania, dodawanie oraz mnożenie przez skalar, spełniające poniższe 8 warunków. Elementy ciała $F$ nazywamy skalarami (scalar), a elementy przestrzeni $\mathbb{V}$ — wektorami (vector).
- Suma (sum): dla dwóch elementów $\mathbf{x}, \mathbf{y} \in \mathbb{V}$ jest to działanie przyporządkowujące jednoznacznie element $\mathbf{x} + \mathbf{y} \in \mathbb{V}$. Element $\mathbf{x} + \mathbf{y}$ nazywamy sumą $\mathbf{x}$ i $\mathbf{y}$.
- Mnożenie przez skalar (scalar multiplication): dla elementu $a \in F$ i elementu $\mathbf{x} \in \mathbb{V}$ jest to działanie przyporządkowujące jednoznacznie element $a\mathbf{x} \in \mathbb{V}$. Element $a\mathbf{x}$ nazywamy wielokrotnością skalarną (scalar multiple) wektora $\mathbf{x}$.
- Dla wszystkich $\mathbf{x},\mathbf{y} \in \mathbb{V}$ zachodzi $\mathbf{x} + \mathbf{y} = \mathbf{y} + \mathbf{x}$. (przemienność dodawania)
- Dla wszystkich $\mathbf{x},\mathbf{y},\mathbf{z} \in \mathbb{V}$ zachodzi $(\mathbf{x}+\mathbf{y})+\mathbf{z} = \mathbf{x}+(\mathbf{y}+\mathbf{z})$. (łączność dodawania)
- Dla każdego $\mathbf{x} \in \mathbb{V}$ istnieje $\mathbf{0} \in \mathbb{V}$ takie, że $\mathbf{x} + \mathbf{0} = \mathbf{x}$. (wektor zerowy, element neutralny dodawania)
- Dla każdego $\mathbf{x} \in \mathbb{V}$ istnieje $\mathbf{y} \in \mathbb{V}$ takie, że $\mathbf{x}+\mathbf{y}=\mathbf{0}$. (element przeciwny względem dodawania)
- Dla każdego $\mathbf{x} \in \mathbb{V}$ zachodzi $1\mathbf{x} = \mathbf{x}$. (element neutralny mnożenia)
- Dla wszystkich $a,b \in F$ oraz wszystkich $\mathbf{x} \in \mathbb{V}$ zachodzi $(ab)\mathbf{x} = a(b\mathbf{x})$. (łączność mnożenia przez skalar)
- Dla wszystkich $a \in F$ oraz wszystkich $\mathbf{x},\mathbf{y} \in \mathbb{V}$ zachodzi $a(\mathbf{x}+\mathbf{y}) = a\mathbf{x} + a\mathbf{y}$. (rozdzielność 1 mnożenia przez skalar względem dodawania)
- Dla wszystkich $a,b \in F$ oraz wszystkich $\mathbf{x},\mathbf{y} \in \mathbb{V}$ zachodzi $(a+b)\mathbf{x} = a\mathbf{x} + b\mathbf{x}$. (rozdzielność 2 mnożenia przez skalar względem dodawania)
Ściśle mówiąc, należy pisać „przestrzeń wektorowa $\mathbb{V}$ nad $F$”, jednak przy omawianiu przestrzeni wektorowych ciało zwykle nie jest kluczowym elementem, więc jeśli nie ma ryzyka nieporozumienia, pomijamy ciało $F$ i piszemy po prostu „przestrzeń wektorowa $\mathbb{V}$”.
Przestrzeń macierzy
Wektory wierszowe i wektory kolumnowe
Zbiór wszystkich $n$-tek o elementach z ciała $F$ oznaczamy przez $F^n$. Dla $u = (a_1, a_2, \dots, a_n) \in F^n$, $v = (b_1, b_2, \dots, b_n) \in F^n$ definiujemy dodawanie i mnożenie przez skalar następująco; wtedy $F^n$ jest przestrzenią wektorową nad $F$.
\[\begin{align*} u + v &= (a_1+b_1, a_2+b_2, \dots, a_n+b_n), \\ cu &= (ca_1, ca_2, \dots, ca_n) \end{align*}\]Wektory z $F^n$ zapisuje się zwykle nie jako wektory wierszowe (row vector) $(a_1, a_2, \dots, a_n)$, lecz jako wektory kolumnowe (column vector)
\[\begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}\].
Ponieważ taki zapis kolumnowy zajmuje dużo miejsca, czasem stosuje się transpozycję i zapisuje jako $(a_1, a_2, \dots, a_n)^T$.
Macierze i przestrzeń macierzy
Z kolei macierz $m \times n$ o elementach z ciała $F$ to prostokątna tablica postaci poniżej; zapisujemy ją kursywą wielką literą ($A, B, C$ itd.).
\[\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}\]- element w $i$-tym wierszu i $j$-tej kolumnie macierzy $A$ zapisujemy jako $A_{ij}$ lub $a_{ij}$.
- wszystkie $a_{ij}$ ($1 \leq i \leq m$, $1 \leq j \leq n$) są elementami $F$.
- element $a_{ij}$ taki, że $i=j$, nazywamy elementem diagonalnym (diagonal entry) tej macierzy.
- elementy $a_{i1}, a_{i2}, \dots, a_{in}$ nazywamy $i$-tym wierszem (row) tej macierzy. Każdy wiersz macierzy można przedstawić jako wektor z $F^n$; ponadto wektor wierszowy z $F^n$ można przedstawić jako inną macierz rozmiaru $1 \times n$.
- elementy $a_{1j}, a_{2j}, \dots, a_{mj}$ nazywamy $j$-tą kolumną (column) tej macierzy. Każdą kolumnę macierzy można przedstawić jako wektor z $F^m$; ponadto wektor kolumnowy z $F^m$ można przedstawić jako inną macierz rozmiaru $m \times 1$.
- macierz $m \times n$, której wszystkie elementy są równe $0$, nazywamy macierzą zerową (zero matrix) i oznaczamy przez $O$.
- macierz, w której liczba wierszy jest równa liczbie kolumn, nazywamy macierzą kwadratową (square matrix).
- dla dwóch macierzy $m \times n$ $A, B$: jeśli dla wszystkich $1 \leq i \leq m$, $1 \leq j \leq n$ zachodzi $A_{ij} = B_{ij}$ (tj. wszystkie odpowiadające sobie elementy są identyczne), to definiujemy, że macierze są równe ($A=B$).
Zbiór wszystkich macierzy $m \times n$ o elementach z ciała $F$ oznaczamy przez $\mathcal{M}_{m \times n}(F)$. Dla $\mathbf{A},\mathbf{B} \in \mathcal{M}_{m \times n}(F)$ oraz $c \in F$, jeśli dodawanie i mnożenie przez skalar zdefiniujemy następująco, to $\mathcal{M}_{m \times n}(F)$ jest przestrzenią wektorową; nazywamy ją przestrzenią macierzy (matrix space).
\[\begin{align*} (\mathbf{A}+\mathbf{B})_{ij} &= \mathbf{A}_{ij} + \mathbf{B}_{ij}, \\ (c\mathbf{A})_{ij} &= c\mathbf{A}_{ij} \\ \text{(przy czym }1 \leq i \leq &m, 1 \leq j \leq n \text{)} \end{align*}\]Jest to naturalne rozszerzenie działań zdefiniowanych w $F^n$ oraz $F^m$.
Przestrzeń funkcji
Dla niepustego zbioru $S$ oraz ciała $F$, $\mathcal{F}(S,F)$ jest zbiorem wszystkich funkcji z $S$ do $F$. W $\mathcal{F}(S,F)$, jeśli dla każdego $s \in S$ zachodzi $f(s) = g(s)$, to mówimy, że funkcje $f, g$ są równe ($f=g$).
Dla $f,g \in \mathcal{F}(S,F)$, $c \in F$, $s \in S$ definiujemy dodawanie i mnożenie przez skalar następująco; wtedy $\mathcal{F}(S,F)$ jest przestrzenią wektorową i nazywamy ją przestrzenią funkcji (function space).
\[\begin{align*} (f + g)(s) &= f(s) + g(s), \\ (cf)(s) &= c[f(s)] \end{align*}\]Podprzestrzeń
Definicja
Jeśli podzbiór $\mathbb{W}$ przestrzeni wektorowej nad $F$, $\mathbb{V}$, jest przestrzenią wektorową nad $F$ z tym samym dodawaniem i mnożeniem przez skalar co w $\mathbb{V}$, to $\mathbb{W}$ nazywamy podprzestrzenią (subspace) $\mathbb{V}$.
Dla każdej przestrzeni wektorowej $\mathbb{V}$: sama $\mathbb{V}$ oraz $\{0\}$ są podprzestrzeniami; w szczególności $\{0\}$ nazywamy podprzestrzenią zerową (zero subspace).
To, czy dany podzbiór jest podprzestrzenią, można sprawdzić za pomocą następującego twierdzenia.
Twierdzenie 1
Dla przestrzeni wektorowej $\mathbb{V}$ i jej podzbioru $\mathbb{W}$ warunkiem koniecznym i wystarczającym na to, by $\mathbb{W}$ była podprzestrzenią $\mathbb{V}$, jest spełnienie poniższych 3 warunków. Działania są takie same jak te zdefiniowane w $\mathbb{V}$.
- $\mathbf{0} \in \mathbb{W}$
- $\mathbf{x}+\mathbf{y} \in \mathbb{W} \quad \forall\ \mathbf{x} \in \mathbb{W},\ \mathbf{y} \in \mathbb{W}$
- $c\mathbf{x} \in \mathbb{W} \quad \forall\ c \in F,\ \mathbf{x} \in \mathbb{W}$
Krótko mówiąc: jeśli zbiór zawiera wektor zerowy i jest domknięty na kombinacje liniowe (tj. $\mathrm{span}(\mathbb{W})=\mathbb{W}$), to jest podprzestrzenią.
Ponadto zachodzą następujące twierdzenia.
Twierdzenie 2
Rozpiętość $\mathrm{span}(S)$ dowolnego podzbioru $S$ przestrzeni wektorowej $\mathbb{V}$ jest podprzestrzenią $\mathbb{V}$ zawierającą $S$.
\[S \subset \mathrm{span}(S) \leq \mathbb{V} \quad \forall\ S \subset \mathbb{V}.\]Każda podprzestrzeń $\mathbb{V}$ zawierająca $S$ musi zawierać rozpiętość $S$.
\[\mathbb{W}\supset \mathrm{span}(S) \quad \forall\ S \subset \mathbb{W} \leq \mathbb{V}.\]
Twierdzenie 3
Dla dowolnej rodziny podprzestrzeni przestrzeni wektorowej $\mathbb{V}$ ich dowolne przecięcie jest również podprzestrzenią $\mathbb{V}$.
Macierz transponowana, macierz symetryczna, macierz antysymetryczna
Dla macierzy $m \times n$ $A$ jej macierz transponowana (transpose matrix) $A^T$ jest macierzą $n \times m$ otrzymaną przez zamianę wierszy z kolumnami.
\[(A^T)_{ij} = A_{ji}\] \[\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{pmatrix}^T = \begin{pmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{pmatrix}\]Macierz $A$ spełniającą $A^T = A$ nazywamy macierzą symetryczną (symmetric matrix), a macierz $B$ spełniającą $B^T = -B$ — macierzą antysymetryczną (skew-symmetric matrix). Macierze symetryczne i antysymetryczne muszą być macierzami kwadratowymi.
Dwa zbiory $\mathbb{W}_1, \mathbb{W}_2$, których elementami są odpowiednio wszystkie macierze symetryczne oraz wszystkie macierze antysymetryczne z $\mathcal{M}_{n \times n}(F)$, są podprzestrzeniami $\mathcal{M}_{n \times n}(F)$. To znaczy: $\mathbb{W}_1, \mathbb{W}_2$ są domknięte względem dodawania i mnożenia przez skalar.
Macierze trójkątne, macierze diagonalne
Te dwa typy macierzy są również szczególnie ważne.
Najpierw następujące dwa typy macierzy łącznie nazywamy macierzami trójkątnymi (triangular matrix).
- macierz górnotrójkątna (upper triangular matrix): macierz, w której wszystkie elementy pod przekątną są równe $0$ (tj. $i>j \Rightarrow A_{ij}=0$); zwykle oznaczana przez $U$
- macierz dolnotrójkątna (lower triangular matrix): macierz, w której wszystkie elementy nad przekątną są równe $0$ (tj. $i<j \Rightarrow A_{ij}=0$); zwykle oznaczana przez $L$
Macierz kwadratową, w której wszystkie elementy poza przekątną są równe $0$, tzn. macierz $n \times n$ spełniającą $i \neq j \Rightarrow M_{ij}=0$, nazywamy macierzą diagonalną (diagonal matrix) i zwykle oznaczamy przez $D$. Macierz diagonalna jest jednocześnie macierzą górnotrójkątną i dolnotrójkątną.
Zbiór macierzy górnotrójkątnych, zbiór macierzy dolnotrójkątnych oraz zbiór macierzy diagonalnych są podprzestrzeniami $\mathcal{M}_{m \times n}(F)$.
