Înmulțirea matricilor

În matematică, în special în algebra liniară, înmulțirea matricilor sau înmulțirea matricială^[1] este o operație binară care produce o matrice din două matrici. La înmulțirea matricială, numărul de coloane din prima matrice trebuie să fie egal cu numărul de linii din a doua matrice. Matricea rezultată, cunoscută sub numele de produs matricial, are numărul de linii ale primei matrice și numărul de coloane ale celei de-a doua matrice. Produsul matricilor $A$ și $B$ este notat $AB$ .^[2]

Înmulțirea matricială a fost descrisă pentru prima dată de matematicianul francez Jacques Philippe Marie Binet în 1812,^[3] pentru a reprezenta compunerea funcțiilor^⁠(d) de transformări liniare care sunt reprezentate cu ajutorul matricilor. Astfel, înmulțirea matricială a devenit un instrument de bază al algebrei liniare și, ca atare, are numeroase aplicații în multe domenii ale matematicii, precum și în matematica aplicată, statistică, fizică, economie și inginerie.^[4]^[5] Calculul produselor matriciale este o operație centrală în toate aplicațiile algebrei liniare.

Notație

În acest articol convențiile privind notațiile sunt următoarele: matricile sunt reprezentate prin litere majuscule grase (bold), de exemplu $A$ ; vectorii cu litere minuscule grase, de exemplu $a$ ; iar elementele vectorilor și matricilor cu italice, de exemplu $A$ sau $a$ . Notația indexată este adesea cel mai clar mod de a exprima definițiile și este notația standard folosit în literatura de specialitate. Linia din matrice este indicată de indicele $i$ , iar coloana de indicele $j$ . Elementul matricei $A$ este indicat prin $(A) ij$ , $A ij$ sau $a ij$ . Prin excepție, un singur indice, de exemplu $A 1, A 2$ , se folosește pentru a indica o matrice (nu un element al unei matrice) dintr-o colecție de matrici.

Definiție

Dacă $A$ este o matrice $m \times n$ iar $B$ este o matrice $n \times p$ ,

\mathbf {A} ={\begin{pmatrix}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{m1}&a_{m2}&\cdots &a_{mn}\\\end{pmatrix}},\quad \mathbf {B} ={\begin{pmatrix}b_{11}&b_{12}&\cdots &b_{1p}\\b_{21}&b_{22}&\cdots &b_{2p}\\\vdots &\vdots &\ddots &\vdots \\b_{n1}&b_{n2}&\cdots &b_{np}\\\end{pmatrix}}

Produsul matricial $C = AB$ (notat fără punct sau semnul înmulțirii) este definit ca fiind matricea $m \times p$ ^[6]^[7]^[8]^[9]

\mathbf {C} ={\begin{pmatrix}c_{11}&c_{12}&\cdots &c_{1p}\\c_{21}&c_{22}&\cdots &c_{2p}\\\vdots &\vdots &\ddots &\vdots \\c_{m1}&c_{m2}&\cdots &c_{mp}\\\end{pmatrix}}

asfel încât

c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots +a_{in}b_{nj}=\sum _{k=1}^{n}a_{ik}b_{kj},

pentru $i = 1, ..., m$ și $j = 1, ..., p$ .

Adică elementul $c ij$ al produsului se obține prin înmulțirea termen cu termen a elementelor din linia $i$ a matricei $A$ cu cele din coloana $j$ a matricei $B$ și sumând aceste $n$ produse. Altfel spus, $c ij$ este produsul scalar al liniei $i$ a matricei $A$ cu coloana $j$ a matricei $B$ .

Prin urmare $AB$ poate fi scris și ca

\mathbf {C} ={\begin{pmatrix}a_{11}b_{11}+\cdots +a_{1n}b_{n1}&a_{11}b_{12}+\cdots +a_{1n}b_{n2}&\cdots &a_{11}b_{1p}+\cdots +a_{1n}b_{np}\\a_{21}b_{11}+\cdots +a_{2n}b_{n1}&a_{21}b_{12}+\cdots +a_{2n}b_{n2}&\cdots &a_{21}b_{1p}+\cdots +a_{2n}b_{np}\\\vdots &\vdots &\ddots &\vdots \\a_{m1}b_{11}+\cdots +a_{mn}b_{n1}&a_{m1}b_{12}+\cdots +a_{mn}b_{n2}&\cdots &a_{m1}b_{1p}+\cdots +a_{mn}b_{np}\\\end{pmatrix}}

Astfel produsul $AB$ este definit dacă și numai dacă numărul de coloane din $A$ este egal cu numărul de linii din $B$ ,^[2] în acest caz $n$ .

În majoritatea cazurilor elementele matricilor sunt numere, dar pot fi orice fel de obiecte matematice pentru care sunt definite o adunare și o înmulțire, care sunt asociative, adunarea să fie comutativă, iar înmulțirea să fie distributivă în raport cu adunarea. În particular, elementele pot fi ele înseși matrici.

Ilustrare

Prezentare vizuală a calculului termenilor produsului matricial

Figura din dreapta ilustrează schematic produsul a două matrice $A$ și $B$ , arătând cum fiecare intersecție din matricea produsului corespunde cu o linie din $A$ și o coloană din $B$ .

{\overset {4\times 2{\text{ matrix}}}{\begin{bmatrix}a_{11}&a_{12}\\\cdot &\cdot \\a_{31}&a_{32}\\\cdot &\cdot \\\end{bmatrix}}}{\overset {2\times 3{\text{ matrix}}}{\begin{bmatrix}\cdot &b_{12}&b_{13}\\\cdot &b_{22}&b_{23}\\\end{bmatrix}}}={\overset {4\times 3{\text{ matrix}}}{\begin{bmatrix}\cdot &c_{12}&\cdot \\\cdot &\cdot &\cdot \\\cdot &\cdot &c_{33}\\\cdot &\cdot &\cdot \\\end{bmatrix}}}

Valorile de la intersecții, marcate cu cercuri în figura din dreapta, sunt:

{\begin{aligned}c_{12}&=a_{11}b_{12}+a_{12}b_{22}\\c_{33}&=a_{31}b_{13}+a_{32}b_{23}\end{aligned}}

Principalele aplicații

Istoric, înmulțirea matricilor a fost introdusă pentru a facilita și clarifica calculele din algebra liniară. Această relație strânsă între înmulțirea matricilor și algebra liniară rămâne fundamentală în toate ramurile matematicii, precum și în fizică, chimie, inginerie și informatică.

Aplicații liniare

Dacă un spațiu vectorial are o bază finită, orice vector este reprezentat în mod unic printr-un șir finit de scalari, numit componentele vectorului, ale cărui elemente sunt coordonatele vectorului în acea bază. Aceste componente formează un alt spațiu vectorial, care este izomorf cu spațiul vectorial inițial. Componentele vectorului sunt plasate de obicei într-o matrice coloană (numită și vector coloană), care este o matrice cu o singură coloană. Deci, un vector coloană reprezintă atât componentele vectorului, cât și un vector din spațiului vectorial inițial.

O aplicație liniară $A$ dintr-un spațiu vectorial de dimensiune $n$ într-un spațiu vectorial de dimensiune $m$ aplică un vector coloană

\mathbf {x} ={\begin{pmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{pmatrix}}

pe vectorul coloană

\mathbf {y} =A(\mathbf {x} )={\begin{pmatrix}a_{11}x_{1}+\cdots +a_{1n}x_{n}\\a_{21}x_{1}+\cdots +a_{2n}x_{n}\\\vdots \\a_{m1}x_{1}+\cdots +a_{mn}x_{n}\end{pmatrix}}.

Aplicația liniară $A$ este astfel definită de matricea

\mathbf {A} ={\begin{pmatrix}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{m1}&a_{m2}&\cdots &a_{mn}\\\end{pmatrix}},

și aplică vectorul coloană $\mathbf {x}$ pe produsul matricial

\mathbf {y} =\mathbf {Ax} .

Dacă $B$ este o altă aplicație liniară din spațiul vectorial precedent de dimensiunea $m$ , într-un spațiu vectorial de dimensiunea $p$ , este reprezentată printr-o matrice $\mathbf {B}$ ( $p \times m$ ). Un calcul simplu arată că matricea compunerii $B\circ A$ este produsul matricial $\mathbf {BA} .$ Formula generală $(B\circ A)(\mathbf {x} )=B(A(\mathbf {x} ))$ care definește funcția compusă este prezentată aici ca un caz particular de asociativitate al produsului matricial:

(\mathbf {BA} )\mathbf {x} =\mathbf {B} (\mathbf {Ax} )=\mathbf {BAx} .

Rotațiile geometrice

Folosind un sistem de coordonate carteziene într-un plan euclidian, rotația cu un unghi $\alpha$ în jurul originii este o aplicație liniară. Mai exact,

{\begin{bmatrix}x'\\y'\end{bmatrix}}={\begin{bmatrix}\cos \alpha &-\sin \alpha \\\sin \alpha &\cos \alpha \end{bmatrix}}{\begin{bmatrix}x\\y\end{bmatrix}},

unde punctul inițial $(x,y)$ și imaginea sa $(x',y')$ sunt scrise ca vectori coloană.

Compunerea rotației cu unghiul $\alpha$ și cea cu unghiul $\beta$ corespunde apoi cu produsul matricial

{\begin{bmatrix}\cos \beta &-\sin \beta \\\sin \beta &\cos \beta \end{bmatrix}}{\begin{bmatrix}\cos \alpha &-\sin \alpha \\\sin \alpha &\cos \alpha \end{bmatrix}}={\begin{bmatrix}\cos \beta \cos \alpha -\sin \beta \sin \alpha &-\cos \beta \sin \alpha -\sin \beta \cos \alpha \\\sin \beta \cos \alpha +\cos \beta \sin \alpha &-\sin \beta \sin \alpha +\cos \beta \cos \alpha \end{bmatrix}}={\begin{bmatrix}\cos(\alpha +\beta )&-\sin(\alpha +\beta )\\\sin(\alpha +\beta )&\cos(\alpha +\beta )\end{bmatrix}},

în care membrul drept al ultimei identități conține identitățile trigonometrice pentru sinusul și cosinusul sumei și diferenței unghiurilor, compunerea corespunde rotației cu unghiul $\alpha +\beta$ , cum era de așteptat.

Alocarea resurselor în economie

Calculul elementului din stânga jos a

\mathbf {AB}

corespunde luării în considerare a tuturor căilor (evidențiate) de la materia primă

b_{4}

la produsul final

f_{1}

în graful fluxului de producție

De exemplu, o fabrică fictivă folosește 4 tipuri de materii prime, $b_{1},b_{2},b_{3},b_{4}$ pentru a produce 3 tipuri de bunuri intermediare , $m_{1},m_{2},m_{3}$ , care la rândul lor sunt folosite pentru a produce 3 tipuri de produse finite, $f_{1},f_{2},f_{3}$ . Matricile

\mathbf {A} ={\begin{pmatrix}1&0&1\\2&1&1\\0&1&1\\1&1&2\\\end{pmatrix}}

și

\mathbf {B} ={\begin{pmatrix}1&2&1\\2&3&1\\4&2&2\\\end{pmatrix}}

furnizează cantitatea de materii prime necesare pentru o anumită cantitate de bunuri intermediare și, respectiv, cantitatea de bunuri intermediare necesară pentru o anumită cantitate de produse finite. De exemplu, pentru a produce o unitate de bun intermediar $m_{1}$ , sunt necesare o unitate de materie primă $b_{1}$ , două unități de $b_{2}$ , nicio unitate de $>b_{3}$ și o unitate de $b_{4}$ , corespunzătoare primei coloane din $\mathbf {A}$ .

Folosind înmulțirea matricilor se calculează

\mathbf {AB} ={\begin{pmatrix}5&4&3\\8&9&5\\\ 6&5&3\\11&9&6\\\end{pmatrix}};

această matrice indică direct cantitățile de materii prime necesare pentru cantități date de produse finite. De exemplu, intrarea din stânga jos a $\mathbf {AB}$ este calculată ca fiind $1\cdot 1+1\cdot 2+2\cdot 4=11$ , reflectând faptul că pentru a produce o unitate de $f_{1}$ sunt necesare $11$ unități de $b_{4}$ . Efectiv, este necesară o unitate de $b_{4}$ pentru $m_{1}$ , 2 pentru $m_{2}$ și $4$ pentru fiecare dintre cele două $m_{3}$ unități care intră în unitatea $f_{1}$ , vezi imaginea.

Pentru a produce de exemplu 100 de unități din produsul final $f_{1}$ , 80 de unități de $f_{2}$ și 60 de unități de $f_{3}$ , cantitățile necesare de materii prime pot fi calculate prin

(\mathbf {AB} ){\begin{pmatrix}100\\80\\60\\\end{pmatrix}}={\begin{pmatrix}1000\\1820\\1180\\2180\end{pmatrix}},

adică $1000$ unități de $b_{1}$ , $1820$ unități de $b_{2}$ , $1180$ unități de $b_{3}$ și $2180$ unități de $b_{4}$ . Similar, matricea produsului $\mathbf {AB}$ poate fi utilizată pentru a calcula cantitățile necesare de materii prime pentru alte date privind cantitățile de produse finale.^[10]

Sisteme de ecuații liniare

Forma generală a unui sistem de ecuații liniare este:

{\begin{matrix}a_{11}x_{1}+\cdots +a_{1n}x_{n}=b_{1}\\a_{21}x_{1}+\cdots +a_{2n}x_{n}=b_{2}\\\vdots \\a_{m1}x_{1}+\cdots +a_{mn}x_{n}=b_{m}\end{matrix}}.

Folosind aceeași notație ca mai sus, un astfel de sistem este echivalent cu o singură ecuație matricială:

\mathbf {Ax} =\mathbf {b} .

Produsul scalar, forma biliniară și sesquiliniară

Produsul scalar al doi vectori coloană este elementul unic al produsului matricial

\mathbf {x} ^{\mathsf {T}}\mathbf {y} ,

unde $\mathbf {x} ^{\mathsf {T}}$ este vectorul linie obținut prin transpunerea $\mathbf {x}$ . (De obicei o matrice 1×1 este identificată prin unicul său element.)

În general, orice formă biliniară pe un spațiu vectorial de dimensiune finită poate fi exprimată ca produs matricial:

\mathbf {x} ^{\mathsf {T}}\mathbf {Ay} ,

și orice altă formă sesquiliniară^⁠(d) poate fi exprimată prin

\mathbf {x} ^{\dagger }\mathbf {Ay} ,

unde $\mathbf {x} ^{\dagger }$ este adjuncta lui $\mathbf {x}$ (transpusa conjugată).

Proprietăți generale

Înmulțirea matricială are unele proprietăți asemănătoare cu înmulțirea obișnuită. Totuși, înmulțirea matricială nu este definită dacă numărul de coloane al primului factor diferă de numărul de linii al celui de-al doilea factor și este necomutativă,^[11] chiar și când produsul rămâne definit după schimbarea ordinii factorilor.^[12]^[13]

Necomutativitatea

O operație este comutativă dacă, fiind date două elemente $A$ și $B$ astfel încât produsul $\mathbf {A} \mathbf {B}$ este definit, atunci $\mathbf {B} \mathbf {A}$ este definit și $\mathbf {A} \mathbf {B} =\mathbf {B} \mathbf {A} .$

Înmulțirea matricială a două matrici $A$ și $B$ al căror produs matricial $\mathbf {A} \mathbf {B}$ este definit, ar fi comutativă dacă produsul $\mathbf {B} \mathbf {A}$ este și el definit, iar $\mathbf {A} \mathbf {B} =\mathbf {B} \mathbf {A} .$

Dacă $A$ și $B$ sunt matrici de dimensiunile $m\timesn$ respectiv $p\timesq$ , atunci $\mathbf {A} \mathbf {B}$ este definit dacă $n = p$ , iar $\mathbf {B} \mathbf {A}$ este definit dacă $m = q$ . Prin urmare, dacă unul dintre produse este definit, celălalt ar trebui să fie nedefinit. Dacă $m=q\neq n=p$ , cele două produse sunt definite, dar au dimensiuni diferite; astfel că ele nu pot fi egale. Doar dacă $m = q= n= p$ , adică dacă $A$ și $B$ sunt ambele pătrate, de aceeași dimensiune, ambele produse sunt definite și au aceeași dimensiune. Chiar și în acest caz, în general

\mathbf {A} \mathbf {B} \neq \mathbf {B} \mathbf {A} .

De exemplu

{\begin{pmatrix}0&1\\0&0\end{pmatrix}}{\begin{pmatrix}0&0\\1&0\end{pmatrix}}={\begin{pmatrix}1&0\\0&0\end{pmatrix}},

dar

{\begin{pmatrix}0&0\\1&0\end{pmatrix}}{\begin{pmatrix}0&1\\0&0\end{pmatrix}}={\begin{pmatrix}0&0\\0&1\end{pmatrix}}.

Acest exemplu poate fi extins pentru a arăta că dacă $A$ este o matrice $n\timesn$ cu elementele într-un corp $F$ , atunci $\mathbf {A} \mathbf {B} =\mathbf {B} \mathbf {A}$ pentru orice matrice $B$ $n\timesn$ cu elementele din $F$ dacă și numai dacă $\mathbf {A} =c\,\mathbf {I}$ unde $c\in F$ și $I$ este matricea unitate $n\timesn$ . Dacă, în loc de un corp, se presupune că elementele aparțin unui inel, atunci trebuie adăugată condiția ca $c$ să aparțină centrului inelului.

Un caz particular în care comutativitatea apare este atunci când $D$ și $E$ sunt două matrici diagonale pătrate de aceeași mărime. Atunci $DE = ED$ .^[11] Din nou, dacă matricile sunt peste un inel generic în loc de a fi peste un corp, elementele corespunzătoare ale fiecăreia trebuie, de asemenea, să fie comutative unul față de celălalt pentru ca acest lucru să fie valabil.

Distributivitatea

Produsul matricial este distributiv față de adunarea matricilor. Adică dacă $A, B, C, D$ sunt matrici de dimensiunile respective $m\timesn$ , $n\timesp$ , $n\timesp$ , și $p\timesq$ , există atât distributivitatea la stânga^[11]

\mathbf {A} (\mathbf {B} +\mathbf {C} )=\mathbf {AB} +\mathbf {AC} ,

cât și la dreapta^[11]

(\mathbf {B} +\mathbf {C} )\mathbf {D} =\mathbf {BD} +\mathbf {CD} .

Aceasta rezultă din distributivitatea coeficienților

\sum _{k}a_{ik}(b_{kj}+c_{kj})=\sum _{k}a_{ik}b_{kj}+\sum _{k}a_{ik}c_{kj},

\sum _{k}(b_{ik}+c_{ik})d_{kj}=\sum _{k}b_{ik}d_{kj}+\sum _{k}c_{ik}d_{kj}.

Asociativitatea

Fiind date matricile $A, B$ și $C$ , produsele $(AB) C$ și $A (BC)$ sunt definite dacă și numai dacă numărul de coloane din $A$ este egal cu numărul de linii din $B$ și numărul de coloane din $B$ este egal cu numărul de linii din $C$ (în special, dacă unul dintre produse este definit, atunci celălalt este și el definit). În acest caz există asociativitatea

(\mathbf {AB} )\mathbf {C} =\mathbf {A} (\mathbf {BC} ).

Ca la orice operație asociativă, aceasta permite omiterea parantezelor și scrierea produselor de mai sus ca $\mathbf {ABC} .$

Aceasta se extinde natural la produsul a oricâte matrici, cu condiția ca dimensiunile să se potrivească. Adică dacă $A 1, A 2, ... , A n$ sunt matrici astfel încât numărul de coloane ale $A i$ este egal numărul de linii ale $A i + 1$ pentru $i = 1, ... , n -1$ , atunci produsul

\prod _{i=1}^{n}\mathbf {A} _{i}=\mathbf {A} _{1}\mathbf {A} _{2}\cdots \mathbf {A} _{n}

este definit și nu depinde de ordinea în care se fac înmulțirile, cât timp ordinea matricilor este păstrată fixă.

Aceste proprietăți pot fi demonstrate prin operații de adunare simple, dar lungi. Acest rezultat rezultă și din faptul că matricile sunt aplicații liniare. Prin urmare, proprietatea asociativă a matricilor este pur și simplu un caz particular al proprietății asociative a compunerii funcțiilor^⁠(d).

Produsul cu un scalar

Dacă $A$ este o matrice și $c$ un scalar, atunci matricile $c\mathbf {A}$ și $\mathbf {A} c$ se obțin înmulțind la stânga sau la dreapta toate elementele lui $A$ cu $c$ . Dacă scalarii sunt comutativi, atunci $c\mathbf {A} =\mathbf {A} c.$

Dacă produsul $\mathbf {AB}$ este definit (adică numărul de coloane din $A$ este egal cu numărul de linii din $B$ ), atunci

c(\mathbf {AB} )=(c\mathbf {A} )\mathbf {B}

și

(\mathbf {A} \mathbf {B} )c=\mathbf {A} (\mathbf {B} c).

Dacă scalarii sunt comutativi, atunci toate cele patru matrici sunt egale. În general, toate cele patru sunt egale dacă $c$ aparține centrului unui inel care conține elementele matricei, deoarece în acest caz, $c X = X c$ pentru toate matricile $X$ .

Aceste proprietăți rezultă din biliniaritatea produsului scalarilor:

c\left(\sum _{k}a_{ik}b_{kj}\right)=\sum _{k}(ca_{ik})b_{kj}

\left(\sum _{k}a_{ik}b_{kj}\right)c=\sum _{k}a_{ik}(b_{kj}c).

Operații cu matricea transpusă

Dacă scalarii sunt comutativi, transpusa produsului matricial este produsul, în ordine inversă, al transpuselor factorilor. Acesta este

(\mathbf {AB} )^{\mathsf {T}}=\mathbf {B} ^{\mathsf {T}}\mathbf {A} ^{\mathsf {T}}

unde cu ^T este notată transpusa.

Această identitate nu este valabilă pentru elementele necomutative, deoarece ordinea dintre elementele lui $A$ și $B$ este inversată atunci când se extinde definirea produsului matricial.

Conjugata complexă

Dacă $A$ și $B$ au elemente complexe, atunci

(\mathbf {AB} )^{*}=\mathbf {A} ^{*}\mathbf {B} ^{*}

unde cu $*$ sunt notate conjugatele complexe ale elementelor matricei.

Acest lucru rezultă din aplicarea la definiția produsului matricial a faptului că conjugatul unei sume este suma conjugatelor sumelor, iar conjugatul unui produs este produsul conjugatelor factorilor.

Transpunerea acționează asupra indicilor elementelor, în timp ce conjugarea acționează independent asupra elementelor în sine. Rezultă că, dacă $A$ și $B$ au elemente complexe, există

(\mathbf {AB} )^{\dagger }=\mathbf {B} ^{\dagger }\mathbf {A} ^{\dagger },

unde cu $†$ sunt notate adjunctele (conjugatele transpuselor, sau, echivalent, transpusele conjugatelor).

Matrici pătrate

Fie ${\mathcal {M}}_{n}(R)$ mulțimea de matrici pătrate $n\timesn$ cu elementele din inelul $R$ , care, în practică, este adesea un corp.

În ${\mathcal {M}}_{n}(R)$ , produsul este definit pentru fiecare pereche de matrici. Acest lucru face din ${\mathcal {M}}_{n}(R)$ un inel, care are matricea unitate $I$ ca element neutru (matricea ale cărei elemente pe diagonala principală sunt egale cu 1 și toate celelalte elemente sunt 0). Acest inel este, de asemenea, o R-algebră asociativă^⁠(d).

Dacă $n > 1$ , multe matrici nu au o inversă multiplicativă. De exemplu, o matrice care are toate elementele unei linii (sau unei coloane) 0 nu are inversă. Dacă există, inversa unei matrice $A$ se notează $A -1$ și verifică relația

\mathbf {A} \mathbf {A} ^{-1}=\mathbf {A} ^{-1}\mathbf {A} =\mathbf {I} .

O matrice care are o inversă este o matrice inversabilă. În caz contrar, este o matrice singulară.

Un produs matricial este inversabil dacă și numai dacă fiecare factor este inversabil. În acest caz există relația

(\mathbf {A} \mathbf {B} )^{-1}=\mathbf {B} ^{-1}\mathbf {A} ^{-1}.

Când $R$ este comutativ și, în special, când este un corp, determinantul unui produs este produsul determinanților. Deoarece determinanții sunt scalari, iar scalarii sunt comutativi, există relația

\det(\mathbf {AB} )=\det(\mathbf {BA} )=\det(\mathbf {A} )\det(\mathbf {B} ).

Ceilalți invarianți^⁠(d) matriciali nu se comportă la fel de bine cu produsele. Totuși, dacă $R$ este comutativ, $AB$ și $BA$ au aceeași urmă, același polinom caracteristic^⁠(d) și aceleași valori proprii cu aceleași multiplicități. Totuși, vectorii proprii sunt în general diferiți dacă $AB \neq BA$ .

Puterea unei matrice pătrate

O matrice pătrată poate fi ridicată la orice putere întreagă nenegativă înmulțind-o cu ea însăși în mod repetat, în același mod ca pentru numerele obișnuite. Acesta este,

\mathbf {A} ^{0}=\mathbf {I} ,

\mathbf {A} ^{1}=\mathbf {A} ,

\mathbf {A} ^{k}=\underbrace {\mathbf {A} \mathbf {A} \cdots \mathbf {A} } _{\text{de 𝘬 ori}}.

Calcularea celei de a $k$ -a putere a unei matrice, dacă se face cu algoritmul trivial (înmulțire repetată) necesită de $k -1$ ori timpul unei singure înmulțiri matriciale. Deoarece acest lucru consumă foarte mult timp, se preferă metoda ridicării la putere rapide^⁠(d), care necesită mai puțin de $2 log 2 k$ înmulțiri matriciale, deci este mult mai eficientă.

Un caz ușor de ridicare la putere este cel al unei matrice diagonale. Deoarece produsul matricilor diagonale echivalează cu simpla înmulțire a elementelor diagonale corespunzătoare, a $k$ -a putere a unei matrici diagonale se obține prin ridicarea elementelor ei la puterea $k$ :

{\begin{bmatrix}a_{11}&0&\cdots &0\\0&a_{22}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &a_{nn}\end{bmatrix}}^{k}={\begin{bmatrix}a_{11}^{k}&0&\cdots &0\\0&a_{22}^{k}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &a_{nn}^{k}\end{bmatrix}}.

Aplicație la matrici asemenea

Orice matrice inversabilă $\mathbf {P}$ definește o transformare de asemănare (pe matrici pătrate de aceeași dimensiune ca $\mathbf {P}$ )

S_{\mathbf {P} }(\mathbf {A} )=\mathbf {P} ^{-1}\mathbf {A} \mathbf {P} .

Transformările de asemănare aplică produsul la factori, adică

S_{\mathbf {P} }(\mathbf {AB} )=S_{\mathbf {P} }(\mathbf {A} )S_{\mathbf {P} }(\mathbf {B} ).

De fapt,

\mathbf {P} ^{-1}(\mathbf {AB} )\mathbf {P} =\mathbf {P} ^{-1}\mathbf {A} (\mathbf {P} \mathbf {P} ^{-1})\mathbf {B} \mathbf {P} =(\mathbf {P} ^{-1}\mathbf {A} \mathbf {P} )(\mathbf {P} ^{-1}\mathbf {B} \mathbf {P} ).

Complexitatea de calcul

Îmbunătățirea estimărilor exponentului

ω

în timp pentru complexitatea de calcul a înmulțirii matriciale

O(n^{\omega })

Un algoritm de înmulțire a matricilor care rezultă din definiție necesită în cazul cel mai rău $n 3$ înmulțiri și $(n -1) n 2$ adunări de scalari pentru a calcula produsul a două matrice pătrate $n \times n$ . Într-un model de calcul în care operațiile scalare au timp constant complexitatea sa de calcul^⁠(d) este deci $O(n 3$ ).

Surprinzător, această complexitate nu este optimă, așa cum a arătat în 1969 Volker Strassen, care a furnizat un algoritm, numit acum algoritmul Strassen^⁠(d), cu o complexitate de $O(n^{\log _{2}7})\approx O(n^{2,8074}).$ ^[14]

Din 2020, cel mai bun algoritm de înmulțire matricială era cel dat de Josh Alman și Virginia Vassilevska Williams, cu complexitatea $O (n 2.3728596)$ .^[15]

Nu se știe dacă înmulțirea matricială poate fi efectuată în timp $n 2 + o(1)$ . Acest lucru ar fi optim, deoarece trebuie citite cele $n 2$ elementele unei matrice pentru a o înmulți cu o altă matrice.

Deoarece înmulțirea matricială formează baza pentru mulți algoritmi și multe operații pe matrici chiar au aceeași complexitate ca și înmulțirea matricială (până la o constantă multiplicativă), complexitatea de calcul a înmulțirii matriciale este o chestiune importantă în algebra liniară numerică^⁠(d) și informatica teoretică^⁠(d).

Complexitatea de calcul în funcție de ordinea operațiilor

Deși rezultatul unei secvențe de produse matrice nu depinde de ordinea efectuării produselor (cu condiția ca ordinea matricelor să nu fie schimbată), complexitatea de calcul poate depinde mult de această ordine.

De exemplu, dacă $A, B$ și $C$ sunt matrici cu dimensiunile $10\times30, 30\times5, 5\times60$ , calculul $(AB) C$ necesită $10\times30\times5 + 10\times5\times60 = 4500$ de înmulțiri, în timp ce calculul $A (BC)$ necesită $30\times5\times60 + 10\times30\times60 = 27 000$ de înmulțiri.

Au fost concepuți algoritmi pentru alegerea ordinii optime de efectuare a produselor, adică printr-un număr minim de operații. Când numărul $n$ de matrici crește, s-a demonstrat că alegerea ordinii optime are o complexitate de $O(n\log n).$

Alte tipuri de produse ale matricilor

Înmulțirea „standard” a matricilor prezentată în articolul de față este singurul mod de înmulțire al matricilor studiat în învățământul preuniversitar din România.^[16] Însă există și alte tipuri de produse de matrici:

produs cracovian, definit drept $A \land B = B T A$
produs interior Frobenius, produs scalar al matricilor considerate drept vectori, sau, echivalent suma produselor Hadamard ale elementelor
produs Hadamard, elementele produsului sunt produsele element cu element
produs Kronecker și produs tensorial, generalizare a precedentelor
produs Khatri–Rao
produs extern (sau produs diadic) a două matrici coloană, $\mathbf {a} \mathbf {b} ^{\mathsf {T}}$

Note

^ Anca Ignat, Calcul numeric Arhivat în 13 iunie 2023, la Wayback Machine. (curs 2, 2022, p. 2), Universitatea „Alexandru Ioan Cuza” din Iași, accesat 2023-06-13
^ ^a ^b en Nykamp, Duane. „Multiplying matrices and vectors”. Math Insight. Accesat în 6 septembrie 2020.
^ en O'Connor, John J.; Robertson, Edmund F., „Jacques Philippe Marie Binet”, MacTutor History of Mathematics archive, University of St Andrews .
^ en Lerner, Rita G.; Trigg, G. L. (1991). Encyclopaedia of Physics (ed. 2nd). VHC publishers. ISBN 978-3-527-26954-9.
^ en Parker, C. B. (1994). McGraw Hill Encyclopaedia of Physics (ed. 2nd). ISBN 978-0-07-051400-3.
^ en Lipschutz, S.; Lipson, M. (2009). Linear Algebra. Schaum's Outlines (ed. 4th). McGraw Hill (USA). pp. 30–31. ISBN 978-0-07-154352-1.
^ en Riley, K. F.; Hobson, M. P.; Bence, S. J. (2010). Mathematical methods for physics and engineering . Cambridge University Press. ISBN 978-0-521-86153-3.
^ en Adams, R. A. (1995). Calculus, A Complete Course (ed. 3rd). Addison Wesley. p. 627. ISBN 0-201-82823-5.
^ en Horn, Johnson (2013). Matrix Analysis (ed. 2nd). Cambridge University Press. p. 6. ISBN 978-0-521-54823-6.
^ de Peter Stingl (1996). Mathematik für Fachhochschulen – Technik und Informatik (ed. 5th). München: Carl Hanser Verlag. ISBN 3-446-18668-9. Here: Exm. 5.4.10, pp. 205–206
^ ^a ^b ^c ^d en Weisstein, Eric W. „Matrix Multiplication”. mathworld.wolfram.com. Accesat în 6 septembrie 2020.
^ en Lipcshutz, S.; Lipson, M. (2009). „2”. Linear Algebra. Schaum's Outlines (ed. 4th). McGraw Hill (USA). ISBN 978-0-07-154352-1.
^ en Horn, Johnson (2013). „Chapter 0”. Matrix Analysis (ed. 2nd). Cambridge University Press. ISBN 978-0-521-54823-6.
^ Volker Strassen (1969). „Gaussian elimination is not optimal”. Numerische Mathematik. 13 (4): 354–356. doi:10.1007/BF02165411.
^ Alman, Josh; Williams, Virginia Vassilevska (2020), „A Refined Laser Method and Faster Matrix Multiplication”, 32nd Annual ACM-SIAM Symposium on Discrete Algorithms (SODA 2021), arXiv:2010.05846 
^ Burtea, Marius; Burtea, Georgeta (2006). Carminis, ed. Matematică: Manual pentru clasa a XI-a (PDF). Pitești. pp. 22–26, accesat 2023–03–18. ISBN 978-973-123-417-5. Arhivat din original (PDF) la 15 februarie 2022. Accesat în 16 aprilie 2023.

Bibliografie

en Henry Cohn, Robert Kleinberg, Balázs Szegedy, and Chris Umans. Group-theoretic Algorithms for Matrix Multiplication. arΧiv:math.GR/0511460. Proceedings of the 46th Annual Symposium on Foundations of Computer Science, 23–25 October 2005, Pittsburgh, PA, IEEE Computer Society, pp. 379–388.
en Henry Cohn, Chris Umans. A Group-theoretic Approach to Fast Matrix Multiplication. arΧiv:math.GR/0307321. Proceedings of the 44th Annual IEEE Symposium on Foundations of Computer Science, 11–14 October 2003, Cambridge, MA, IEEE Computer Society, pp. 438–449.
en Coppersmith, D.; Winograd, S. (1990). „Matrix multiplication via arithmetic progressions”. J. Symbolic Comput. 9 (3): 251–280. doi:10.1016/s0747-7171(08)80013-2  .
en Horn, Roger A.; Johnson, Charles R. (1991), Topics in Matrix Analysis, Cambridge University Press, ISBN 978-0-521-46713-1
en Knuth, D.E., The Art of Computer Programming Volume 2: Seminumerical Algorithms. Addison-Wesley Professional; 3 edition (November 14, 1997). ISBN: 978-0-201-89684-8. p. 501
en Press, William H.; Flannery, Brian P.; Teukolsky, Saul A.; Vetterling, William T. (2007), Numerical Recipes: The Art of Scientific Computing (ed. 3rd), Cambridge University Press, ISBN 978-0-521-88068-8
en Ran Raz, On the complexity of matrix product. In Proceedings of the thirty-fourth annual ACM symposium on Theory of computing. ACM Press, 2002 doi:10.1145/509907.509932.
en Robinson, Sara, Toward an Optimal Algorithm for Matrix Multiplication, SIAM News 38(9), November 2005. PDF
en Strassen, Volker, Gaussian Elimination is not Optimal, Numer. Math. 13, p. 354-356, 1969
en Styan, George P. H. (1973), „Hadamard Products and Multivariate Statistical Analysis” (PDF), Linear Algebra and Its Applications, 6: 217–240, doi:10.1016/0024-3795(73)90023-2 
en Williams, Virginia Vassilevska (19 mai 2012). „Multiplying matrices faster than coppersmith-winograd”. Proceedings of the 44th symposium on Theory of Computing - STOC '12. ACM. pp. 887–898. CiteSeerX 10.1.1.297.2680  . doi:10.1145/2213977.2214056. ISBN 9781450312455.

Legături externe

Materiale media legate de înmulțirea matricilor la Wikimedia Commons

Portal Matematică

[AI-1] Anca Ignat, Calcul numeric Arhivat în 13 iunie 2023, la Wayback Machine. (curs 2, 2022, p. 2), Universitatea „Alexandru Ioan Cuza” din Iași, accesat 2023-06-13

[DN-2] Nykamp, Duane. „Multiplying matrices and vectors”. Math Insight. Accesat în 6 septembrie 2020.

[3] O'Connor, John J.; Robertson, Edmund F., „Jacques Philippe Marie Binet”, MacTutor History of Mathematics archive, University of St Andrews .

[Physics_1991-4] Lerner, Rita G.; Trigg, G. L. (1991). Encyclopaedia of Physics (ed. 2nd). VHC publishers. ISBN 978-3-527-26954-9.

[5] Parker, C. B. (1994). McGraw Hill Encyclopaedia of Physics (ed. 2nd). ISBN 978-0-07-051400-3.

[6] Lipschutz, S.; Lipson, M. (2009). Linear Algebra. Schaum's Outlines (ed. 4th). McGraw Hill (USA). pp. 30–31. ISBN 978-0-07-154352-1.

[7] Riley, K. F.; Hobson, M. P.; Bence, S. J. (2010). Mathematical methods for physics and engineering . Cambridge University Press. ISBN 978-0-521-86153-3.

[8] Adams, R. A. (1995). Calculus, A Complete Course (ed. 3rd). Addison Wesley. p. 627. ISBN 0-201-82823-5.

[9] Horn, Johnson (2013). Matrix Analysis (ed. 2nd). Cambridge University Press. p. 6. ISBN 978-0-521-54823-6.

[10] Peter Stingl (1996). Mathematik für Fachhochschulen – Technik und Informatik (ed. 5th). München: Carl Hanser Verlag. ISBN 3-446-18668-9. Here: Exm. 5.4.10, pp. 205–206

[W-11] Weisstein, Eric W. „Matrix Multiplication”. mathworld.wolfram.com. Accesat în 6 septembrie 2020.

[12] Lipcshutz, S.; Lipson, M. (2009). „2”. Linear Algebra. Schaum's Outlines (ed. 4th). McGraw Hill (USA). ISBN 978-0-07-154352-1.

[13] Horn, Johnson (2013). „Chapter 0”. Matrix Analysis (ed. 2nd). Cambridge University Press. ISBN 978-0-521-54823-6.

[14] Volker Strassen (1969). „Gaussian elimination is not optimal”. Numerische Mathematik. 13 (4): 354–356. doi:10.1007/BF02165411.

[Alman2020-15] Alman, Josh; Williams, Virginia Vassilevska (2020), „A Refined Laser Method and Faster Matrix Multiplication”, 32nd Annual ACM-SIAM Symposium on Discrete Algorithms (SODA 2021), arXiv:2010.05846 

[16] Burtea, Marius; Burtea, Georgeta (2006). Carminis, ed. Matematică: Manual pentru clasa a XI-a (PDF). Pitești. pp. 22–26, accesat 2023–03–18. ISBN 978-973-123-417-5. Arhivat din original (PDF) la 15 februarie 2022. Accesat în 16 aprilie 2023.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]