Nucleu (algebră liniară)

În matematică, și mai precis în algebra liniară și analiza funcțională⁠(d), nucleul (de asemenea, cunoscut sub numele de kernel sau ker, după notația practicată) al unei aplicații liniare L : VW între două spații vectoriale V și W, este mulțimea tuturor elementelor v din V pentru care L(v) = 0, unde 0 indică vectorul zero din W. Adică, în notația de construcție a mulțimilor⁠(d),

Proprietăți ale nucleului modificare

 
Nucleul și imaginea unei aplicații L.

Nucleul lui L este un subspațiu vectorial⁠(d) al domeniului V.[1] În aplicația liniară L : VW, două elemente din V au aceeași imagine în W dacă și numai dacă diferența lor aparține nucleului lui L:

 

Rezultă că imaginea L este izomorfă cu factorul⁠(d) lui V în raport cu nucleul:

 

Acest lucru implică teorema rangului⁠(d):

 

Dimensiunea imaginii lui L se numește „rang”, iar cea a nucleului se numește „defect”.

Când V este un spațiu cu produs scalar, factorul V / ker(L) poate fi identificat cu complementul ortogonal în V al  lui ker(L). Aceasta este o generalizare a aplicațiilor liniare a spațiului rândurilor unei matrice.

Aplicații în domeniul modulelor modificare

Noțiunea de nucleu se aplică omomorfismelor de module, acestea din urmă fiind o generalizare a spațiilor vectoriale (care sunt definite peste un corp) peste un inel. Domeniul aplicațiilor este un modul, și nucleul constituie un „submodul⁠(d)”. Aici, nu se mai aplică neapărat noțiunile de rang și defect.

Nucleul în analiza funcțională modificare

Dacă V și W sunt spatii vectoriale topologice⁠(d) (și W este finit-dimensional), atunci aplicația liniară L: VW este continuă⁠(d) dacă și numai dacă nucleul lui L este un subspațiu închis al lui V.

Reprezentarea ca înmulțire de matrice modificare

Fie o aplicație liniară reprezentată ca o matrice m × n A cu coeficienți într-un corp K (de obicei, corpul numerelor reale sau al numerelor complexe) și care funcționează ca vectori coloană x cu n componente peste K. Nucleul acestei aplicații liniare este mulțimea soluțiilor ecuației Ax = 0A x = 0, unde 0 se înțelege ca vector zero. Dimensiunea nucleului lui A se numește defectul lui A. În notația de construcție a mulțimilor⁠(d),

 

Ecuația matriceală este echivalentă cu un sistem de ecuații liniare omogen:

 

Astfel, nucleul lui A este același ca și mulțimea soluțiilor ecuațiilor omogene de mai sus.

Proprietățile subspațiului modificare

Nucleul unei matrice m × n A peste un corp K este un subspatiu vectorial⁠(d) al lui Kn. Cu alte cuvinte, nucleul lui A, mulțimea ker(A), are următoarele trei proprietăți:

  1. Ker(A) conține întotdeauna vectorul zero, deoarece A0 = 0.
  2. Dacă x ∈ Zero(A) și y ∈ Zero(A), atunci x + y ∈ Zero(A). Acest lucru rezultă din distributivitatea înmulțirii matricilor în raport cu adunarea.
  3. Dacă x ∈ Zero(A) și c este un scalar cK, atunci cx ∈ Zero(A), deoarece A(cx) = c(Ax) = c0 = 0.

Spațiul rândurilor unei matrice modificare

Produsul Ax poate fi scris în termeni de produs scalar al vectorilor după cum urmează:

 

Aici, cu a1, ... , am se notează transpusele rândurilor matricei A. Rezultă că x este în nucleul lui A dacă și numai dacă x este ortogonal pe fiecare vector-rând al lui A (pentru că atunci când produsul scalar a doi vectori este egal cu zero, ei sunt, prin definiție, ortogonali).

Spațiul rândurilor⁠(d) unei matrice A este spațiul generat⁠(d) de vectoriu rând din A. Prin raționamentul de mai sus, nucleul lui A este complement ortogonal al spațiului rândurilor. Cu alte cuvinte, un vector x se află în nucleul lui A dacă și numai dacă este ortogonal pe orice vector din spațiul rândurilor lui A.

Dimensiunea spațiului rândurilor lui A se numește rang al lui A, și dimensiunea nucleului lui A se numește defectul lui A. Aceste cantități sunt legate de teorema rangului⁠(d)

 

Nucleul la stânga⁠(d) modificare

Nucleul la stânga, sau conucleul unei matrice A este format din toți vectorii x , astfel încât xTA = 0T, unde cu T la exponent se notează transpusa unui vector coloană. Nucleul la stânga al lui A este nucleul lui AT. Nucleul la stânga al lui A este complementul ortogonal al spațiului coloanelor⁠(d) lui A, și este dual cu conucleul⁠(d) asociată aplicației liniare. Nucleul, spațiul rândurilor, spațiul coloanelor, și nucleul la stânga ale lui A sunt cele patru subspații fundamentale⁠(d) asociate matricei A.

Sisteme de ecuatii liniare neomogene modificare

Nucleul joacă un rol și în soluțiile unui sistem de ecuații liniare neomogene:

 

Dacă u și v sunt două posibile soluții pentru ecuația de mai sus, atunci

 

Astfel, diferența dintre oricare două soluții pentru ecuația Ax = b se află în nucleul lui A.

Rezultă că orice soluție a ecuației Ax = b poate fi exprimată ca sumă între o soluție fixă v și un element arbitrar din nucleu. Cu alte cuvinte, mulțimea soluțiilor ecuației Ax = b este

 

Din punct de vedere geometric, aceasta spune că soluția pentru Ax = b este o translație a nucleului lui A prin vectorul v

Ilustrare modificare

Vom da aici un exemplu simplu de calcul al nucleului unei matrice (a se vedea secțiunea Baze de mai jos pentru metode mai potrivite pentru calcule mai complexe). Exemplul atinge și noțiunea de spațiu al rândurilor și relația acesteia cu nucleul.

Fie matricea

 

Nucleul acestei matrice este format din toți vectorii (x, y, z) ∈ R3 pentru care

 

ceea ce se poate exprima ca un sistem de ecuații liniare omogen în x, y, și z:

 

Aceleași ecuații liniare pot fi scrise în formă de matrice ca:

 

Prin eliminare Gauss–Jordan, se reduce la:

 

Rescriind matricea sub formă de ecuații, rezultă:

 

Elementele nucleului pot fi mai departe exprimate sub formă parametrică după cum urmează:

 

pentru un c scalar.

Deoarece c este o variabilă liberă⁠(d), acest lucru poate fi exprimat la fel de bine ca:

 

Nucleul lui A este soluția acestor ecuații (în acest caz, o dreaptă prin originea lui R3); vectorul (-1,-26,16)T constituie o bază a nucleului lui A. Astfel, defectul lui A este 1.

Se observă  și că următoarele produse scalare sunt zero:

 

ceea ce ilustrează faptul că vectorii din nucleul lui A sunt ortogonali pe fiecare vector-rând al lui A.

Acești doi vectori-rând (liniar independenți) generează spațiul rândurilor lui A, un plan ortogonal pe vectorul (-1,-26,16)T.

Cum rangul lui A este 2, defectul lui A este 1, și dimensiunea lui A 3, avem o ilustrare a teoremei rangului.

Exemple modificare

  • Dacă L: RmRn, atunci nucleul lui L este mulțimea soluțiilor unui sistem de ecuații liniare omogen. La fel ca în ilustrația de mai sus, dacă L este aplicația:
 
atunci nucleul lui L este mulțimea soluțiilor ecuațiilor
 
  • Fie C[0,1] spațiul vectorial al tuturor funcțiilor continue cu valori reale definite pe intervalul [0,1], fie L: C[0,1] → R definit prin regula:
 
Atunci nucleul lui L constă din toate funcțiile fC[0,1] pentru care f(0.3) = 0.
 
Atunci, nucleul lui D este format din toate funcțiile din C(R), care au derivata zero, adică mulțimea tuturor funcțiilor constante.
 
Atunci nucleul lui s este subspațiu unidimensional format din toți vectorii (x1, 0, 0, ...).

Calcul prin eliminare Gauss modificare

O bază a nucleului unei matrice poate fi calculată prin eliminarea gaussiană⁠(d).

În acest scop, dată fiind o matrice m × n A, se construiește mai întâi matricea   unde II este matricea unitate n × n.

Calculând matricea eșalon pe coloane⁠(d) prin eliminare Gauss (sau orice altă metodă adecvată), se obține o matrice   O bază a nucleului lui A constă în coloanele nenule ale lui C astfel încât coloana corespunzătoare din B este o coloană nulă.

În fapt, calculul poate fi oprit de îndată ce partea superioară este matricea în forma eșalon pe coloană: restul calculului constă în schimbarea bazei spațiului vectorial generat de coloanele a căror parte superioară este zero.

De exemplu, să presupunem că

 

Atunci

 

Aducând partea de sus în forma eșalon pe coloane prin operațiuni cu coloanele pe întreaga matrice rezultă

 

Ultimele trei coloane din B sunt coloane nule. Prin urmare, în ultimii trei vectori de C,

 

sunt o bază a nucleului lui A.

Întrucât operațiile pe coloane corespund unei înmulțiri prealabile cu matrici inversabile, faptul că   se reduce la   ne spune că  . Cu alte cuvinte, acțiunea lui   via (coloanele lui)   corespunde cu acțiunea lui  . Întrucât   este în formă eșalon pe coloane, ea acționează trivial doar asupra elementelor bazei elementare ce corespund coloanelor nule din  . Întrucât acțiunea lui   corespunde acțiunii lui   prin coloanele lui  , coloanele corespunzătoare din   trebuie să fie coloane nule pentru  , și trebuie să formeze baza nucleului lui   conform teoremei rangului.

Calcul numeric modificare

Problema de calcul pe calculator al nucleului depinde de natura coeficienților.

Coeficienții exacți modificare

Dacă coeficienții matricei sunt numere date, forma eșalon pe coloane⁠(d) a matricei poate fi calculată prin algoritmul Bareiss⁠(d) mai eficient decât prin eliminare gaussiană. Este chiar mai eficient să se utilizeze aritmetica modulară⁠(d), care reduce problema la una similară peste un corp finit.[necesită citare]

Pentru coeficienți într-un corp finit, eliminarea gaussiană funcționează bine, dar pentru matrice mari ca cele care apar in criptografie se cunosc algoritmi mai buni, care au aproximativ aceeași complexitate⁠(d), dar sunt mai rapide și se comportă mai bine pe hardware modern.[necesită citare]

Calculul în virgulă mobilă modificare

Pentru matrice ale căror elemente sunt numere în virgulă mobilă, problema calculării nucleului are sens numai pentru matrice al căror număr de rânduri este egal cu rangul: din cauza erorilor de rotunjire⁠(d), o matrice cu elemente în virgulă mobilă are aproape întotdeauna rang complet, chiar și atunci când este o aproximare a unei matrice cu rang mult mai mic. Chiar și pentru o matrice cu rang complet, se poate calcula nucleul numai dacă este bine condiționată⁠(d), adică are un număr de condiționare mic.[2]

Chiar și pentru o matrice cu rang complet bine condiționată, eliminarea gaussiană nu se comportă corect: introduce erori de rotunjire care sunt prea mari pentru a obține un rezultat semnificativ. Întrucât calculul nucleului unei matrice este un caz particular de rezolvare a unui sistem omogen de ecuații liniare, nucleul poate fi calculat de către oricare dintre diverșii algoritmi concepuți pentru a rezolva sisteme omogene. Un software de ultimă generație pentru acest scop este biblioteca Lapack⁠(d).[necesită citare]

Note modificare

  1. ^ Algebra liniară, așa cum este discutată în acest articol, este o disciplină matematică foarte bine stabilită, pentru care există multe surse. Aproape tot materialul din acest articol poate fi găsit în Lay 2005. , Meyer 2001. , și cursul lui Strang.
  2. ^ „copie arhivă” (PDF). Arhivat din original (PDF) la . Accesat în . 

Referințe modificare

  • Axler, Sheldon Jay (), Linear Algebra Done Right (ed. 2nd), Springer-Verlag, ISBN 0-387-98259-0.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Lay, David C. (), Linear Algebra and Its Applications (ed. 3rd), Addison Wesley, ISBN 978-0-321-28713-7.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Meyer, Carl D. (), Matrix Analysis and Applied Linear Algebra, Society for Industrial and Applied Mathematics (SIAM), ISBN 978-0-89871-454-8, arhivat din original la , accesat în .  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Poole, David (), Linear Algebra: A Modern Introduction (ed. 2nd), Brooks/Cole, ISBN 0-534-99845-3.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)
  • Anton, Howard (), Elementary Linear Algebra (Applications Version) (ed. 9th), Wiley International. 
  • Leon, Steven J. (), Linear Algebra With Applications (ed. 7th), Pearson Prentice Hall. 
  • Lang, Serge (). Linear Algebra. Springer. ISBN 9780387964126. 
  • Trefethen, Lloyd N.; Bau, David III (), Numerical Linear Algebra, SIAM, ISBN 978-0-89871-361-9.  Mai multe valori specificate pentru |ISBN= și |isbn= (ajutor)

Legături externe modificare