În teoria probabilității și statistică, varianța reprezintă media abaterilor pătratice a unei variabile aleatorii de la media sa. Informal spus, măsoară depărtarea valorilor individuale (aleatorii) dintr-o mulțime, de la media lor. Varianța are un rol crucial în statistică, fiind folosită în statistica descriptivă, statistica inferențială, testarea ipotezelor, calitatea modelării și metodele Monte Carlo. Astfel de metode statistice se folosesc pretutindeni în știință. Varianța reprezintă pătratul deviației standard, al doilea moment central al unei distribuții, și covarianța unei variabile aleatorii cu sine însuși, fiind adesea reprezentată prin , sau .

Exemplu de eșantioane pentru două populații cu medii similare, dar varianțe diferite. Populația reprezentată cu roșu are media 100 și varianța 100 (SD=10), pe când populația reprezentată cu albastru are media 100 și varianța 2500 (SD=50).

Definiție

modificare

Varianța unei variabile aleatorii   este speranța matematică (i.e. media) a deviațiilor pătratice de la media lui  ,  :

 

Această definiție cuprinde variabile aleatorii ce pot fi generate de procese discrete, continue, mixte sau Cantoriene. Varianța poate fi, de asemenea, definită ca reprezentând covarianța unei variabile aleatorii cu sine însăși:

 

Varianța este echivalentă cu al doilea cumulant al unei distribuții de probabilitate ce generează  . Varianța este desemnată prin  ,  , sau  (pronunțat "sigma pătrat"). Expresia varianței poate fi dezvoltată:

 

Cu alte cuvinte, variația lui X este egală cu media valorilor pătratice ale lui X minus pătratul mediei lui X. Această ecuația nu trebuie folosită în programe de calcul ce folosesc virgula mobilă datorită fenomenului de reducere numerică ce apare când cei doi termeni au mărimi identice. Există alternative în algoritmii stabili numeric.

Variabilă aleatorie discretă

modificare

Dacă distribuția variabilei aleatorii   este discretă, având funcția de masă  , atunci:

 

sau echivalent:

 

unde   reprezintă speranța matematică (i.e media distribuției):

  

(În cazul în care suma ponderilor valorilor individuale nu este egală cu 1, atunci ecuația de mai sus trebuie împărțită la respectiva sumă).

Varianța unei mulțimi de   elemente, având probabilități echivalente, poate fi scrisă ca:

 

unde   este valoarea medie, adică,

 

Varianța poate fi exprimată și fără referirea directă la medie, ca reprezentând deviațiile pătratice a tuturor valorilor de la fiecare valoare în parte. Pentru o mulțime de  elemente, având probabilități echivalente, avem: [1]

 

Variabilă aleatorie continuă

modificare

Dacă variabila   este generată de o distribuție continuă cu o funcție de densitate de probabilitate  , și   este funcția de distribuție cumulativă corespunzătoare, atunci varianța populației este dată de:

 

sau echivalent, putem scrie

  

Unde   reprezintă speranța matematică (i.e. media) a lui   dată de:

  

cu integrale definite pe intervalul variabilei  .

Dacă o distribuție continuă nu are o speranță matematică finită (i.e. medie), cum este cazul distribuției Cauchy, nu poate avea nici varianță. Multe alte distribuții pentru care speranța matematică este finită, nu au varianță (finită) pentru că integrala varianței este divergentă. Un astfel de exemplu este dat de distribuția Pareto, al cărui index   satisface  

Distribuția normală

modificare

Distribuția normală cu parametrii   și   este o distribuție continuă (cunoscută și sub numele de distribuție Gaussiană) a cărei funcție de densitate a probabilității este dată de: 

  

În această distribuție,   și varianța   sunt legate de   prin:

 

Rolul distribuției normale în teoria limitei centrale este, în parte, responsabilă pentru prevalența varianței în probabilitate și statistică.

Distribuția exponențială

modificare

Distribuția exponențială cu paramentrul   este o distribuție continuă definită pe intervalul semi-infinit  . Funcția densității de probabilitate este dată de:

 , având o speranță matematică (i.e. medie) egală cu  . Prin urmare, varianța este egală cu:

 

De aici rezultă că, pentru distribuția exponențială, avem relația  

Distribuția Poisson

modificare

Singurul ei parametru este  . Distribuția Poisson este o distribuție discretă pentru  . Funcția de masă a probabilității este:

 iar speranța matematică (i.e. media) este:  . Astfel, varianța este egală cu:

 

De aici rezultă că, pentru distribuția Poisson, avem relația:  .

Distribuția binomială

modificare

Parametrii săi sunt   și  . Distribuția este o distribuție discretă pentru  . Funcția de masă a probabilității este:

  iar speranța matematică (i.e. media) este  . Astfel, varianța este egală cu:

 

Spre exemplu, distribuția binomială cu   descrie probabilitatea de a obține de   ori o oarecare față (exp. ban) în cazul aruncării unei monede de   ori. Deci, speranța matematică (i.e. media) pentru a obține una dintre fețe este  , iar varianța este  

Aruncarea cu zarul

modificare

Un zar cu șase fețe poate fi modelat, conform distribuției binomiale, ca o distribuție cu variabilă discretă X , ce poate lua valori de la 1 la 6, fiecare cu probabilitate egală de 1/6. Speranța matematică (i.e. media) a lui X este   Prin urmare, varianța lui X este:

 

Formula generală pentru varianța lui X , dacă avem un zar cu n fețe n-sided, este:

 

Proprietăți

modificare

Proprietăți fundamentale

modificare

Varianța este non-negativă, deoarece din ridicarea la pătrat poate rezulta doar un număr pozitiv sau zero:

 

Varianța unei variabile aleatorii constante este zero, și, invers, dacă varianța unei variabile este zero, atunci variabila este o constantă:

 

Varianța este invariabilă relativ la schimbările parametrului de poziție. Astfel, dacă o constantă este adăugată (prin adiție) tuturor valorilor pe care le ia variabila, varianța rămâne neschimbată:

 

Dacă toate valorile variabilei sunt multiplicate cu o constantă, varianța variabilei este multiplicată cu pătratul acelei constante (adică proprietatea de scalare):

 

Varianța sumei a două variabile aleatorii este dată de relația:

 

 

unde Cov(⋅, ⋅) reprezintă covarianța. În general, dacă avem o sumă de   variabile aleatorii,  , relația se prezintă ca:

 

Aceste rezultate conduc la varianța combinațiilor liniare:

 

Dacă variabilele aleatorii   sunt astfel încât:

 

se poate afirma despre ele că sunt necorelate. Rezultă din ecuația combinațiilor liniare că dacă variabilele aleatorii   sunt necorelate, varianța sumei lor este egală cu suma varianțelor lor:

 

Deoarece variabilele aleatorii independente sunt mereu necorelate, ecuația de mai sus este valabilă doar când variabilele aleatorii    sunt independente. Prin urmare, independența este o condiție suficientă, dar nu și necesară, pentru ca varianța sumei să fie egală cu suma varianțelor (i.e. ecuația de mai sus să fie adevărată).

Suma variabilelor necorelate (formula lui Bienaymé)

modificare

Unul din motivele pentru care varianța este preferată altor măsuri de dispersie este că varianța sumei variabilelor aleatorii necorelate este egală cu suma varianțelor lor:

 

Această ecuația se numește "formula lui Bienaymé"[2], fiind descoperită în 1853.[3] [4] Deseori presupune condiția ca variabilele să fie independente, deși simpla lipsă de corelare este suficientă. Deci, dacă toate variabilele au aceeași varianță σ2, atunci, deoarece împărțirea cu n este o transformare liniară, formula varianței mediei lor devine:

  

Aceasta înseamnă că varianța mediei scade atunci când n crește. Această formulă pentru varianța mediei este utilizată în definirea erorii standard a mediei eșantionului, care este utilizată in teorema limitei centrale.

Pentru demonstrarea formulei lui Bienaymé, este suficient să se arate că:

 

Această formulă poate fi demonstrată prin inducție, pornindu-se de la definiția varianței:

 

Folosind proprietatea de liniaritate a speranței matematicii (i.e. mediei) și ipoteza independenței variabilelor (sau, cel puțin, a lipsei de corelare) X și Y, ecuația de mai sus se poate dezvolta în felul următor:

 

Suma variabilelor corelate

modificare

În general, dacă variabilele sunt corelate, atunci varianța sumei lor este egală cu suma covarianțelor lor: 

 

(Notă: A doua egalitate se datorează faptului că Cov(Xi,Xi) = Var(Xi))

Aici Cov(⋅, ⋅) reprezintă covarianța, care este zero pentru variabilele aleatorii independente. Formula stipulează că varianța sumei de variabile este egală cu suma tuturor elementelor din matricea de covarianță a variabilelor componente. Următoarea expresie stipulează, în mod echivalent, că varianța sumei de variabile este suma elementelor diagonalei matricei covarianțelor plus de două ori suma elementelor de deasupra diagonalei matricei. Datorită faptului că matricea de covarianță este simetrică, se pot lua în locul elementelor de deasupra diagonalei, elementele de dedesubtul diagonalei. Această formulă se folosește în teoria coeficientului Alpha a lui Cronbach, aceasta fiind esențială în teoria clasică a testării. 

Deci dacă variabilele au varianțele egale cu σ 2 și corelația medie a variabilelor este ρ, atunci varianța mediei lor este:

 

Aceasta implică faptul că varianța mediei crește cu media corelațiilor. Cu alte cuvine, observațiile adiționale corelate nu sunt la fel de efective în reducerea incertitudinii mediei, precum sunt observațiile adiționale independente. Mai mult, dacă variabilele au varianța egală cu 1, în cazul standardizării spre exemplu, formula se simplifică:

 

Această formulă este încorporată în formula de predicție Spearman-Brown a teoriei clasice a testării. Aceasta converge la ρ dacă n tinde la infinit, presupunând că corelația medie rămâne constantă sau converge de asemenea. Încât, pentru varianța mediei variabilelor standardizate cu corelații constante sau având corelația medie convergentă, obținem: 

 

În concluzie, varianța mediei unui număr mare de variabile standardizate este aproximativ egală cu corelația lor medie. Aceasta înseamnă că media variabilelor corelate ale eșantionului nu converge, în general, la media populației, deși legea numerelor mari stipulează că media eșantionului va converge la media populației dacă variabilele sunt independente.

Notația matricială pentru varianța unei combinații liniare

modificare

Fie   un vector coloană cu   variabile aleatorii < , și   un vector coloană cu    scalari  . Prin urmare,   reprezintă o combinație liniară a acestor variabile aleatorii, unde prin   este notată transpusa matricei c. De asemenea, fie   matricea covarianței lui  . Varianța lui   este dată de: [5]

  

Sumă ponderată de variabile

modificare

Proprietatea de scalare, formula lui Bienaymé, împreună cu proprietatea covarianței Cov(aXbY) = ab Cov(XY), implică următoarea expresie:

 

Din cele de mai sus rezultă că efectul ponderării variabilelor (coeficienții a și b) este disproporționat pentru calcularea varianței. Spre exemplu, presupunând că variabilele X și Y sunt necorelate, iar ponderea lui X este de două ori mai mare decât ponderea lui Y (i.e. a = 2b), atunci ponderea lui X în formula varianței va fi de patru ori mai mare decât ponderea lui Y.

Varianța ponderată a n variabile poate fi scrisă ca:

 

Produs de variabile independente

modificare

Dacă două variabile X și Y sunt independente, varianța produsului lor este dată de [6]

 

Prin manipulări, ecuația poate fi transformată la:

 

Produs de variabile dependente statistic

modificare

În general, dacă două variabile sunt dependente statistic, varianța produsului lor este dată de următoarea formulă:

 

Descompunere

modificare

Formula generală pentru descompunerea varianței, sau legea varianței totale, unde   și   sunt două variabile aleatorii, iar varianța lui   există, este:  

 

Speranța matematică (i.e. media condiționată) a lui   dat fiind  , și varianța condiționată   pot fi înțelese în felul următor: dată fiind o valoare particulară y a variabilei aleatorii Y, există o speranță matematică   când Y=y. Această cantitate depinde de valoarea specifică y, fiind o funcție  . Aceeași funcție evaluată pentru variabila aleatorie Y reprezintă speranța matematică (i.e. media condiționată)  

În particular, dacă   este o variabilă aleatorie discretă ce ia valori   cu probabilitățile corespunzătoare  , atunci formula pentru varianța totală este:

 

unde  . În mod similar, varianța mediei (al doilea termen al formulei generale) devine:

  

unde   și  . Astfel, formula varianței total devine:

 

O formulă similară este folosită în procesul de analiză a varianței (i.e. ANOVA): 

 

unde   semnifică media pătratelor (engl. “mean of the squares”). În cazul regresiei liniare, formula devine: 

 

Această formulă poate fi derivată și din proprietatea de aditivitate a varianțelor, de vreme ce varianță totală (observată) este egală cu suma dintre varianță prognozată și varianță reziduală (i.e. eroarea de prognoză), cele două fiind necorelate.

Descompuneri similare sunt posibile pentru suma deviațiilor pătratice  :

   

Proprietate caracteristică

modificare

Al doilea moment al unei variabile aleatorii atinge valoarea minimă când este luat în jurul primului moment (care este media) al variabilei aleatorii, i.e.  . Invers, dacă o funcție continuă   satisface   pentru toate variabilele aleatorii X, atunci este neapărat de forma  , unde a>0. Aceasta rămâne valabil și în cazul multidimensionalității. [7]

Unități de măsură

modificare

Spre deosebire de speranța matematică a deviației absolute, unitatea de măsură a varianței este pătratul unității variabilei. Spre exemplu, o variabilă având unitatea de măsură în metri, va avea varianța măsurată în metri pătrați. Din acest motiv, descrierea unei mulțimi cu ajutorul deviației standard sau a rădăcinii deviației pătratice medii este deseori preferată în locul varianței. În problema aruncării cu zarul, prezentată mai sus, deviația standard este √2,9   ≈   1,7 - puțin mai mare decât speranță matematică a deviației absolute care este 1.5.

Atât deviația standard, cât și speranța matematică a deviației absolute, pot fi folosite pentru a indica “împrăștierea” unei distribuții. Deviația standard este mai convenabilă manipulărilor algebrice decât speranța matematică a deviației absolute, ambele fiind folosite frecvent, alături de varianță și covarianță, în știința statisticii. Totuși, speranța matematică a deviației absolute tinde să fie mai robustă față de valorile extreme (datorate erorilor de măsurare sau specificității distribuției).

Aproximarea varianței unei funcții

modificare

Metoda delta folosește seriile Taylor de ordinul doi pentru a aproxima varianța unei funcții de una sau mai multe variabile aleatorii. Spre exemplu, aproximarea varianței unei funcții de o variabilă este dată de formula:

 

presupunând că f este dublu diferențiabilă și că media și varianța lui X sunt finite. Pentru mai multe detalii, vezi seria Taylor pentru momentele funcțiilor de variabile aleatorii.

Varianța unei populații și varianța unui eșantion

modificare

Observațiile din natură, precum cele privitoare la cantitatea zilnică de precipitații, nu pot fi considerate a fi complete deoarece nu putem înregistra toate fenomenele similare petrecute de la începutul timpului (i.e. toate zilele cu precipitații de la începutul existenței Pământului). Prin urmare, varianța calculată dintr-o mulțime de observații limitate (în timp sau spațiu), nu poate fi egală cu varianța ce ar fi rezultat dacă am fi avut mulțimea exhaustivă de observații (i.e. nelimitate de timp sau spațiu). Aceasta înseamnă că va trebui să estimăm media și varianța mulțimii exhaustive de observații (i.e. a populației) folosind o ecuație estimatoare. Ecuația estimatoare este o funcție de n observații ale unui eșantion extras, fără erori de eșantionare, din întreaga populație de observații posibile.

Cei mai simplii estimatori pentru media și varianța unei populații sunt media și varianța eșantionului, aceștia fiind estimatori consistenți (i.e. converg la valoarea reală odată cu creșterea numărului de eșantioane). Totuși, estimarea varianței eșantionului poate fi îmbunătățită în mai multe feluri.   În acest sens, se pot folosi divizori diferiți de n pentru deviațiile pătratice. Ceilalți trei divizori folosiți sunt: n-1, n+1 și n-1,5. Se consideră că n-1 elimină alterarea, n+1 minimizează eroarea pătratică medie pentru distribuția normală, și n – 1,5 elimină alterarea estimatorului deviației standard pentru distribuția normală.

Dacă media populației este necunoscută, fiind calculată pe baza eșantionului, atunci varianța eșantionului este un estimator alterat datorită subestimării varianței cu un factor de (n-1)/n; corectând estimarea cu acest factor (și deci împărțind deviațiile pătratice cu n-1 în loc de n), se numește corecția lui Bessel. Estimatorul rezultat este nealterat, numindu-se varianța corectată a eșantionului sau varianța nealterată a eșantionului. Spre exemplu, dacă avem o singură observație într-un eșantion (i.e. media în sine), varianța eșantionului este evident zero, indiferent de varianța reală a populației. Acest fapt nu ar mai fi valabil dacă s-ar cunoaște media populației (sau ar putea fi estimată dintr-un alt eșantion decât cel din care este estimată varianța), caz în care varianța poate fi estimată prin împărțire la n. În exemplul cu o singură observație, varianța ar fi egală cu deviația pătratică a observației de la media (estimată a) populației.

Pe de altă parte, varianța eșantionului nu minimizează eroarea pătratică medie între varianța eșantionului și varianța populației. Folosind corecția lui Bessel înrăutățește estimarea erorii pătratice medii. De aceea, în acest caz se folosește un factor de scalare (i.e. de proporționare) mai mare decat (n-1), împărțindu-se varianța eșantionului, în cazul distribuției normale, la (n+1) pentru a minimiza eroarea pătratică medie. În acest caz folosim totuși o variație alterată a eșantionului.

Varianța populației

modificare

În general, varianța unei populații finite de mărime N, cu valori xi este dată de:

 

unde media populației este:

 

Varianța populației poate fi calculată și folosind următoarea formulă:

 

Aceasta este validă, deoarece:

 

Varianța populației corespunde varianței disitributiei de probabilitate aferente, de aceea conceptul de populație poate fi extins pentru distribuții de probabilitate continue, având mărimi infinite. .

Varianța eșantionului

modificare

În multe situații practice, varianța populației nu poate fi cunoscută a priori, trebuind a fi estimată prin alegerea unui eșantion.[8] Ca și în cazul varianței populației, varianța eșantionului poate fi calculată și pentru o distribuție continuă aferentă distribuției populației.

Fie un eșantion cu n valori Y 1 , . . .,Y n extras dintr-o anumită populație N, unde n < N. [9] Atunci varianța eșantionului este dată de media deviațiilor pătratice:

 

Aici,   denotă media eșantionului:

 

Deoarece Yi au fost selectate aleatoriu, atât   cât și  <  sunt variabile aleatorii. Speranța lor matematică poate fi evaluată prin luarea mediei estimatorilor aferenți tuturor eșantioanelor posibile { Y} de mărime n din populație. Așa încât, pentru   avem:

 

Prin urmare   este o estimare a varianței populației ce este alterată cu un factor de  . Din acest motiv,   se numește varianța alterată a eșantionului. Corectând această alterație, obținem varianța nealterată a eșantionului:

 

Corecția Bassel (n-1) se folosește și în calcularea covarianței eșantionului și a deviației standard a eșantionului (i.e. rădăcina pătrată a varianței). Rădăcina pătrată este o funcție concavă, introducând astfel alterația negativă (conform inegalității lui Jensen), ceea ce, depinzând de distribuție, face ca deviația standard folosind corecția Basel să fie alterată în acest caz. Estimarea deviației standard nealterate este o problemă tehnică complicată, deși pentru distribuția normală se poate folosi divizorul (n -1,5) din care rezultă un estimator al deviației standard aproape nealterat. .

Distribuția varianței eșantionului

modificare
Distribuția de probabilitate și distribuția cumulativă a lui S22, pentru diferite valori ale lui ν = n − 1, când yi sunt independente și normal distribuite.

Fiind o funcție de variabile aleatorii, varianța eșantionului este ea însăși o variabilă aleatorie, fiind astfel justificat să-i studiem distribuția. În cazul în care Yi sunt observații independente ale unei distribuții normale, teorema lui Cochran arată că S2 se conformează unei distribuții chi-pătrat : [10]

 

O consecință directă a acestui fapt este că:

 

și [11]

 

Dacă valorile  Yi sunt independente și identic distribuite, dar nu necesar și normal distribuite, atunci:[12] [13]

 

unde κ este aplatizarea (i.e. kurtotizarea) distribuției, iar  μ4 este al patrulea moment central.

Dacă legea numerelor mari este valabilă pentru observațiile pătratice, s2 este un estimator consistent al σ2. Poate fi demonstrat că varianța estimatorilor tinde asimptotic către zero. O formulă asimptotică echivalentă a fost dată în Kenney and Keeping (1951: 164), Rose and Smith (2002: 264), și Weisstein (n.d.). [14] [15] [16]

Inegalitatea lui Samuelson

modificare

Inegalitatea lui Samuelson este un rezultat care stipulează limite pentru valorile ce pot fi luate de observațiile individuale dintr-un eșantion, presupunând că acel eșantion are medie și varianță [17] Conform acesteia, valorile trebuie să fie cuprinse în intervalul:  

Relații cu media armonică și media aritmetică

modificare

A fost arătat că pentru un eșantion [18] { yi } de numere reale,

 

unde y max reprezintă valoarea maximă a eșantionului, A este media aritmetică, H este media armonică a eșantionului și   este varianța (alterată) a eșantionului.

Ulterior, acest interval a fost dezvoltat, încât s-a ajuns la următorul interval de mărginire a varianței:

 

 

unde y min este valoarea minimă a eșantionului. [19]

Termenul de varianță a fost introdus prima dată de Ronald Fisher într-un articol din 1918 intitulat The Correlation Between Relatives on the Supposition of Mendelian Inheritance: [20]

Marea literatură statistică ne arată cum deviațiile măsurătorilor umane de la medie urmează îndeaproape Legea Normală a Erorilor, și, prin urmare, că variabilitatea poate fi măsurată uniform cu ajutorul deviației standard corespunzătoare rădăcinii pătratice a erorii pătratice medii. Când există două cauze independente cauzatoare de variabilitate într-o distribuție uniformă cu deviațiile standard   și  , se găsește că distribuția, atunci când cauzele acționează împreună, are o deviație standard de  . Este prin urmare de dorit în analizarea cauzelor variabilității să ne ocupăm de pătratul deviației standard ca măsură a variabilității. Vom numi această cantitate “varianță”...  

 
Vizualizare geometrică a varianței unei distribuții aleatorii (2, 4, 4, 4, 5, 5, 7, 9):
  1. Distribuția frecvențială este construită
  2. Identificând centroidul distribuției găsim media ei
  3. Câte-un pătrat cu latura egală cu diferența valorii individuale de la medie este format pentru fiecare valoare individuală
  4. Aranjând pătratele într-un dreptunghi cu o latură egală cu numărul de valori n, rezultă în revelarea de către cealaltă latură a varianței distribuției, σ².

Semivarianța

modificare

Semivarianța este calculată asemenea varianței, însă doar acele observații mai mici decât media sunt luate în considerare. Uneori este descrisă ca fiind riscul de pierderi într-un context investițional. Pentru distribuții asimetrice, semivarianța poate oferi informații adiționale pe care varianța le ignoră. [necesită citare]

Semivarianța poate fi folosită și pentru a determina intervalul de valori pe care o distribuție o poate lua în jurul mediei, conform inegalității lui Chebyshev.

Generalizări

modificare

Pentru variabile complexe

modificare

Dacă   este o variabilă aleatorie complexă scalară, cu valori în   atunci varianța sa este  , unde   este conjugata complexă a lui  . Această varianță este un scalar real.

Pentru variabile vectoriale aleatorii

modificare

Ca matrice

modificare

Dacă   este un vector coloană ce cuprinde valori aleatorii, cu valori în  , atunci o generalizare naturală a varianței este   unde   este transpusa lui  , fiind astfel un vector linie. Rezultatul este o matrice pătratică semidefinită, cunoscută sub numele de matricea varianță-covarianță (sau, mai simplu, matricea covarianței).

Dacă   este un vector coloană ce cuprinde valori aleatorii, cu valori în   atunci matricea covarianței este  , unde   este transpusa conjugată a lui   Și această matrice este pătratică și pozitiv semidefinită.

Ca scalar

modificare

O altă generalizare a varianței pentru valori vectoriale de variabile aleatorii   care rezultă într-o valoare scalară în loc de structură matriceală, este obținută prin interpretarea deviației dintre variabila aleatorie și media sa ca distanță Euclidiană. Rezultatul este că  ceea ce reprezintă o urmă matriceală a matricei covarianței.

Vezi și

modificare
  1. ^ Yuli Zhang, Huaiyu Wu, Lei Cheng (iunie 2012). Some new deformation formulas about variance and covariance. Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992. 
  2. ^ Loève, M. (1977) "Probability Theory", Graduate Texts in Mathematics, Volume 45, 4th edition, Springer-Verlag, p. 12.
  3. ^ Bienaymé, I.-J. (1853) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés", Comptes rendus de l'Académie des sciences Paris, 37, p. 309–317; digital copy available [1]
  4. ^ Bienaymé, I.-J. (1867) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la méthode des moindres carrés", Journal de Mathématiques Pures et Appliquées, Série 2, Tome 12, p. 158–167; digital copy available [2][3]
  5. ^ Johnson, Richard; Wichern, Dean (). Applied Multivariate Statistical Analysis. Prentice Hall. p. 76. ISBN 0-13-187715-1. 
  6. ^ Goodman, Leo A. (decembrie 1960). „On the Exact Variance of Products”. Journal of the American Statistical Association. 55 (292): 708. doi:10.2307/2281592. JSTOR 2281592. 
  7. ^ Kagan, A.; Shepp, L. A. (). „Why the variance?”. Statistics & Probability Letters. 38 (4): 329–333. doi:10.1016/S0167-7152(98)00041-8. 
  8. ^ Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.
  9. ^ Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York
  10. ^ Knight K. (2000), Mathematical Statistics, Chapman and Hall, New York. (proposition 2.11)
  11. ^ Casella and Berger (2002) Statistical Inference, Example 7.3.3, p. 331 [referință neconformată]
  12. ^ Cho, Eungchun; Cho, Moon Jung; Eltinge, John (2005) The Variance of Sample Variance From a Finite Population. International Journal of Pure and Applied Mathematics 21 (3): 387-394. http://www.ijpam.eu/contents/2005-21-3/10/10.pdf
  13. ^ Cho, Eungchun; Cho, Moon Jung (2009) Variance of Sample Variance With Replacement. International Journal of Pure and Applied Mathematics 52 (1): 43–47. http://www.ijpam.eu/contents/2009-52-1/5/5.pdf
  14. ^ Kenney, John F.; Keeping, E.S. (1951) Mathematics of Statistics. Part Two. 2nd ed. D. Van Nostrand Company, Inc. Princeton: New Jersey. http://krishikosh.egranth.ac.in/bitstream/1/2025521/1/G2257.pdf
  15. ^ Rose, Colin; Smith, Murray D. (2002) Mathematical Statistics with Mathematica. Springer-Verlag, New York. http://www.mathstatica.com/book/Mathematical_Statistics_with_Mathematica.pdf
  16. ^ Weisstein, Eric W. (n.d.) Sample Variance Distribution. MathWorld—A Wolfram Web Resource. http://mathworld.wolfram.com/SampleVarianceDistribution.html
  17. ^ Samuelson, Paul (). „How Deviant Can You Be?”. Journal of the American Statistical Association. 63 (324): 1522–1525. doi:10.1080/01621459.1968.10480944. JSTOR 2285901. 
  18. ^ Mercer, A. McD. (). „Bounds for A–G, A–H, G–H, and a family of inequalities of Ky Fan's type, using a general method”. J. Math. Anal. Appl. 243 (1): 163–173. doi:10.1006/jmaa.1999.6688. 
  19. ^ Sharma, R. (). „Some more inequalities for arithmetic mean, harmonic mean and variance”. J. Math. Inequalities. 2 (1): 109–114. doi:10.7153/jmi-02-11. 
  20. ^ Ronald Fisher (1918) The correlation between relatives on the supposition of Mendelian Inheritance