Asimetria (estadística)En la teoria de la probabilitat i estadística, l'asimetria[nota 1] és una mesura de la simetria (o asimetria, segons com es vulgui dir) d'una distribució de probabilitat d'una variable aleatòria de valors reals, a un costat i altre de la mitjana. El valor de l'asimetria pot ser positiu o negatiu, o fins i tot indefinit (zero, o gairebé zero). Qualitativament, un biaix negatiu indica que la cua en el costat esquerre de la funció de densitat de probabilitat és més llarg que el del costat dret i la major part dels valors (que poden incloure la mitjana) es troben a la dreta de la mitjana. Un biaix positiu indica que la cua en el costat dret és més llarg que el costat esquerre i la major part dels valors es troben a l'esquerra de la mitjana. Un valor de zero (o gairebé zero) indica que els valors són relativament distribuïts de forma uniforme a banda i banda de la mitjana. Addicionalment, en el cas de distribucions multimodals, l'asimetria és difícil d'interpretar. Per exemple, l'asimetria no determina la relació entre la mitjana i la mediana. IntroduccióConsiderem les dues distribucions de la figura. En cada gràfic, les barres de la part dreta es deformen de manera diferent que les barres de la part esquerra. Aquestes deformacions dels costats s'anomenen cues, i proporcionen un mecanisme visual per determinar quina de les dues asimetries té una distribució:
L'asimetria d'una sèrie de dades es pot observar no només de manera gràfica, sinó també per simple inspecció dels valors. Per exemple, considerem la seqüència numèrica (49, 50, 51), que té els valors distribuïts uniformement al voltant d'un valor central (50). Podem transformar aquesta seqüència en una distribució amb asimetria negativa mitjançant l'addició d'un valor molt per sota de la mitjana, per exemple (40, 49, 50, 51). De manera semblant, podem fer que la seqüència tingui asimetria positiva afegint un valor molt per sobre de la mitjana, com en (49, 50, 51, 60). Relació entre la mitjana i la medianaL'asimetria no està estrictament lligada a la relació entre la mitjana i la mediana: una distribució amb asimetria negativa pot tenir una mitjana més gran o igual a la mediana, i anàlogament per a l'asimetria positiva. En l'antiga noció d'asimetria no paramètrica, definida com on µ és la mitjana, ν és la mediana, i σ és la desviació estàndard, l'asimetria es defineix en termes d'aquesta relació: una asimetria no paramètrica positiva/dreta significa que la mitjana és més gran que (està situada a la dreta de) la mediana, mentre que una asimetria no paramètrica negativa/esquerra significa que la mitjana és més petita que (està situada a l'esquerra de) la mediana. Tot i això, la definició moderna d'asimetria i la definició tradicional no tenen, en general, el mateix signe: encara que coincideixen per a algunes famílies de distribucions, són diferents en general. Si la distribució és simètrica, llavors la mitjana és igual a la mediana, i la distribució té asimetria zero.[1] Si, a més, la distribució és unimodal, llavors mitjana = mediana = moda. Aquest és el cas del llançament d'una moneda, o de la sèrie 1, 2, 3, 4... Notem que, en general, el recíproc no és cert, és a dir, el fet que l'asimetria sigui zero no vol dir que la mitjana sigui igual a la mediana. Paul T. von Hippel apunta:
DefinicióCoeficient moment d'asimetria de PearsonL'asimetria d'una variable aleatòria X és el coeficient moment d'asimetria.[3] De vegades hom s'hi refereix com el coeficient moment d'asimetria de Pearson,[4] que cal no confondre'l amb altres estadístics d'asimetria de Pearson (vegeu més endavant). És el tercer moment estàndard.[3][4] Es denota per γ1 i es defineix com on μ₃ és el tercer moment central, μ és la mitjana, σ és la desviació estàndard, i E és l'esperança matemàtica. La darrera igualtat expressa l'asimetria en termes del quocient entre el tercer cumulant κ₃ i el segon cumulant κ₂ elevat a la potència 1,5. Això és anàleg a la definició de curtosi com el quart cumulant normalitzat pel quadrat del segon cumulant. De vegades, l'asimetria es denota per Skew[X].[nota 2] La fórmula que expressa l'asimetria en termes del moment no central E[X3] es pot expressar desenvolupant la fórmula anterior, PropietatsL'asimetria pot ser infinita, com a o indefinida, com a En aquest últim exemple, el tercer cumulant és indefinit. També es poden tenir distribucions com on tant el segon com el tercer cumulants són infinits, i per tant l'asimetria és, de nou, indefinida. Si Y és la suma de n variables independents i idènticament distribuïdes, totes amb la distribució de X, llavors el tercer cumulant de Y és n vegades el de X i el segon cumulant de Y és n vegades el de X, de tal manera que . Això mostra que l'asimetria de la suma és més petita, conforme s'aproxima a una distribució gaussiana d'acord amb el teorema del límit central. Notem que la suposició de què les variables siguin independents és important, perquè és possible que fins i tot la suma de dues variables gaussianes tingui una distribució asimètrica. Asimetria mostralPer a una mostra de n valors, un estimador natural de mètode de moments per a l'asimetria de la població és on és la mitjana mostral, s és la desviació estàndard mostral, i el numerador m₃ és el tercer moment central mostral. Una altra definició habitual per a l'asimetria mostral és[5] on és l'únic estimador simètric no esbiaixat del tercer cumulant i és l'estimador simètric no esbiaixat del segon cumulant (és a dir, la variància). En general, les ràtios i són tots dos estimadors esbiaixats de l'asimetria poblacional ; el seu valor esperat pot tenir fins i tot signe contrari al de l'asimetria real (per exemple, una distribució mixta consistent en gaussianes molt primes centrades a −99, 0,5 i 2 amb pesos 0,01, 0,66 i 0,33 té una asimetria d'aproximadament −9,77, però en una mostra de 3, té un valor esperat d'aproximadament 0,32, ja que normalment totes tres mostres cauen en la part amb valors positius de la distribució, que té asimetria cap a l'altra banda). Tot i això, tant com tenen òbviament el valor esperat de zero per a qualsevol distribució simètrica amb un tercer moment finit, incloent-hi una distribució normal. La variància de l'asimetria d'una mostra aleatòria de grandària n a partir d'una distribució normal és[6][7] Una aproximació alternativa és 6/n, però no és prou acurada per a mostres petites. En mostres normals, té la variància més baixa dels dos estimadors, amb on el terme m₂ del denominador és el segon moment central mostral (esbiaixat).[5] El coeficient de moment estandarditzat ajustat de Fisher–Pearson és el que es fa servir a Excel i a diversos paquets estadístics, com Minitab, SAS i SPSS.[8] AplicacionsL'asimetria té beneficis en moltes àrees. Molts models suposen que la distribució és normal, és a dir, les dades són simètriques al voltant de la mitjana. La distribució normal té una asimetria de zero. Però en la realitat, les dades poden no ser perfectament simètriques. Així, si s'interpreta correctament l'asimetria del conjunt de dades, hom pot preveure si les desviacions respecte a la mitjana seran positives o negatives. Altres mesures d'asimetriaEs poden fer servir altres mesures d'asimetria, incloent-hi alguns càlculs més senzills suggerits per Karl Pearson[9] (cal no confondre'ls amb el coeficient de moment de Pearson per a l'asimetria). Aquestes altres mesures són: Primer coeficient d'asimetria de Pearson (asimetria de la moda)L'asimetria de la moda de Pearson,[10] o primer coeficient d'asimetria, es defineix com
Segon coeficient d'asimetria de Pearson (asimetria de la mediana)L'asimetria de la mediana de Pearson, o segon coeficient d'asimetria,[11] es defineix com
AltresA partir de l'expansió estàndard d'un cumulant al voltant d'una distribució normal, es pot demostrar que
Cal tenir present que aquestes igualtats sovint no es compleixen ni tan sols de forma aproximada, i aquestes expressions aproximades ja no es fan servir avui en dia. No existeix cap garantia que aquestes expressions tinguin el mateix signe les unes que les altres o que la definició ordinària d'asimetria. Mesures basades en quantilsEs pot definir una funció asimetria[12][13]
on F és la funció de distribució de probabilitat. Això porta a una mesura general de l'asimetria[12] definida com el suprem d'aquesta expressió sobre l'interval . Es pot obtenir una altra mesura per integració del numerador i del denominador d'aquesta expressió.[14] La funció γ(u) satisfà −1 ≤ γ(u) ≤ 1 i està ben definida sense requerir l'existència dels moments de la distribució.[14] La mesura de Galton per a l'asimetria[15] és γ(u) avaluada a u = 3/4. Altres noms per a aquesta quantitat són: asimetria de Bowley,[16] l'índex de Yule–Kendall[17] i l'asimetria quartil. La mesura de Kelley per a l'asimetria utilitza . L-momentsL'ús de L-moments en comptes de moments proporcionen una mesura de l'asimetria coneguda con L-asimetria.[18] Asimetria de distànciaUn valor d'asimetria igual a zero no implica que la distribució de probabilitat sigui simètrica; cal una altra mesura d'asimetria que tingui aquesta propietat: aquesta altra mesura fou introduïda l'any 2000.[19] S'anomena asimetria de distància i es denota per dSkew. Si X és una variable aleatòria que pren valors en l'espai euclidià de dimensió d, X té esperança finita, X' és una còpia independent de X distribuïda idènticament, i denota la norma de l'espai euclidià, llavors una mesura d'asimetria simple és i dSkew(X):= 0 per a X = 0 (amb probabilitat 1). L'asimetria de distància té sempre un valor entre 0 i 1, val 0 si i només si X és diagonalment simètrica (X i −X tenen la mateixa distribució de probabilitat), i val 1 si i només si X és una constant no nul·la amb probabilitat 1.[20] Així, podem definir un contrast d'hipòtesi simple i consistent per a la simetria diagonal, basat en l'asimetria de la distància mostral: Coeficient de Groeneveld-MeedenGroeneveld i Meeden suggereixen, com a mesura alternativa de l'asimetria,[14] on μ és la mitjana, ν és la mediana, |•| és el valor absolut, i E() és l'operador esperança. Bibliografia
Notes
Referències
Vegeu tambéEnllaços externs
|