Quantcast
Channel: Appunti – Matematicamente
Viewing all articles
Browse latest Browse all 178

La correlazione e le distribuzioni normali

$
0
0

La correlazione

Nel caso in cui, considerate due distribuzioni X e Y, esista tra di loro una corrispondenza lineare, stabilita per mezzo di rette di regressione, è possibile dare una misura sintetica di tale corrispondenza.

Per fare questo, si utilizzano dei coefficienti, e tra i più usati troviamo il coefficiente di correlazione lineare di Bravais-Pearson, che si ottiene dal rapporto della covarianza delle distribuzioni per il prodotto delle loro deviazioni standard (cioè i loro scarti quadratici medi):

\[ r = \frac{(\mbox{var}_{x,y})^2}{\sigma_x \sigma_y} \]

Il valore di tale indice è un numero reale compreso tra -1 e 1. In particolare, possiamo notare che il coefficiente assume:

  • il valore -1 nel caso di perfetta correlazione negativa;
  • il valore 1 nel caso di perfetta correlazione positiva;
  • il valore 0 se non vi è correlazione tra le distribuzioni;
  • valori positivi nel caso di correlazione positiva;
  • valori negativi nel caso di correlazione negativa.

Tra la correlazione  e la regressione esiste un legame molto stretto, espresso dalla seguente:

\[ |r| = \sqrt{|r_{yx}\cdot r_{xy}|} \]

dove i coefficienti \(r_{yx}\) e \(r_{xy}\) sono, rispettivamente, i coefficienti di regressione di $y$ su $x$ e di $x$ su $y$.

Esempio

Consideriamo due distribuzioni aventi le seguenti modalità:

Statistica: modalità di una distribuzione d'esempio

 

Possiamo determinare per tali distribuzioni i rispettivi scarti quadratici medi, e il valore della covarianza; effettuando i calcoli, si ottiene:

\( \sigma_x = 1,708 \,\,\,\, , \,\,\,\, \sigma_y = 8,86 \)

\( (\mbox{var}_{x,y})^2 = 13,5 \)

Poiché il coefficiente di correlazione è dato dal rapporto tra la covarianza e il prodotto delle deviazioni, abbiamo che:

\( r = \frac{13,5}{1,708\cdot 8,86} = 0,892 \)

Notiamo che il valore di $r$ è molto prossimo a 1, il che indica che vi è una buona correlazione positiva.

Distribuzione normale

Una distribuzione normale è una distribuzione di frequenze caratteristica, in quanto essa può essere descritta da un grafico “a campana” simmetrico rispetto all’asse verticale che passa per il vertice (che corrisponde alla moda).

 

Statistica: distribuzione normale

 

La distribuzione normale è una distribuzione teorica, e può descrivere un numero infinito di osservazioni.

Possiamo notare, inoltre, che l’area compresa tra la curva e l’asse delle ascisse racchiude la totalità delle osservazioni; e che la frequenza dei valori compresi tra due valori dell’ascissa $x_1$ e $x_2$ corrisponde all’area racchiusa dalla curva e dall’intervallo $(x_2 ; x_1)$.

Poiché la curva è simmetrica rispetto al suo asse verticale, si ha che la media e la mediana coincidono con la moda.

Tra le proprietà che caratterizzano queste distribuzioni, vi è il fatto che tra la media e una deviazione standard sono compresi circa il 34% dei valori della distribuzione; è quindi possibile, in ogni caso, determinare la percentuale dei valori che si trovano tra un generico valore $x$ e la media.

Esempio

Consideriamo una distribuzione che abbia una media di 25, e uno scarto quadratico medio uguale a 3. Possiamo allora determinare la percentuale dei valori che si trovano tra 25 – 3 e 25 + 3, cioè i valori compresi tre 22 e 28.

Sapendo che tra la media e una deviazione standard cono compresi il 34% dei valori, possiamo concludere che tra 22 e 28 sono compresi (34∙2)% = 68% dei valori.

Indici di forma

Nelle distribuzioni reali, quasi sempre ci si allontana dalla distribuzione standard, e questo si può notare anche dalla differente forma che assumono le distribuzioni.

In particolare, le distribuzioni possono presentare un’asimmetria, e in questo caso la media aritmetica si sposta, rispetto alla mediana, verso la parte di grafico che si schiaccia maggiormente.

 

Statistica: indici di forma

 

Oppure possono risultare più o meno appiattite, e in questo caso si parla di curtosi.

 

Statistica: curtosi

 

Potrebbero interessarti

 

L'articolo La correlazione e le distribuzioni normali sembra essere il primo su Matematicamente.


Viewing all articles
Browse latest Browse all 178

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>