Distribuzione normale

Da Wikipedia, l'enciclopedia libera.
Variabile casuale normale (o di Gauss)
Funzione di densità
Funzione di densità di una variabile casuale normale
La linea in verde si riferisce alla variabile casuale normale standardizzata
Funzione di ripartizione
Funzione di ripartizione di una variabile casuale normale o semi-campana di Gauss
I colori corrispondono a quelli delle densità della figura precedente
Parametri \mu~\in~\mathbb{R}, \sigma^{2}~\in~(0,\infty)
Supporto \mathbb{R}
Funzione di densità \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2\right\}
Funzione di ripartizione \frac{1}{2} \left(1 + \mathrm{erf}\,\frac{x-\mu}{\sigma\sqrt2}\right)
Valore atteso \mu
Mediana \mu
Moda \mu
Varianza \sigma^2
Indice di asimmetria 0
Curtosi 0
Entropia \ln\left(\sigma\sqrt{2\,\pi\,e}\right)
Funzione generatrice dei momenti {M_X(x)= \exp\left(\mu\,x+\frac{\sigma^2 x^2}{2}\right)}
Funzione caratteristica \varphi_X(x)=\exp\left(\mu\,i\,x-\frac{\sigma^2 x^2}{2}\right)

In teoria della probabilità la distribuzione normale, o di Gauss (o gaussiana) dal nome del matematico tedesco Carl Friederich Gauss, è una distribuzione di probabilità continua che è spesso usata come prima approssimazione per descrivere variabili casuali a valori reali che tendono a concentrarsi attorno a un singolo valor medio. Il grafico della funzione di densità di probabilità associata è simmetrico e ha una forma a campana, nota come Campana di Gauss (o anche come curva degli errori, curva a campana, ogiva).

La distribuzione normale è considerata il caso base delle distribuzioni di probabilità continue a causa del suo ruolo nel teorema del limite centrale. Più specificamente, assumendo certe condizioni, la somma di n variabili casuali con media e varianza finite tende a una distribuzione normale al tendere di n all'infinito. Grazie a questo teorema, la distribuzione normale si incontra spesso nelle applicazioni pratiche, venendo usata in statistica e nelle scienze naturali e sociali[1] come un semplice modello per fenomeni complessi.

La distribuzione normale dipende da due parametri, la media μ e la varianza σ2, ed è indicata tradizionalmente con:

\ N(\mu;\sigma^2).[2]

Metodologiamodifica | modifica sorgente

La distribuzione normale è caratterizzata dalla seguente funzione di densità di probabilità, cui spesso si fa riferimento con la dizione curva di Gauss o gaussiana:

f(x) = \frac{1}{\sigma \sqrt{2 \pi}} \; e^ {- \frac{\left( x - \mu \right)^2}{2 \sigma ^2}} ~\mbox{ con }~ x \in \mathbb{R} .

Dove \mu è il valore atteso e \sigma^2 la varianza.
Per dimostrare che p_X(x) è effettivamente una funzione di densità di probabilità si ricorre innanzi tutto alla standardizzazione (statistica) della variabile casuale, cioè alla trasformazione tale per cui risulta:

Z = \frac{x-\mu}{\sigma} ,

dove la variabile risultante -\infty<Z<+\infty ha anch'essa distribuzione normale con parametri \mu=0 e \sigma=1. L'integrale della funzione di densità di probabilità della variabile casuale standardizzata Z è il seguente:

S = \int_{-\infty}^{+\infty}p_Z(z)dz=\int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}dz

Dato che deve necessariamente valere la condizione S=1, allora risulta anche S^2=1 quindi:

S^2 = \int_{-\infty}^{+\infty}p_Z(z)dz\int_{-\infty}^{+\infty}p_Y(y)dy
S^2 = \frac{1}{2\pi}\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}e^{-\frac{z^2+y^2}{2}}dzdy

dove anche la variabile casuale Y ha distribuzione normale standardizzata. Per risolvere questo integrale doppio si ricorre alle coordinate polari z=\rho\cos\theta e y=\rho\sin\theta, dove \rho\geq 0 e 0\leq \theta \leq 2\pi. La matrice jacobiana della trasformazione è

J(\rho,\theta)=\left[\begin{array}{cc} \frac{\partial z}{\partial\rho} & \frac{\partial z}{\partial\theta} \\ \\ \frac{\partial y}{\partial\rho} & \frac{\partial y}{\partial\theta} \end{array}\right]=\left[\begin{array}{cc} \cos\theta & -\rho\sin\theta \\ \sin\theta & \rho\cos\theta \end{array}\right],

il cui determinante è pari a |J(\rho,\theta)|=\rho(\cos^2\theta+\sin^2\theta)=\rho. Sostituendo nell'integrale di cui sopra si ottiene:

S^2 = \frac{1}{2\pi}\int_{0}^{+\infty}\int_{0}^{2\pi}e^{-\frac{\rho^2(\cos^2\theta+\sin^2\theta)}{2}}|J(\rho,\theta)| d\theta d\rho=\int_{0}^{+\infty}e^{-\frac{\rho^2}{2}}\rho\ d\rho =1

La sua funzione generatrice dei momenti è

g(x) = e^{ \mu x + \sigma ^2 \frac{x^2}{2} }

Il valore atteso e la varianza (che sono gli unici due parametri di questa variabile casuale) sono appunto μ e σ².

Non essendo possibile esprimere l'integrale della p_X(x) in forma chiusa mediante funzioni elementari, è necessario rendere disponibili in forma tabellare i valori della sua funzione di ripartizione. I più usati sono:

68,3% = P{ μ -      σ < X <  μ +      σ }
95,0% = P{ μ - 1,96 σ < X <  μ + 1,96 σ }
95,5% = P{ μ - 2    σ < X <  μ + 2    σ }
99,0% = P{ μ - 2,58 σ < X <  μ + 2,58 σ }
99,7% = P{ μ - 3    σ < X <  μ + 3    σ }

Essendo p_X(x) una funzione simmetrica è sufficiente conoscere la funzione di ripartizione dei valori positivi, per conoscere pure quella dei valori negativi (e viceversa).

Dalla variabile casuale Normale si possono ottenere altre variabili casuali, come la t di Student, la Chi Quadrato e la F di Fisher-Snedecor, nonché le loro "varianti" non centrali (t non centrale, chi quadrato non centrale e F non centrale).

Teoremimodifica | modifica sorgente

Combinazione lineare di variabili gaussianemodifica | modifica sorgente

Se
X1, X2, ..., Xn sono n variabili casuali Normali tra di loro indipendenti, ciascuna con valore atteso μi e varianza σ²i,
allora
la variabile casuale Y = α1X1 + α2X2 + ... + αnXn è a sua volta una variabile casuale Normale con valore atteso μ = α1μ1 + α2μ2 + ... + αnμn e varianza σ² = α²1σ²1 + α²2σ²2 + ... + α²nσ²n

Altri teoremi: Teorema di Cochran

Relazioni con altre variabili casualimodifica | modifica sorgente

La Normale come derivazione da altre vocimodifica | modifica sorgente

I teoremi del limite centrale sono una famiglia di teoremi che hanno in comune l'affermazione che la somma (normalizzata) di un grande numero di variabili casuali è distribuita approssimativamente come una variabile casuale normale.


Se X è distribuita come una variabile casuale binomiale con n molto grande (per dare un'idea di quanto grande, possiamo dire che deve essere n>30), e approssimativamente np>10, allora la binomiale può essere approssimata con una Normale con valore atteso pari a np e varianza uguale a npq: N( np ; npq).


Se X è distribuita come una variabile casuale poissoniana con il parametro λ molto grande (orientativamente λ > 10), allora la Poissoniana può essere approssimata con una Normale con valore atteso e varianza pari a λ: N( λ ; λ).

Variabili casuali derivate dalla Normalemodifica | modifica sorgente

Date n distribuzioni normali Z1(0;1); Z2(0;1); ... Zn(0;1) con media nulla e varianza unitaria indipendenti tra loro. allora

χ²n= Z1² + Z2² + .... +Zn²

è una Variabile casuale chi quadro con n gradi di libertà.


Siano Z1, Z2, Z3..., Zn variabili casuali indipendenti distribuite come una Normale con media nulla e varianza unitaria, e siano inoltre a1, a2, a3..., an delle costanti tali che

\lambda=\sum{a_i^2}

allora si indica con χ'² la v.c. chi quadro non centrale con n gradi di libertà costruita come

\chi'^2=\sum(Z_i+a_i)^2

Se Z~N(0;1) e X~χ²n, allora T=Z/√X/n è distribuita come una t di Student con n gradi di libertà.


Se Z~N(0;1) e T=\beta \left(\tfrac{\alpha Z}{2} + \sqrt{\tfrac{(\alpha Z)^2}{4}+1}\right)^2 allora T è una v.c. di Birnbaum-Saunders con i parametri \alpha e \beta.

La normale nell'inferenza bayesianamodifica | modifica sorgente

Variabile casuale Gamma come priori coniugati della normalemodifica | modifica sorgente

Nell'ambito dell'inferenza bayesiana si trova la seguente relazione tra la normale e la distribuzione Gamma.

Se X è una distribuzione normale con parametri μ e 1/θ

f(x|\theta)=N( x | \mu; 1/\theta ) \

ed il parametro θ ha una distribuzione Γ con i parametri a e b

g(\theta)=\Gamma(\theta|a;b) \

allora il parametro θ è distribuito a posteriori anch'esso come una variabile casuale Gamma, ma con parametri a+1/2 e b+(μ-x)2/2

g(\theta|x)=\Gamma(\theta|a+1/2;b+(\mu-x)^2/2) \

Priori coniugati normale di una normalemodifica | modifica sorgente

Se X è distribuita come una v.c. normale con parametri m e σ2

f(x|m)=N(x|m;1/r^2) \

e il parametro m è distribuito a priori come una v.c. normale con i parametri μ e σ2

g(m)=N(m|\mu;\sigma^2) \

allora il parametro m è distribuito a posteriori anch'esso come una v.c. Normale, ma con parametri (\sigma^2 \mu+r^2x)/(\sigma^2+r^2) e (\sigma^2r^2)/(\sigma^2+r^2)

g(m|x)=N(m|(\sigma^2 \mu+r^2x)/(\sigma^2+r^2);(\sigma^2r^2)/(\sigma^2+r^2)) \

Cenni storicimodifica | modifica sorgente

Gauss descrisse la distribuzione normale studiando il moto dei corpi celesti. Altri la usavano per descrivere fenomeni anche molto diversi come i colpi di sfortuna nel gioco d'azzardo o la distribuzione dei tiri attorno ai bersagli. Da qui i nomi curva di Gauss e curva degli errori:

Nel 1835 Quételet pubblicò uno scritto nel quale, fra le altre cose, c'erano i dati riguardanti la misura del torace di soldati scozzesi e la statura dei militari di leva francesi. Quételet mostrò come tali dati si distribuivano come una Gaussiana, ma non andò oltre.

Fu Galton a intuire che la curva in questione, da lui detta anche ogiva, poteva essere applicata a fenomeni anche molto diversi, e non solo ad "errori". Questa idea di curva per descrivere i "dati" in generale portò ad usare il termine Normale, in quanto rappresentava un substrato normale ovvero la norma per qualsiasi distribuzione presente in natura.

Nel tentativo di confrontare curve diverse, Galton - in mancanza di strumenti adeguati - si limitò ad usare due soli parametri: la media e la varianza, dando così inizio alla statistica parametrica.

Notemodifica | modifica sorgente

  1. ^ Gale Encyclopedia of Psychology — Normal Distribution
  2. ^ Ross, op. cit., p. 170

Bibliografiamodifica | modifica sorgente

  • Sheldon M. Ross, Probabilità e statistica per l'ingegneria e le scienze, Trento, Apogeo, 2003. ISBN 88-7303-897-2.

Voci correlatemodifica | modifica sorgente

Altri progettimodifica | modifica sorgente

matematica Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica








Creative Commons License