Saltar navegación

Distribución normal

Función de densidade e función de distribución

Asociadas ás variables aleatorias continuas está a función de densidade. Matemáticamente unha función f é unha función de densidade se verifica:

  • \(f(x) \geq 0, \forall x \in \mathbb R\)
  • \(\displaystyle \int_{-\infty}^{+\infty} f(x) dx = 1\), que significa que a área baixo a curva vale 1.

A probabilidade de que a variable aleatoria continua X tome valores nun certo intervalo ven dada pola área baixo a gráfica de f(x) nese intervalo, é dicir:

  • \(\displaystyle P(a \leq X \leq b) = \int_{a}^{b} f(x) dx\)
  • \(\displaystyle P(X \leq a) = \int_{-\infty}^{a} f(x) dx\)

Esto implica que no caso das variables continuas a probabilidade dun punto concreto é cero, xa que baixo un punto so non temos área.

Definimos a función de distribución dunha variable aleatoria continua X como a función:
\[\begin{array}{rcl}
F: \mathbb R & \rightarrow & \mathbb R \\
x & \rightarrow & F(x) = P(X \leq x ) = \int_{-\infty}^{x} f(t) dt
\end{array}\]

As funcións de distribución son modelos que nos indican como se comportan determinadas variables estatísticas. No caso de que a variable sexa cuantitativa continua un dos modelos co que máis nos atopamos é a distribución normal.

Unha variable aleatoria, \(X\), segue unha distribución de probabilidade normal \(N(\mu, \sigma)\) se:

  • a variable aleatoria é continua
  • depende dos parámetros \(\mu\), media da variable aleatoria, e \(\sigma\), desviación típica da variable aleatoria
  • a súa función de densidade ten a forma \(\displaystyle f(x) = \frac{1}{\sigma \sqrt{2\pi}}e^{\frac{-1}{2}\left(\frac{X - \mu}{\sigma}\right)^2}\), que é unha función simétrica respecto á media (NOTA: non hai que aprenderse esta expresión, pero si que é simétrica)

A representación gráfica deste función recibe o nome de campana de Gauss.

Representación gráfica da campana de Gauss marcando o eixe da simetría, é dicir, o valor da media
O eixe vertical, que marca a simetría,
indicaría o valor da media

(Tal e como sabemos pola definición de función de densidade a área baixo toda a curva vai ser 1)

Distribución normal estándar N(0, 1)

A distribución normal pode ter calquera media ou desviación típica, pero existe un caso concreto no que imos basear os nosos cálculos. Trátase da distribución normal estándar, que neste caso \(\mu = 0\) e \(\sigma = 1\), é dicir, \(N(0, 1)\).

Para calcular a probabilidade non teremos que recurrir a esta expresión da integral, a calcularemos a partir dunha táboa que nos da o valor da función de distribución \(F(z_0) = P(Z < z_0)\). Consideracións na táboa:

  • A letra que se usa para indicar que nos estamos a referir a unha variable aleatoria normal estándar é a Z.
  • Ten en conta que como se trata da \(N(0, 1)\) a línea do centro marca o 0.
  • Na táboa non temos tódolos valores de z, so valores positivos. Para valores negativos de z, podemos calcular a probabilidade por simetría respecto a media \(\mu = 0\).
  • Se con esta táboa temos que calcular a probabilidade de \(P(Z \geq z_0)\) o facemos tendo en conta que toda a área vale 1.
  • Recorda que a probabilidade nun punto nunha variable aleatoria continua é cero, logo é o mesmo \(P(Z \leq z_0)\) que \(P(Z < z_0)\).
  • A probabilidade entre dous puntos podemos facela como a resta de dúas probablidades: \(P(z_1 \leq Z \leq z_2) = P(Z \leq z_2) - P(Z \leq z_1)\)

Táboa \(F(z)\) para \(N(0,1)\)

Táboa da normal

Descargar táboa (.pdf)

Calcula para \(N(0, 1)\) as seguintes probabilidades:

  • \(P(Z \leq 2,27) = 0,9884\)
  • \(P(Z \geq 0,60) = 1 - P(Z \leq 0,60) = 1 - 0,7257 = 0,2743\)
  • \(P(Z < 1,53) = 0,9370\)
  • \(P(Z \leq -2,27) = 1 - P(Z \leq 2,27) = 1 - 0,9884 = 0,0116\)
  • \(P(Z \geq -0,60) = P(Z \leq 0,60) = 0,7257\)
  • \(P(1,53 \leq Z \leq 2,27) = P(Z \leq 2,27) - P(Z \leq 1,53) = 0,9884 - 0,9370 = 0,0514\)

Inda que o habitual é usar a táboa indicada e polo tanto, as indicacións para a probabilidade son como aparecen no exemplo, existen outro tipo de táboas (por exemplo, para valores \(P(Z > z_0)\) ou para valores \(P(\mu < Z < z_0)\) sendo \(\mu = 0\)). Sempre na parte superior da táboa hai un debuxo que non indica que área nos están dando.

Cando temos unha distribución normal con diferente media e varianza a normal estándar, para calcular as probabilidades facemos o que se coñece como tipificar a variable, deste xeito expresamos calquera distribución normal en termos da normal estándar. Esto se fai como se indica:

\[X \in N(\mu, \sigma) \iff Z = \frac{X - \mu}{\sigma} \in N(0,1)\]

Por exemplo, considera a variable \(X \in N(1,3)\). Calcula as seguintes probabilidades:

  • \(\displaystyle P(X \leq 4) = P\left(\frac{X - 1}{3} \leq \frac{4 - 1}{3}\right) = P(Z \leq 1) = 0,8413\)
  • \(\displaystyle P(0,5 \leq X \leq 2) = P\left(\frac{0,5 - 1}{3} \leq \frac{X - 1}{3} \leq \frac{2 - 1}{3}\right) = P(-0,17 \leq Z \leq 0,33) = P(Z \leq 0,33) - P(Z \leq -0,17) = P(Z \leq 0,33) - (1 - P(Z \leq 0,17)) = 0,6293 - (1 - 0,5675) = 0,6293 - 1 + 0,5675 = 0,1968 \)

Feito con eXeLearning (Nova xanela)