Saltar navegación

Teorema central do límite

O teorema central do límite permite relacionar variables calesquera, non necesariamente normais, cunha distribución normal. O que di é que dadas \(X_1, X_2, ..., X_n\) variables aleatorias de media \(\mu\) e desviación típica \(\sigma\) (non teñen que seguir necesariamente unha distribución normal), entón a distribución da variable \(\displaystyle \sum X = X_1 + X_2 + ... + X_n\) aproxímase a unha distribución normal de media \(n\mu\) e desviación típica \(\sigma\sqrt{n}\) a medida que o tamaño da mostra faise maior (considerar \(n > 30\)): \(\displaystyle \sum X \equiv N(n\mu, \sigma\sqrt{n})\)

(Se a distribución inicial é normal, este teorema verifícase independentemente do tamaño da mostra)

Este teorema do que damos unha idea, ten un resultado máis xeral, pero non imos afondar máis nel, interésanos para ver unha das súas consecuencias.

Distribución da media mostral

Como consecuencia directa do teorema central do límite, dadas \(X_1, X_2, ..., X_n\) variables aleatorias de media \(\mu\) e desviación típica \(\sigma\), entón a distribución da media da mostra, é dicir, \(\displaystyle \overline{X} = \frac{X_1 + X_2 + ... + X_n}{n}\) aproxímase a unha distribución normal de media \(\mu\) e desviación típica \(\sigma/\sqrt{n}\) a medida que o tamaño da mostra faise maior (considerar \(n > 30\)): \(\displaystyle \overline{X} \equiv N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\)

De novo, se as variables seguen unha distribución normal, non precisamos que \(n > 30\).

Que quere dicir isto. Vexamos un exemplo. O peso das bicas que fan nunha determinada panadería seguen unha distribución normal de media 500 gramos e desviación típica 30 gramos. Para facer un control de calidade pésanse 36 bicas, considérase que non supera o control se o peso medio das bicas inferior a 490 é superior a un 2%. Superarán o control de calidade na panadería?

Como vimos a media vai seguir unha distribución normal \(\displaystyle N\left(500, \frac{30}{\sqrt{36}}\right) = N(500, 5)\).

Para esta distribución do peso medio queremos saber \(P(X < 490)\). Resolvemos o problema:

\(\displaystyle P(X < 490) = P\left(\frac{X - 500}{5} < \frac{490 - 500}{5}\right) = P(Z < -2) = P(Z > 2) = 1 - P(Z < 2) = 1  - 0,9772 = 0,0228\)

A probabilidade de que o peso medio sexa inferior a 490 é do 2,28%, logo non supera o proceso de control de calidade.

Distribución da proporción

Nunha poboación chamaremos \(p\) á proporción de individuos que teñen certa característica. Considerando todas as mostras de tamaño \(n\) que podamos extraer desa poboación, obteremos unha proporción para cada unha delas, é dicir, podemos construir unha variable aleatoria \(\hat{p}\), que a cada mostra lle asigna a proporción de individuosdesa mostra que posee a característica inicial. Esta variable, \(\hat{p}\), segue unha distribución normal de media \(p\) e desviación típica \(\displaystyle \sqrt{\frac{p(1 - p)}{n}}\), é dicir, \(\displaystyle \hat{p} \equiv N\left(p, \sqrt{\frac{p(1 - p)}{n}}\right)\)

Vexamos un exemplo para entender que estamos dicindo. Un fabricante de medicamento afirma que certa medicina cura unha enfermidade da sangue no 80% dos casos. Os inspectores de sanidade utilizan o medicamento nunha mostra de 100 pacientes e deciden aceptar dita información se se curan 75 ou máis cunha probabilidade superior ao 90%.

Trátase dunha poboación con \(p = 0,8\) e unha mostra de 100 pacientes, que segue unha distribución normal \(\hat{p} \equiv N\left(0,8; 0,04\right)\). Comprobamos agora a probabilidade que nos piden:

\(\displaystyle P\left(X > \frac{75}{100}\right) = P\left(\frac{X - 0,8}{0,04} > \frac{0,75 - 0,8}{0,04}\right) = P(Z > -1,25) = P(Z < 1,25) = 0,8944\)

A probabilidade é do 89,44%, logo non supera o 90% e entón non se aceptaría o medicamento.

Feito con eXeLearning (Nova xanela)