¿Cuál es tu burbuja?
Colores y edades

En este mapa de burbujas el azul representa juventud y el marrón envejecimiento.
Además, el tamaño de las burbujas representa el tamaño de la población.
¿Cómo son las burbujas gallegas? Grandes en la costa, pequeñas en el interior.
Como los tamaños y los colores varían tanto, se dice que hay mucha dispersión.
La forma de medirla, en estadística, es usando los parámetros de dispersión.
El más sencillo es el rango (o recorrido), que es la diferencia entre el valor máximo y el mínimo.
Por ejemplo, al estudiar las edades en el pueblo de la montaña lucense, viste que había un valor mínimo (85 años) y uno máximo (102 años). El rango es: 102 - 85 = 17 años.
El recorrido intercuartílico, RI = Q3 - Q1, también es una medida de dispersión.
x-x̄
Imagina que tu ayuntamiento tiene un dinero para invertir en un edificio y se plantea si hará un centro de atención temprana o uno para la tercera edad.
Con los datos del censo han calculado que la media de edad del municipio es de 50 años. ¿Crees que este valor es suficiente para decidir?
La respuesta es no, dado que la medida de 50 podría obtenerse de edades muy diferentes. Por ejemplo, una persona con 1 año y otra con 99 años.
La forma más fácil de analizar las edades del municipio es calcular sus diferencias respecto a la media de 50 años.
Al resultado de cada una de estas diferencias, x-x̄, se les llama "desviación".
|x-x̄|
El resumen de esas restas (desviaciones), se calcula haciendo su media.
Para que no se compensen resultados positivos y negativos previamente se les hace el valor absoluto.
A esta medida de dispersión se le llama desviación absoluta media o, abreviadamente, desviación media.
Para calcularla hay que hacer lo siguientes pasos:
1. Hallar la media de los datos.
2. Restar cada uno de los datos a la media y hacer el valor absoluto del resultado.
3. Hacer la media de estos valores absolutos.
La desviación absoluta media es la media de los valores absolutos de las desviaciones con respecto a la media.
(x-x̄)²
Para evitar que se compensen los resultados positivos y negativos al restar otra opción es elevar al cuadrado.
La media de esos cuadrados se llama varianza.
Se representa com Var o σ2.
Para calcularla hay que hacer lo siguientes pasos:
- Hallar la media de los datos a analizar.
- Restar cada uno de los datos a la media y hacer el cuadrado del resultado.
- Hacer la media de estos cuadrados.
En resumen, consiste en calcular la media de los cuadrados de las desviaciones con respecto a la media.
σ
Como la varianza da como resultado la medida original al cuadrado (en el ejemplo, años al cuadrado), una forma de evitarlo es hacer su raíz cuadrada, obteniendo así la desviación típica o desviación estándar.
La desviación típica, que se representa con la letra griega , es la raíz cuadrada de la varianza.
CV
Finalmente, el ayuntamiento decide estudiar la edad por zonas.
En la zona A, la media es 20 años y la desviación típica es 10 años.
En la zona B, la media es 70 años pero la desviación típica es de 14 años.
Para compararlas se hace la razón entre la desviación típica y la media: es el coeficiente de variación.
= 0,5 se compara con = 0,2
En la zona A hay una variación alta, del 50 %, mientras que en la B hay una variación menor, del 20 %.
Esto puede ayudar a tomar decisiones sobre la ubicación de los centros educativos, residencias...
Observa que el coeficiente de variación, CV, es una medida de dispersión relativa. Esto significa que no tiene unidades.
Ayuda a comparar dos conjuntos de datos que no tienen la misma media.
El coeficiente de variación es el cociente de la desviación típica entre la media, es decir:
Observa si la media es 0 no se puede calcular.
Mente dispersa
En la siguiente tabla vamos a estudiar el número de personas ancianas en un ayuntamiento según algunos intervalos de edad.
En caso de haber cifras decimales, recuerda escribir siempre dos, aunque alguna sea 0.
| Intervalos de edad | Marca de clase |
N.º de anc. |
|||
|---|---|---|---|---|---|
| [65,70) | 67,5 | 687 | @@46372,50@@ | @@1806,81@@ | @@4751,91@@ |
| [70,75) | 72,5 | 125 | @@9062,50@@ | @@296,25@@ | @@702,11@@ |
| [75,80) | 77,5 | 163 | @@12632,50@@ | @@1201,31@@ | @@1201,31@@ |
| [80,85) | 82,5 | 25 | @@2062,50@@ | @@309,25@@ | @@3825,42@@ |
| N==1000 | =@@70130@@ | =@@3613,62@@ | =@@10480,75@@ |
La media de edad de este sector de la población en este ayuntamiento es:
@@70130@@/@@1000@@=@@70,13@@ años.
El rango de edad de este estudio es:
R=@@82,50@@-@@67,50@@=@@15@@ años.
La desviación media de la edad de este estudio es:
= @@3613,62@@/1000 = @@3,61@@ años.
La varianza de este estudio estadístico es:
= @@10480,75@@/1000 = @@10,48@@ .
Y por lo tanto, la desviación típica es:
= @@3,24@@ años.
Por último, calcula el coeficiente de variación:
= @@3,24@@/@@70,13@@=@@0,05@@.
El porcentaje sería:
@@5@@ %.
¿Qué conclusiones puedes sacar de estos parámetros de dispersión?
¿Debería el coeficiente de variación tener unidades? ¿Por qué?
¿Cuál es la importancia de los parámetros de centralización y dispersión en un estudio como este?
De otra forma
En la siguiente tabla estudiarás el número de personas centenarias, con más de 100 años, en los ayuntamientos de una cierta zona de Galicia.
También deberás recordar como se crea un diagrama estadístico.
En caso de haber cifras decimales, recuerda escribir siempre dos, aunque alguna sea 0.
Te centrarás en el estudio de la varianza de esta muestra, para ello aprenderás una nueva forma de calcularla. Así como la creación de gráficos estadísticos.
| Personas centenarias |
N.º de ayunt. |
|||
|---|---|---|---|---|
| 1 | 11 | @@11@@ | @@19,46@@ | @@11@@ |
| 2 | 6 | @@12@@ | @@0,65@@ | @@24@@ |
| 3 | 7 | @@21@@ | @@3,14@@ | @@63@@ |
| 4 | 4 | @@16@@ | @@11,16@@ | @@64@@ |
| 5 | 2 | @@10@@ | @@14,26@@ | @@50@@ |
| N==30 | =@@70@@ | =@@48,67@@ | =@@212@@ |
La media del número de personas centenarias en estos ayuntamientos es:
= @@70@@/@@30@@ = @@2,33@@ centenarios.
= @@48,67@@/@@30@@ = @@1,62@@ .
= @@212@@/@@30@@ - @@5,43@@ =
= @@7,07@@ - @@5,43@@ = @@1,64@@ .
¿De qué forma te parece más cómodo calcular la varianza?
¿Por qué crees que no da exactamente el mismo resultado con las dos fórmulas?
¿Cómo interpretas este resultado de la varianza en este estudio?
Por último, para interpretar de una forma adecuada los datos del estudio, crea un diagrama estadístico adecuado, por ejemplo, un diagrama de barras.
Ventajas de ser disperso
Se ha hecho un estudio en diferentes ayuntamientos gallegos sobre la edad a través de unas muestras escogidas.
Los resultados de estas encuestas son los siguientes:
| Ayuntamiento |
Media |
Varianza |
|---|---|---|
| 1 | 45,34 | 42,10 |
| 2 | 54,21 | 24,45 |
| 3 | 42,12 | 61,12 |
| 4 | 33,13 | 45,23 |
| 5 | 56,03 | 49,43 |
| 6 | 48,32 | 56,32 |
Calcula los coeficientes de variación de cada una de las muestras de los ayuntamientos.
El coeficiente de variación más alto es el del ayuntamiento @@4@@ y el más bajo el del ayuntamiento @@2@@.
Donde hay @@la varianza@@ más grande es donde se ubican los datos más dispersos, más lejanos de @@la media@@. Esto ocurre en el ayuntamiento @@3@@.
Sin embargo, en el ayuntamiento @@2@@ es donde están los datos más cercanos a la media de edad.
¿Entiendes la utilidad de los parámetros de dispersión?
¿Qué datos sacas a partir de los parámetros de dispersión?