Glosario
Desvirtuar
-
Definición:
Alterar la verdadera naturaleza de algo. Quitarle su valor, haciendo que los datos sean engañosos.
Ejemplo:
-
Estudiando los sueldos de una empresa, al añadir el del dueño subió muchísimo la media y desvirtuó el propósito de este estudio.
Datos desde 0 hasta 100
Tus primeros datos
¿Sabías que, nada más nacer, se recogieron los primeros datos sobre ti?
El personal médico te pesó y te midió y, luego, anotó los datos en una gráfica estandarizada.
Estas gráficas aparecen en las tablas de crecimiento.
Son curvas de percentiles, o lo que es lo mismo, medidas que dividen los datos de la población estudiada en 100 partes (centiles).
Forman parte de las medidas de posición, igual que la media, la mediana y la moda.
Si sientes curiosidad, en la red hay calculadoras que hallan los percentiles al nacer.
Accede en este enlace a una de ellas: https://www.ihan.es/calculadora-de-percentiles/.
¡De Q!
Recordarás que la mediana es un valor que marca la mitad de una lista de datos, cuando están ordenados.
El cuartil (Q) tienen el mismo objetivo: marcar la mitad de la mitad inferior y de la superior.
- Q1: el primer cuartil indica el valor que deja la cuarta parte de los datos (el 25 %) por debajo.
- Q2: el segundo cuartil indica el valor que deja la mitad de los datos (el 50 %) por debajo. Es la mediana.
- Q3: el tercer cuartil indica el valor que deja las tres cuartas partes de los datos (el 75 %) por debajo.
También puede interesar el valor más bajo (mínimo) y el más alto (máximo) que, con los cuartiles, dan una imagen de cómo se organizan los datos.
Boxplot
Se te plantea un nuevo estudio: analizar como están distribuidas las edades en un pueblo remoto de la montaña lucense.
Para ello, recoges los datos de las personas mayores de 80 años y obtienes este conjunto: {85, 86, 88, 88, 89, 90, 91, 92, 94, 100, 102}.
Lo ideal es hacer un diagrama de caja (en inglés boxplot o box plot).

Observa que el 50% de la población se concentra en la zona de la caja, entre Q1 = 88 y Q3 = 94.
A esta medida, Q3 - Q1; se le llama recorrido intercuartílico.
Caja y bigote
Este gráfico está formado por unas líneas laterales (los bigotes) y una caja entre ellas.
- La primera línea va desde el valor mínimo hasta Q1. En el ejemplo, va desde 85 a 88; 3 años.
- La caja va desde Q1 hasta Q3. En el ejemplo, va desde 88 a 94; 6 años.
- La línea final va desde Q3 hasta el valor máximo. En el ejemplo, va desde 95 a 102; 8 años.
- La línea central es la mediana. En el ejemplo, es la edad a = 90 años.
La altura o grosor de la caja no tiene significado estadístico; su propósito es sólo visual, para facilitar la lectura del gráfico.
Outliers
Si aparece algún valor muy separado del resto de datos, a veces, se elimina de la lista. Son los llamados valores atípicos o outliers.
Una opción para detectarlos es multiplicar la base de la caja (Q3-Q1) por 1,5 y, si un dato se separa más de ese valor, es un outlier.
En el ejemplo 6 · 1,5 = 9, ningún dato se separa de la caja más de 9 años. Por tanto, no hay valores atípicos.
GeoGebra encaja
Usa la Suite

GeoGebra permite hacer un diagrama de caja de forma rápida a partir de una lista de datos usando la Suite Calculadora.
El comando: DiagramaCaja la dibuja automáticamente.
Los números que van entre paréntesis, en este comando, son:
- El primero: punto vertical donde dibuja el centro de la caja.
- El segundo: ancho de la caja en vertical.
- Lista entre llaves: conjunto de datos.
Si cambias un número de la lista, el diagrama de caja se cambiará automáticamente.
Y el botón derecho
Haciendo clic con el botón derecho del ratón, en los tres puntos que hay al lado de la lista, puedes obtener los valores estadísticos que se ven en el gráfico de caja.

También puedes duplicar la entrada y hacer modificaciones a partir de la lista original.
En el pueblo de al lado...
Supón que tienes los datos de otro pueblo cercano. Son muy similares, aunque no hay centenarios: {85, 86, 88, 88, 89, 90, 91, 92, 94}.
Ahora no es sencillo localizar el primer cuartil, ya que hay dos posibles candidatos, el 86 y el 88.
En estos casos se hace la media aritmética de ambos, obteniendo el valor 87.
Lo mismo para el tercer cuartil, se hace la media de 91 y 92, obteniendo 91,5.
En esta lista: Min = 85; Q1 = 87; Q2 = 89; Q3 = 91,5 y Máx = 94.
Así quedarían ambas gráficas con GeoGebra:

En la primera, el 50 % de los datos están entre 87 y 91,5; y están poco dispersos (bigotes cortos).
En la segunda, el 50 % de los datos están entre 88 y 94; y están más dispersos (el bigote derecho es largo).
Centrando las ideas
Visto en 1.º
En 1.º de ESO estudiaste algunas medidas que sirven para resumir un grupo de datos de variables cuantitativas.
Se les da el nombre de parámetros estadísticos.
Esos valores se clasifican en dos categorías: de posición y de dispersión.
Dentro de los de posición están los de posición central, muy importantes porque se usan como resumen.
A continuación puedes repasar los vídeos que explican cómo calcular cada uno de ellos con una hoja de cálculo.
1. Media
Valor calculado a partir de la suma de todos los datos dividida entre el total:
2. Mediana
Valor que divide al conjunto de datos ordenados en dos partes iguales:
= Valor de la posición
3. Moda
Valor con mayor frecuencia (que más se repite):
= Valor con la
El centro de la esperanza
En la siguiente tabla vas a estudiar el número de personas ancianas en un ayuntamiento según algunos intervalos de edad.
En caso de haber cifras decimales, recuerda escribir siempre dos, aunque alguna sea 0.
| Intervalos de edad | Marca de clase |
Número de personas |
Frecuencia absoluta acumulada |
|
|---|---|---|---|---|
| [65,70) | 67,5 | 855 | 855 | @@57712,50@@ |
| [70,75) | 72,5 | 179 | 1034 | @@12977,50@@ |
| [75,80) | 77,5 | 163 | 1197 | @@12632,50@@ |
| [80,85) | 82,5 | 92 | @@1289@@ = N | @@7590@@ |
| N==@@1289@@ | =@@90912,50@@ |

La media de edad de este sector de la población en este lugar es:
@@90912,50@@/@@1289@@=@@70,53@@ años.
¿Cuál es el valor con frecuencia absoluta más alta? En este caso, el intervalo modal es:
Mo=[@@65@@,@@70@@).
¿Hay un único valor en el medio de los datos? En este caso, el intervalo mediano es:
Me=[@@65@@,@@70@@).
Ahora fíjate en el histograma proporcionado, ¿aporta alguna información?
¿La información que has calculado, encaja con la información que nos aporta el histograma?
Reflexiona si podrías haber representado los datos a través de un diagrama diferente.
De la niñez a la ancianidad
A través del banco de datos del IGE, en la sección de sanidad, puedes obtener el número de pediatras por comarca en la provincia de A Coruña.
No vas a tener en cuenta los datos de las tres grandes ciudades, ya que desvirtuarían los datos.
Vamos a estudiar los parámetros de centralización y razonar la relación con la esperanza de vida de estos lugares.
En caso de haber cifras decimales, recuerda escribir siempre dos, aunque alguna sea 0.
| N.º de pediatras | N.º de ayuntamientos |
Frec. absoluta acumulada |
Frec. relativa |
|
|---|---|---|---|---|
| 0 | 1 | 1 | @@0,07@@ | @@0@@ |
| 1 | 3 | @@4@@ | @@0,20@@ | @@3@@ |
| 2 | 5 | @@9@@ | @@0,33@@ | @@10@@ |
| 4 | 3 | @@12@@ | @@0,20@@ | @@12@@ |
| 6 | 1 | @@13@@ | @@0,07@@ | @@6@@ |
| 8 | 2 | N = @@15@@ | @@0,13@@ | @@16@@ |
| N==@@15@@ | =1 | =@@47@@ |
La media de pediatras en A Coruña, por comarcas, es:
@@47@@/@@15@@=@@3,13@@ pediatras.
¿Cuál es el valor con frecuencia absoluta más alta? En este caso, la moda es:
Mo = @@2@@ pediatras.
¿Hay un único valor en el medio de los datos? En este caso, la mediana es:
Me = @@2@@ pediatras.
A raíz de los datos centrales obtenidos, reflexiona sobre cuál es el dato central de pediatras en las comarcas rurales de A Coruña.
¿Tiene sentido que la media no sea un número entero? ¿Por qué?
¿Crees que las comarcas rurales están suficientemente atendidas?
Aún despreciando los datos de las tres grandes ciudades, estás comparando datos de comarcas con unas poblaciones muy distintas. ¿Cómo podrías mejorar este estudio?
El motor de la vida
Vas a ver el estudio sobre el número de centros educativos con ESO y/o enseñanzas "posobligatorias" en los ayuntamientos de las comarcas de Ortegal, Eume y A Mariña occidental.
Los datos fueron obtenidos del IGE, para el año 2025.
A partir del diagrama de barras mostrado, referente a este estudio, deberás sacar los datos pedidos.
En caso de haber cifras decimales, recuerda escribir siempre dos, aunque alguna sea 0.


| N.º de institutos | N.º de ayuntamientos |
Frec. absoluta acumulada |
Frec. relativa |
|
|---|---|---|---|---|
| 0 | @@7@@ | @@7@@ | @@0,50@@ | @@0@@ |
| 1 | @@4@@ | @@11@@ | @@0,29@@ | @@4@@ |
| 2 | @@2@@ | @@13@@ | @@0,14@@ | @@4@@ |
| 3 | @@1@@ | N= @@14@@ | @@0,07@@ | @@3@@ |
| N==@@14@@ | =1 | =@@11@@ |
- ¿Solo observando el diagrama de barras, podrías decir cuál es la moda?
Mo = @@0@@ institutos.
- ¿Y cuál es la mediana? Ten cuidado, son datos pares.
Me = @@0,50@@ institutos.
- Ahora, utilizando la fórmula que ya has aprendido, calcula también la media:
= @@11@@/@@14@@ = @@0,79@@ institutos.
- ¿Cuál es tu opinión sobre la cantidad de ayuntamientos sin institutos? ¿Lo sabías?
- Has obtenido tres datos centrales sobre el número de institutos en una zona rural de Galicia. ¿Crees que son suficientes? ¿Por qué?
- ¿Qué conclusiones sacas de este estudio? ¿Crees que hay relación entre la educación y la esperanza de vida?