Uso correcto de los números y estadísticas
Site: | Universidad de la República |
Course: | Datos Abiertos como Recursos Educativos Abiertos - 2021 |
Book: | Uso correcto de los números y estadísticas |
Printed by: | Guest user |
Date: | Saturday, 14 December 2024, 8:19 AM |
Table of contents
- 1. Porcentajes
- 2. Cambio porcentual vs Puntos porcentuales.
- 3. Ajuste por inflación
- 4. Hacer comparaciones tomando en cuenta a la población
- 5. Comparar “manzanas” con “manzanas”
- 6. Evitar los absolutos
- 7. Otros consejos para comparar
- 8. Cuidado con la unidad que usamos para el análisis
- 9. La media (promedio) versus la mediana
- 10. Tener el panorama completo
- 11. Generalizaciones a la población: sondeos vs. encuestas
1. Porcentajes
Autora: Camila Salazar para Escuela de Datos
Si tenemos un total de N elementos y queremos calcular que porcentaje representan k elementos de ese total aplicamos la fórmula:
Por ejemplo: Un total de 700 personas fallecieron en 2013 por accidentes de tránsito. De estos 170 se debieron a accidentes en motocicleta. ¿Qué porcentaje representan los accidentes en motocicleta del total.
2. Cambio porcentual vs Puntos porcentuales.
Siguiendo con el ejemplo anterior, supongamos que para el 2014 los accidentes de tránsito aumentaron a 745. ¿Cuál fue el cambio porcentual en el número de accidentes? Usamos la fórmula:
En ese mismo año (2014), se registraron 224 accidentes de motocicletas, lo cual representa un 30% de los accidentes de tránsito de ese año. En comparación al 2013 los accidentes de motocicletas aumentaron en 5.8 puntos porcentuales (30-24,2). Por su parte el cambio porcentual en este tipo de accidentes fue de un 31,7% .
Confundir estos dos conceptos es un error común. Así por ejemplo si la tasa de interés pasó de 3% a 4%, lo correcto sería decir que aumentó un punto porcentual o un 33,3%, mientras que lo incorrecto sería decir que aumentó un 1%.
3. Ajuste por inflación
Cuando comparamos cantidades monetarias de diferentes periodos es necesario ajustarlos por la inflación. Esto se debe a que por ejemplo $1 en el 2015 vale mucho menos que $1 hace 10 años. Cuando hacemos la comparación sin ajustar por inflación estamos utilizando los montos nominales , mientras que si hacemos el ajuste serían montos reales.
¿Por qué es importante? Supongamos que estamos haciendo un trabajo sobre el gasto del gobierno en un programa específico. En 2010 se gastaron ¢21,6 millones mientras que en el 2014 el gasto aumentó a ¢27,5 millones. Si hacemos la comparación en términos nominales obtenemos que el gasto en el programa aumentó en un 27%. No obstante realizar esta comparación no refleja el cambio en el valor de los colones, es decir, la cantidad de cosas que podíamos comprar en 2010 con ese monto versus las que podemos comprar en el 2014. Es por eso que es recomendable hacer el ajuste por inflación.
Para ello utilizamos normalmente el Índice de Precios al Consumidor que calculan los Institutos Nacionales de Estadísticas. Este indicador permite medir la evolución de los precios de un conjunto de bienes y servicios específicos. Este índice tiene un periodo base igual a 100 y varía de periodo a periodo.
Siguiendo el ejemplo anterior, si quisiéramos convertir los montos del programa del gobierno a colones constantes (o reales). Supongamos que el IPC para el 2014 fue de 171,2 y el de 2010 de 141 (la base utilizada en este caso es la de 2006). Procedemos de la siguiente manera:
a) Convertimos cada uno de los montos a colones (moneda) del año base:
En el ejemplo sería, para 2014 (27,5/171,2)*100 = ¢16,06 millones de colones de 2006. Mientras que para el 2010 (21,6/141)*100= ¢15,31 millones de colones de 2006.
b) Una vez que tenemos los montos en términos reales calculamos la variación porcentual. ((16,06/15,31)-1)*100= 4,89%
Es decir el gasto en el programa solamente aumentó un 4,9% en términos reales entre 2010 y 2014, mientras que si no hubiéramos hecho el ajuste por inflación la variación hubiera sido de 27%.
¿Qué pasa si queremos expresar los montos no en colones de 2006 sino en colones de 2014? Para ello creamos una nueva base. En este caso si nuestra nueva base es la de 2014 lo que hacemos es dividir los diferentes IPC de los periodos entre el IPC del nuevo año que queremos tomar como base. De esta manera en el ejemplo el nuevo IPC para 2014 sería 171,2/171,2=1 mientras que el 2010 sería igual a 141/171,2=0,8205.
Es importante notar que ahora el IPC no está en una base 100, sino en base decimal, por lo que para calcular los montos en colones de 2014 únicamente tenemos que dividir el monto entre el índice sin multiplicar por 100.
Así tendríamos que para 2014 el monto sería ¢27,5 millones mientras que el 2010 sería 21,6/0,8205= 26,32 millones. Si ahora calculamos la variación porcentual obtenemos que es de 4,8%, igual que al calcularla de la otra manera.
4. Hacer comparaciones tomando en cuenta a la población
Supongamos que tenemos que el gasto para el 2014 del municipio de la ciudad capital San José fue de ¢60.000 millones y el de Garabito (una comunidad rural) fue de ¢5000 millones. Si decimos que la municipalidad de San José gastó 12 veces más que la de Garabito, si bien el dato es numéricamente correcto la comparación es engañosa. ¿Por qué? Mientras la ciudad central de San José tiene 333.980 habitantes la de Garabito tiene 22.767 habitantes.
Así una mejor forma de comparar es calcular el gasto per cápita dividiendo el gasto total entre el número de habitantes. Al hacer dicho cálculo obtenemos que el gasto per cápita de la municipalidad de San José fue de ¢179 mil colones, mientras que el de la municipalidad de Garabito fue de ¢219 mil colones. Es decir el municipio rural tiene un mayor gasto por habitante que el de la ciudad capital, lo cual da un nuevo ángulo a nuestra historia y hace la comparación más adecuada.
Otras formas útiles de hacer este tipo de comparaciones es calcular Tasas. Por ejemplo la tasa de homicidios por cada 1000 o 100 mil habitantes. Esta se calcula:
Esto me daría la tasa de homicidios (por ejemplo) por cada 100 mil habitantes en una localidad determinada.
5. Comparar “manzanas” con “manzanas”
Ya vimos que para hacer comparaciones más precisas es necesario comparar dos cosas de la misma categoría, por ejemplo hacer las comparaciones en términos reales o tomando en cuenta a la población de una localidad.
Un error común cuando se comparan datos de periodos es comparar periodos distintos. Por ejemplo comparar el total de turistas que llegaron a un país durante TODO el 2014 con el total de turistas que han llegado al país de enero a junio del 2015. Esto es incorrecto ya que no estamos comparando los mismos periodos. Lo correcto sería comparar datos del mismo periodo, en este caso el primer semestre de 2014 versus el primer semestre del 2015.
Lo mismo ocurre si por ejemplo no tomamos en cuenta cambios que pueda sufrir una variable entre periodos. Por ejemplo si un Ministerio del Gobierno absorbió funciones de otro entre dos periodos tendría sentido que su presupuesto aumente. Estos cambios también se pueden deber a la forma en la que se miden indicadores como la pobreza, que pueden tener variaciones metodológicas entre periodos lo cual puede hacer los datos no comparables. En estos casos hay que estar pendiente de estos detalles y de ser necesario consultar a la fuente.
6. Evitar los absolutos
“El Ministerio de Seguridad gastó ¢200 millones en capacitación a policías” ¿Y? Presentar una cifra así no nos dice mucho, no sabemos si 200 millones es mucho o poco, si es un monto razonable para gastar en ese tipo de proyecto, si es lo mismo que gastó el año pasado.
Es por eso que
presentar cifras absolutas puede ser poco efectivo si no las dotamos de
contexto. En estos casos es mejor utilizar algún tipo de comparación o
contextualizar el dato, por ejemplo decir (si así fuera el caso) que el ministerio
gastó tres cuartas partes de su presupuesto en un único programa.
7. Otros consejos para comparar
Una forma fácil de dar perspectiva a los números es haciendo referencia a medidas que sean más comprensibles para nuestra audiencia. Por ejemplo si decimos que una tormenta dejó sin hogar a 500 mil personas en una localidad, una forma de darle perspectiva sería decir que tres cuartas partes de la localidad se quedaron sin casas producto de la tormenta.
Es decir el consejo es buscar comparaciones más cercanas a nuestros lectores, por ejemplo comparar áreas con el tamaño de una cancha de fútbol, distancias conocidas, tamaños de ciudades, entre otros.
8. Cuidado con la unidad que usamos para el análisis
Supongamos que queremos hacer un artículo sobre el rendimiento académico en los colegios y tenemos dos tipos de datos: la notas por colegios y por estudiantes. Al analizar los datos obtenemos dos tipos de resultados que podrían convertirse en estas afirmaciones:
A: “El rendimiento académico está peor porque 60% de los colegios tuvieron resultados peores que el año anterior”.
B: “El rendimiento académico mejoró este año porque el 80% de los estudiantes obtuvieron mejores calificaciones que el año anterior”.
Las dos afirmaciones son correctas sin embarco, ¿cuál es más
adecuada? La diferencia entre ambos casos es que se están utilizando diferentes
unidades de análisis, en el ejemplo A se usan los colegios y en el B los
estudiantes. En este caso específico sabemos que no necesariamente las escuelas
tienen el mismo número de estudiantes por lo que sería más adecuado utilizar
como unidad de análisis los estudiantes y no los centros educativos. Lo mismo sucedería si queremos analizar si una industria ha
empeorado o mejorado en el tiempo: ¿usamos el número de exportaciones, el
número de empleos en la industria o ambos. Así la lección es que a la hora de analizar un fenómeno es
importante pensar cómo vamos a medirlo y qué variables son más adecuadas para
lo que queremos analizar.
9. La media (promedio) versus la mediana
La media (o promedio) y la mediana son medidas de tendencia central, que nos permiten ubicar ciertos puntos de la distribución. Para calcular un promedio simple sumamos las observaciones y las dividimos entre el total, mientras que la mediana mide el centro de la distribución, es decir, 50% de las observaciones se encuentran por debajo de la mediana y 50% por encima de ella.
¿Cuál es la medida más recomendable para utilizar?
Depende.
El promedio se afecta por valores extremos y por la distribución de los datos, por lo que no es una medida muy adecuada en estos casos. Por el contrario la mediana es menos sensible a la dispersión de la distribución y no se afecta tanto por los valores extremos. No obstante esto puede ser una desventaja si los valores extremos son de interés para nuestro análisis.
Una buena forma de abordar el problema es calcular ambas medidas y además reportar medidas de dispersión como la desviación estándar o el rango de la distribución. Esto nos lleva al otro punto.
10. Tener el panorama completo
Un número aislado no nos dice mucho y menos si el enfoque de nuestra nota se basa en ese cálculo. Por ejemplo decir que el salario promedio de los funcionarios públicos es de ¢1 millón de colones. Con este único dato no tendríamos idea de cómo se distribuyen esos datos o tan siquiera si el promedio es la medida más adecuada para explicar el fenómeno. Es por eso que cuando trabajamos con datos es importante tratar de tener toda la distribución de la variable. Así podemos calcular histogramas y determinar con mayor precisión cómo se distribuyen los datos y qué tipo de cálculos es más adecuado realizar.
11. Generalizaciones a la población: sondeos vs. encuestas
Un titular dice: “La mitad de la población aprueba la gestión del presidente de la República”. Los resultados se basan en una encuesta realizada a una muestra de la población total del país. ¿Cómo podemos hacer generalizaciones de una muestra a la población? Las encuestas (metodológicamente bien construidas) se diseñan precisamente para poder hacer generalizaciones a una población específica con un margen de error determinado. Por ejemplo con una encuesta de juventud específica, podemos hacer inferencias sobre la población de 18 a 35 años de una ciudad (si esa fuera la población de interés).
Sin embargo en ocasiones en las salas de redacción nos encontramos con titulares como: “El 60% de la población cree en Ovnis”. La conclusión se obtuvo de un sondeo en la calle con 50 personas que dieron su opinión al periodista. Esas 50 personas no representativas de la población del país, ni siquiera de la población que cruza la calle donde hicieron las entrevistas. De esta manera ¡hay que evitar a toda costa este tipo de afirmaciones que son no solo engañosas para nuestra audiencia, sino estadísticamente incorrectas!