Contestadas esas preguntas y si la mayoría de las respuestas son satisfactorias para el periodista, lo siguiente es pasar mucho tiempo examinando –a veces hasta la obsesión- a esas hojas de cálculo en Excel, Tableau, SPSS, SQL o cualquier programa informático que se utilice para el análisis de la información. Personalmente, recurro a los dos primeros porque he comprobado que, hasta ahora, sobran y bastan en la ejecución de la mayoría de los estudios de periodismo de datos que he realizado.
Sólo si invierte una buena cantidad de horas comprendiendo la estructura de una base de datos será posible entrevistarla adecuadamente y extraer las conclusiones significativas y jugosas que se convertirán en los pilares de un proyecto exitoso.
Hacerlo es vital para percatarse de inconsistencias como errores de digitación en las cifras y nombres repetidos o escritos de diferente manera aunque pertenezcan a una misma entidad. Esos son descuidos que derivarán en cálculos subestimados y alterarán los resultados de la investigación.
Un ejemplo de eso nos ocurrió durante un proyecto sobre exclusión estudiantil (deserción) en secundarias públicas que efectuamos en la Unidad de Inteligencia de Datos de La Nación de Costa Rica. Cuando mi colega Amy Ross y yo inspeccionábamos la base de datos con la información de 643 colegios, uno de ellos resaltó como el que más disminuyó el fenómeno en todo el país.
Los números consignados en el registro oficial del Ministerio de Educación Pública decían que en esa institución la fuga de alumnos había pasado de un 68% de la matrícula en 2011 a 14% en 2013. Es decir el problema decreció en 53 puntos. El cambio era tan extremo que despertó sospechas. Cuando conversé con el director de ese centro educativo para contrastar los datos absolutos y relativos, él revisó sus expedientes y me confirmó la mala digitación de la cifra de abandono estudiantil del año pasado; la real alcanzó al 50% de sus alumnos.
Otro beneficio de explorar una base de datos a profundidad es advertir faltantes de números.
Una vez más en el proyecto de deserción colegial nos llamó la atención que en una de las instituciones grandes (más de 1.000 alumnos), la exclusión de estudiantes había pasado de 445 en 2012 a nada en 2013.
Evidentemente allí faltaba un dato. En efecto, el Ministerio de Educación Pública nos corroboró que “por un error involuntario” no se incluyó en esa celda a los 694 estudiantes que abandonaron el centro de enseñanza en 2013. Ese número era significativo; sin él habríamos pasado por alto que esa secundaria es una donde es más problemático el abandono escolar.
Es crítico ser meticuloso con esos detalles. Solo imagine lo que podría ocurrir si, usando el registro de cifras de criminalidad de su país, no advierte la ausencia de números de robos, asaltos o asesinatos en municipios clave. Todo su trabajo se iría a la basura porque arribaría a conclusiones falsas.