El periodista Esteban Valle–Riestra recomienda, a partir de su análisis de datos para el reportaje ‘Métricas de guerra’, cómo trabajar con información pública cuando las instituciones ponen trabas
Plataforma 'Métricas de guerra' de IDL-Reporteros. Imagen: Internet.
Por Esteban Valle-Riestra
En enero último se publicó en IDL-Reporteros el reportaje 'Métricas de guerra', que reveló la cifra de muertos y heridos de las FF.AA. y la Policía en enfrentamiento contra Sendero Luminoso en el VRAEM, su último bastión. ¿Cuántos soldados habían fallecido o resultado heridos en la última década? Sobre el papel, el encargo no parecía complicado. Algún departamento de las Fuerzas Armadas debería llevar la cuenta. Quizá algún funcionario del ministerio del Interior tendría una base de datos. Aquellas parecían ser las fuentes que podían brindar la información, pero hacia el final de la tarde la búsqueda se mostraba inútil. Después de consultar con diversas fuentes, todas señalaban que no existía un registro oficial de bajas. Ninguna autoridad conocía la cantidad exacta de soldados que habían caído combatiendo a Sendero Luminoso y al narcotráfico en los últimos años. No había información precisa, sólo vagas referencias. Se trataba además de un tema sensible. Las Fuerzas Armadas (en especial la Marina y el Comando Conjunto) se mostraban renuentes a compartir la información que disponían; revelar cuántos soldados habían muerto podría minar la moral de los combatientes, justificaban.
Si quería conocer la cifra tendría que reunir los datos por mi cuenta y construir una base de datos desde cero. Esta parecía ser la única salida y así empezó la investigación.
Tras un año de persistente trabajo, el resultado fue una base de datos que reunió en 377 registros el total de bajas de las Fuerzas Armadas peruanas ocurridas en el VRAEM, desde diciembre de 2005 hasta diciembre de 2014, y una historia que -a través de estos datos- describió por primera vez las distintas fases y escenarios de la guerra.
El proceso técnico está descrito en la infografía que acompaña la reproducción del artículo en la página de Convoca, desde la obtención de los datos hasta la visualización de los mismos y su publicación. Sin embargo, el producto final, más que seguir una secuencia mecánica, fue el resultado de un trabajo arduo y complejo en distintas etapas que se sucedieron y repitieron, y que dejó en el camino una serie de lecciones que aquí comparto.
¿Cómo trabajar con datos no disponibles? A continuación algunas recomendaciones:
La primera lección aprendida en 'Métricas de guerra' es que se debe evitar depender de una sola fuente al armar una base de datos. Una de las frases que siempre recalca Giannina Segnini, experta en periodismo de datos y pionera de su aplicación en América Latina, es que los datos, así como las personas, también mienten. Cada fuente de datos persigue distintos intereses y objetivos, y para poder tener un acercamiento a la verdad es preciso conocer cuáles son estos intereses y objetivos y recurrir a la mayor cantidad de fuentes posible. Esto se pudo notar y fue necesario aplicar desde el inicio de la investigación.
En 'Métricas de guerra', el insumo principal fueron los boletines del Comando Conjunto de las Fuerzas Armadas peruanas. Cuando ocurre una emboscada, hostigamiento a una base militar u operativo en el VRAEM, el Comando suele emitir a las pocas horas un comunicado detallando el incidente, los nombres de los soldados caídos, su rango e institución a la que pertenecen. Como fuente, los boletines tienen un carácter oficial. Los datos que brinda son confiables, sin embargo, siguiendo la premisa de Segnini, observé que la fuente mostraba una parte de la realidad. El Comando sólo reportaba los incidentes en los que hubiesen participado militares bajo sus órdenes; no reportaba, por ejemplo, los incidentes en los que participaban los policías destacados en la zona; ellos también eran un blanco de Sendero Luminoso y el narcotráfico.
Para captar todo el universo de bajas militares y policiales fue necesario complementar los datos con otras fuentes oficiales. Se solicitó información a las direcciones de personal de cada institución armada. Estas fuentes también respondían a distintos intereses pero una vez identificados los datos que mostraban -y ocultaban-, al contrastar, fue posible aproximarme con más precisión al universo total de bajas.
El reconocido periodista Gustavo Gorriti tiene una frase que describe con humor el rigor con el que un periodista debe manejar la información: “se tiene que ser tan preciso, que al lado Guillermo Tell parezca un hombre con Parkinson”. La cita se aplica con mayor razón cuando se trabaja con datos, y más aún cuando se arma una base de datos desde cero. Un error en las cifras puede cambiar todos los resultados y cuestionar la validez de los hallazgos. Por ello, uno de los principales aprendizajes de 'Métricas de guerra' fue la importancia de repetir los procesos, corroborar los valores y trabajar en equipo para evitar a toda costa el error.
Durante el diseño de la base de datos, los nombres de los soldados, fechas y lugares fueron digitados manualmente en una hoja de cálculo. Para evitar errores fue necesario “armar y desarmar” en varias oportunidades la base de datos hasta que los resultados fueron concluyentes. La base tuvo 26 versiones hasta lograr la versión final.
¿Las Fuerzas Armadas tendrían motivos para mentir en sus reportes? Era probable que las instituciones sub reportaran el número de muertos y heridos. También era posible que pusieran en discusión las cifras una vez publicadas, ya que revelarían la responsabilidad de las autoridades en el fracaso de las operaciones. Se contrastó cada incidente en el VRAE con informes publicados por la prensa; los datos de cada soldado fueron comparados con sus fichas de Reniec.
Asimismo, los periodistas Milagros Salazar y Aramís Castro colaboraron en el análisis y cruces de los datos y el uso de las herramientas de la visualización.
En el periodismo de datos, una vez reunida la información, procesada, corroborada y visualizada, el producto es una extensa recopilación de tablas y gráficos. En el interín, los resultados de la base pueden parecer los pasos finales, pero no lo son. Al contrario, estas cifras son a menudo inútiles si no hay historia para contar.
En 'Métricas de guerra', la cifra consolidada de muertos y heridos en los distritos del VRAEM era de interés público. Gorriti, el que mejor ha reporteado la guerra contra Sendero y el narcotráfico, analizó el cuadro final: había lapsos de guerra intensa y de silencios prolongados. Esto respondía a dos políticas de intervención: una marcada por una estrategia de control territorial, basada en el posicionamiento de bases militares principalmente en la zona de Vizcatán; y otro por una estrategia centrada en acciones focalizadas contra Sendero Luminoso, con énfasis en el trabajo de inteligencia. Cada período contó con responsables políticos y militares. Por primera vez, gracias a la reunión de datos, se mostró el costo en vidas tras las decisiones de cada gobierno. Ésta fue la médula del reportaje.
No sabía utilizar Excel ni las herramientas básicas de visualización antes de iniciar la investigación. Pero trabajar con gran cantidad de datos es un aprendizaje continuo; requiere sólo voluntad para probar nuevas herramientas y métodos.
En el transcurso fue necesario familiarizarme con las tablas dinámicas, funciones y procedimientos de Excel. Lo mismo sucedió con las herramientas de visualización de datos, sobre todo, las que permiten ubicar datos en distintos puntos de un mapa. También hay atajos para aprender como los tutoriales en Youtube y los manuales sobre periodismo de datos. Ninguna de estas herramientas es compleja ni requiere alta preparación técnica. Lo que más se necesita es la decisión para usarlas.
Enlace a ‘Métricas de guerra’: https://goo.gl/Ti3pZz