Por @Alvy — 12 de abril de 2016

La estructura de los Papeles de Panamá (que son más que «papeles»)

En el Süddeutsche Zeitung publicaron esta interesante gráfico que desglosa qué tipo de contenidos hay en los 2,6 terabytes procedentes de la filtración de los Papeles de Panamá; la información al completo está en About the Panama Papers.

Aunque la cantidad es descomunal no se trata simplemente de terabytes de «texto» como podría sugerir el término papers; también hay documentos que ocupan mucho más: «formatos de bases de datos» (3 millones, probablemente hojas de cálculo), PDFs, imágenes (seguramente documentos escaneados) y otros. En total se habla de «11,5 millones de documentos».

Un disco duro de 3 TB donde meter todo esto se puede comprar en la tienda por unos 100 euros.

La escala de los Papeles de Panamá (que son más que «papeles»)

Respecto a los datos en sí, son tantos que dicen que han trabajado en ellos, en secreto, unos 400 periodistas durante los últimos 12 meses; en total 100 medios de 80 países. Todos los documentos «gráficos» se pasaron un un sistema de OCR (Reconocimiento Óptico de Caracteres) antes de almacenarse en una gigantesca base de datos. Diversos sistemas permitían buscar y también comparar rápidamente largas listas de nombres propios con el contenido de esos millones de documentos, buscando coincidencias.

Respecto a la forma en que los hackers entraron en los ordenadores del bufete de abogados Mossack-Fonseca se especula con una versión vulnerable de Revolution Slider, un plugin del popular sistema de contenidos Wordpress que se utilizaba en la web del despacho. Esto habría permitido acceder a uno de los servidores, que estaría conectado al servidor de correo electrónico (al parecer sin ninguna medida de seguridad entre medias) y desde ahí se habría lanzado un ataque mediante phising contra los empleados. Gracias a esto se habría infectado con algún tipo de malware los ordenadores del bufete para obtener diversas contraseñas con las que acceder a todos los archivos. Un poco de paciencia en la descarga de todos esos terabytes y ataque concluido. «¡Oye, que esta conexión a Internet me va muy lenta!» debió ser la queja más habitual en el bufete el año pasado…

Por su parte, el Consorcio Internacional de Periodistas de Investigación (ICIJ) que ha coordinado las investigaciones utilizó los servidores de la nube de Amazon para guardar y procesar todos estos datos. Eso sí, fueron más cautos: utilizaron PGP/GPG para cifrar sus correos y Signal como mensajería personal, opciones consideradas altamente seguras.

Compartir en Flipboard Publicar / Tuitear Publicar