¿Cómo los usuarios pueden procesar datos censales en América latina?

por Andrés Vázquez, OpenDataCordoba y Junar

Hace algún tiempo tuve mis primeros contactos con el software que usamos en Argentina para almacenar y procesar los datos de nuestros censos. REDATAM no es un producto argentino, fue desarrollado por la CELADE (dependiente de CEPAL) y tuvo su primera versión para DOS en 1987. Dado que en aquel momento en latinoamérica era muy caro y complejo procesar censos, muchos países comenzaron a usarlo gratuitamente, lo que fue de gran ayuda para los institutos de estadística y los usuarios de la región. El producto evolucionó, agregando de a poco regiones y usuarios. Incluso, en países de África y Asia fue un éxito.

Actualmente REDATAM  puede correr como servidor para procesar datos en internet. Los datos del censo 2010 de Argentina están disponibles online. Lamentablemente este producto corre solo en servidores Windows (que en la actualidad dejó de ser un estándar para estos servicios). En la sección de novedades de la página web del REDATAM pueden leerse cosas como:

Pruebas satisfactorias de todos los módulos del sistema en Microsoft Windows Vista con excepción de las ayudas (Microsoft Windows Vista no soporta directamente archivos de ayuda tipo )

Claramente este producto se está quedando en el tiempo y los formatos en los que se manejan los datos no son muy cómodos. El equipo de programación de REDATAM nos comentó:

Estamos prontos a presentar una nueva generación denominada Redatam7 que incorpora el lenguaje XML para entrada y salida de resultados (por lo pronto a nivel de la aplicación instalable) y permite de alguna manera a otros desarrolladores interactuar de mejor manera con las bases de datos generadas en REDATAM.

Si bien REDATAM es gratuito, el código fuente con el que fue construido no es de libre acceso, quiero decir, se puede usar pero no se puede ver o proponer mejoras. Esto limita su desarrollo al equipo actual de programación y no permite a las comunidades de software libre auditar, proponer o desarrollar cambios en el producto. Sobre este tema el equipo de desarrollo nos indicó:

El tema del código abierto, es otra gran coincidencia, lamentablemente no pasa por quienes desarrollamos el sistema, sino por los propietarios de los datos (generalmente oficinas de estadística) quienes utilizan el software para asegurar la confidencialidad del microdato.

Luego de ésto se descubrió que los datos internamente no se guardan cifrados (fue notificado como falla de seguridad). Esto quiere decir, una persona con los datos (el CD que reparte en INDEC en Argentina por ejemplo) en su poder podría extraerlos con algún algoritmo. O sea, no se guardan de manera segura. 

Prueba de esto es que Pablo De Grande desarrolló y liberó una herramienta de software para extraer la base completa (a nivel de personas, sin nombres, claro) de cualquier censo hecho con REDATAM en un blog argentino .

No parece estar en los planes de CELADE la renovación de este producto, sirva esta publicación como llamado a la discusión de este tema.

La renovación de esta herramienta a estándares actuales permitiría la re-utilización de estos datos en aplicaciones que acerquen al ciudadano a conocer más y -sobre todo- a los gobiernos locales, que en general no aprovechan estos datos.

7 comentarios en “¿Cómo los usuarios pueden procesar datos censales en América latina?

  1. Pingback: ¿Que tecnología se usa en los censos de latinoamérica? | Temimbo'e

  2. Pingback: Modos de acceso a los datos censales en los países de América Latina | OLAC

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s