Modos de acceso a los datos censales en los países de América Latina

Por Mathías Nathan y Nicolás Sacco

En el estudio de la realidad demográfica, social y económica de América Latina, los censos de población cumplen funciones esenciales para el funcionamiento de los sistemas estadísticos nacionales, la implementación de servicios gubernamentales, la asignación de recursos públicos, la inversión privada y la investigación académica. El gran valor socio-histórico de los censos se debe a su vez al hecho de que fueron prácticamente la única fuente de datos sobre cuestiones sociales durante mucho tiempo en la región. Además de sus conocidas bondades para poder examinar los fenómenos a nivel de áreas geográficas menores o para subpoblaciones pequeñas, los censos han sido utilizados habitualmente para el análisis comparado entre países o de un mismo país a lo largo del tiempo.

El objetivo de este post es contribuir con la discusión sobre las formas de acceso a los datos censales en los países de América Latina, examinando las distintas modalidades existentes así como sus ventajas y desventajas. Las rutas de acceso a los repositorios de microdatos y de herramientas de análisis de datos en línea identificados están colgados en la sección de Recursos/Links de nuestro blog.

A raíz de la reciente circulación de bases de datos “no oficiales” publicadas por usuarios anónimos antes que por las oficinas nacionales de estadística, consideramos importante abrir a debate las modalidades de acceso a los censos, tanto desde la perspectiva de los usuarios como la de los propios institutos oficiales.  La magnitud de la difusión de microdatos censales para el desarrollo y la investigación, con garantías adecuadas para proteger la privacidad y garantizar la confidencialidad, ha sido recientemente señalada por el Director de Población de Naciones Unidas @JohnWilmothUN en la última sesión de la Comisión de Población y Desarrollo de Naciones Unidos #CPD49, dado su potencial para ampliar significativamente los usos de la información.

La realización de censos de población no se limita a las extensas fases de organización, implementación del operativo de campo, posterior evaluación y difusión de cifras oficiales definitivas. Las oficinas de estadística también deben desarrollar y difundir los “productos censales”: tabulaciones básicas, mapas e informes temáticos, entre otros. Dentro del amplio conjunto de potenciales usuarios de los datos censales, existe un subconjunto -a veces denominado de “usuarios calificados”- cuya demanda de información no se ve satisfecha a partir de los productos de información predefinidos por las oficinas de estadística y, por ende, requiere del acceso a los microdatos censales. Además, en una época de creciente uso de la información social para la toma de decisiones y de mayor disponibilidad de herramientas para su análisis, este tipo de usuarios -así como sus necesidades de información- se encuentra en aumento. Según Naciones Unidas,

Si bien los datos estadísticos o los informes censales, los mapas y atlas impresos y digitales, incluido el suministro de cierta capacidad cartográfica dinámica, pueden difundirse fácilmente en diversas formas, incluidos diferentes tipos de soportes informáticos, la mejor manera de atender eficaz y eficientemente la creciente demanda por parte de los usuarios de una variedad cada vez mayor de datos censales es permitir y ayudar a los usuarios a acceder a los datos y crear sus propios cuadros personalizados o configurar espacialmente los productos informativos de acuerdo con las diferentes necesidades espaciales.[1]

Asimismo, la disponibilidad de microdatos para el procesamiento por parte de los usuarios calificados puede reducir sensiblemente la demanda potencial de pedidos de datos a la oficina de estadística, liberando recursos que pueden ser de utilidad en otras áreas de trabajo.

¿Cómo se hace para acceder al procesamiento de datos censales en América Latina? ¿Qué tipo de respuestas ofrecen las oficinas nacionales de estadística en esta materia? ¿Cuáles son las alternativas? ¿Cuál es el panorama y cuáles son las perspectivas a futuro?

Es lo que hay

Más allá de los tabulados disponibles y publicaciones con resultados discriminados temáticamente, existen, al menos, cuatro modalidades de acceso a los datos censales de los países en la región:

  1. el uso de herramientas de procesamiento en línea;
  2. la descarga de los microdatos censales disponibles en los sitios web oficiales de las oficinas nacionales de estadística (ONEs);
  3. la descarga de una muestra de microdatos censales del proyecto IPUMS International (IPUMS-I de la Universidad de Minnesota);
  4. la solicitud directa de microdatos o tabulados a las ONEs.

Mientras que en las primeras tres se trata de recursos disponibles en internet, la última demanda diferentes tipos de procedimiento para dar trámite a la solicitud de datos, que pueden implicar la presencia física en el país de interés e incluso el cobro de haberes por el servicio.

Asimismo, mientras que la mayoría de estas modalidades de difusión y liberación de datos censales son definidas y gestionadas por las ONEs, la opción de utilizar los datos disponibles en IPUMS-I requiere aceptar una serie de condiciones dispuestas por la Universidad de Minnesota (registración, cita, etc.). Vemos cada caso en particular.

  1. Procesamiento de datos en línea

Las herramientas de procesamiento de datos censales en línea han significado un gran avance para los usuarios interesados en producir rápidamente un conjunto de tabulados básicos de interés. Esta estrategia consiste en la posibilidad de acceder remotamente a las bases datos y a un conjunto de variables censales, definir qué variables se quieren utilizar en el análisis descriptivo y su desagregación territorial, y la posterior descarga de los tabulados en distintos formatos. El procesamiento de los censos en línea ha sido la modalidad más utilizada entre las ONEs de América Latina durante las últimas rondas censales para hacer públicos sus datos y contemplar las distintas demandas de información por parte de los usuarios. Para ello ha sido fundamental el apoyo técnico e informático brindado por el Centro Latinoamericano de Demografía (CELADE) a través del software REDATAM[2] y su desarrollo de aplicaciones web para la difusión de la información (REDATAM on-line).

La manera más sencilla de acceder a los censos disponibles para procesar con REDATAM en línea es a través del sitio web de REDATAM 7, en donde aparecen los vínculos de acceso a los censos disponibles para un listado países latinoamericanos y caribeños, según país y año del censo[3]. Las principales fortalezas del REDATAM en línea son su carácter “amigable” para usuarios con distintos niveles de experiencia[4] y la gran rapidez para el procesamiento de bases de datos con un número alto de registros. Asimismo, tiene la ventaja de incluir una sección de documentación, en donde por ejemplo se puede encontrar el cuestionario censal y el manual del empadronador, y otros metadatos; y también provee una herramienta para la generación de mapas temáticos. Cuenta con el apoyo técnico del CELADE que además ofrece periódicamente talleres para usuarios de datos y para formar técnicos en la generación de bases en formato REDATAM y desarrollo de aplicaciones web. Entre las principales limitaciones del REDATAM en línea se puede mencionar que muchas veces se difunde un conjunto incompleto de variables censales y que el tipo de análisis estadístico que se puede obtener se encuentra restringido y es relativamente básico (análisis de frecuencias simples, tablas cruzadas, conteos y promedios, indicadores predefinidos), y es poco amigable guardar consultas a la base para reproducirlas.

Si bien la mayoría de los países de la región cuentan con esta herramienta de consulta interactiva de datos, no todos incluyen los censos de rondas anteriores (ver tabla resumen más abajo). Como excepción, se pueden encontrar datos disponibles para las últimas cuatro rondas censales en los casos de Costa Rica y República Dominicana, y de tres rondas censales en Ecuador, Honduras, Panamá y Perú. Por otra parte, no hay datos disponibles para Brasil y México.

El IBGE de Brasil y el INEGI de México no utilizan la tecnología REDATAM sino que optaron por desarrollar aplicaciones propias para la consulta interactiva de datos censales. El IBGE tiene el Sistema de Recuperación Automática (SIDRA) para la consulta de tabulados de los censos demográficos de 2000 y 2010. Por su parte, el INEGI presenta una herramienta-web disponible para el análisis de los censos y conteos de población y vivienda realizados entre 1990 y 2010. Dicho país también cuenta con un sistema de consulta en línea para acceder a tabulados básicos (predefinidos) y pirámides de población para los censos de 1895 hasta 1980.

Ahora bien, como sabemos REDATAM no solo ofrece herramientas de procesamiento en línea sino también la descarga del software para el procesamiento de microdatos censales en formato propio, ampliando el abanico de posibilidades de análisis, tanto en términos de variables disponibles y tipo de procesamiento estadístico, como por el hecho de poder acceder a bases de datos de censos “históricos”. La dificultad en este sentido está dada por el hecho de que se requiere acceder a los microdatos y para ello no están del todo claro los procedimientos vigentes en los países de la región. Volveremos sobre este punto más adelante.

              2. Descarga directa de microdatos

Un conjunto reducido de países de América Latina optó por habilitar la descarga libre y gratuita de los microdatos censales, disponibles en los sitios web de las ONEs.

El INEC (Ecuador) se destaca dentro de la región por el hecho de colgar los microdatos completos de sus últimos tres censos (1990, 2000 y 2010) para su descarga automática en formato SPSS, DBF, REDATAM o ASCII. El INE de Uruguay ha optado por la misma estrategia con el censo 2011 y el recuento censal 2004 (disponible en SPSS o DBF), si bien se debe reconocer que dicha política ya había sido aplicada con los datos del censo 1996.

Otros dos países que cuentan con esta posibilidad son Brasil y México, si bien los datos disponibles se restringen al censo de la muestra (cuestionario ampliado). En el caso de Brasil, el IBGE tiene habilitado en su página web la descarga gratuita por unidades federales de los microdatos de los censos demográficos 2000 (muestra) y 2010 (muestra) en formato ASCII, junto con documentación auxiliar. En la web del INEGI de México, por su parte, se pueden descargar gratuitamente los microdatos del censo de la muestra (extracto del 10% de la base de datos nacional), por Estado, para los censos generales de población y vivienda 1990, 2000 y 2010, así como también para los conteos de población y vivienda 1995 y 2005. Dado que no está habilitada la opción de descarga para los datos del cuestionario básico (cobertura total de la población) el INEGI ofrece servicios de procesamiento remoto a partir de solicitudes de los usuarios, en función de su adscripción institucional (por un lado están los usuarios específicos, como por ejemplo funcionarios de organismos públicos o investigadores de instituciones académicas, y por el otro el público en general). La utilización de dichos servicios exige una serie de trámites y formalidades, además de estar sujetos a potenciales costos a definir por parte del INEGI.

La descarga directa de los microdatos censales desde los sitios web oficiales de las ONEs tiene claramente una serie de ventajas para el analista de datos, en tanto permite trabajar con el set completo de variables utilizadas en el cuestionario censal (salvo eliminación expresa por parte de la ONE) y realizar diferentes procesamientos estadísticos que permitan atender sus necesidades específicas de información. Uno de los aspectos a considerar por parte de las ONEs que se inclinan por esta opción es la protección de la confidencialidad de los datos ofrecidos por las personas que fueron censadas, en tanto la información almacenada en los microdatos censales puede llevar a la identificación de las mismas, particularmente si se trabaja con información de áreas muy pequeñas del territorio.

Como mencionamos en un post anterior también existe la posibilidad de convertir los diccionarios de formato REDATAM a otros formatos, lo cual puede llegar a simplificar enormemente tareas de procesamiento de datos.

            3. IPUMS-I: ¿la solución?

Sólo cinco años después de la creación del CELADE, este organismo comenzó la Operación de Muestras de Censos (OMUECE), la más ambiciosa muestra internacional de censos del siglo XX. Gracias ello el archivo de microdatos censales de América Latina es uno los más completos (y posiblemente menos utilizados) de cualquier región del mundo (para más información ver artículos de McCaa y Jaspers-Faijer (2000) y McCaa, Esteve, Ruggles y Sobek (2004). Este proyecto fue el antecedente directo de las bases disponibles hoy en el IPUMS-I, proyecto que merece, mínimo, un monumento.

IPUMS-I ofrece una colección, inventario, preservación de datos y documentación referida a muestras de censos en el mundo, con información armonizada, es decir, comparable entre países, de manera gratuita. Tiene una documentación bastante exhaustiva y facilita de esta forma la investigación comparativa.

Una de las desventajas del proyecto IPUMS es que no posee mecanismos de validación con los propios ONEs y a veces resultan más confiables datos de los ONEs que IPUMS en algunas variables. Desde OLAC volveremos sobre estas cuestiones en un futuro post sobre el impacto de IPUMS en los estudios de población en América Latina.

Adjuntamos una tabla resumen de estos tres tipos de modalidad según países:

Consulta interactiva en línea IPUMS-I Microdatos para descarga en sitio web ONEs
Argentina (R) 2001·2010 (B&A) 1970·1980·1991·2001
2010
2001-2010 (B)
Bolivia (R) 2001·2012 1976·1992·2001
Brasil 2000·2010 1960·1970·1980·1991
2000·2010
2000·2010 1
Chile (R) 1992·2002 1960·1970·1982·1992
2002
Colombia (R) 2005 (B&A) 1964·1973·1985·1993
2005
Costa Rica (R) 1973·1984·2000·2011 1963·1973·1984·2000
2011
Cuba 2002
Ecuador (R) 1990·2001·2010 1962·1974·1982·1990
2001·2010
1990·2001·2010
El Salvador (R) 2007 1992·2007
Guatemala (R) 1994·2002
Haití 1971·1982·2003
Honduras (R) 1988·2001·2013
Mexico 1990·1995·2000·2005
2010
1960·1970·1990·1995
2000·2005·2010
1990·1995·2000·2005
2010 12
Nicaragua (R) 1995·2005* 1971·1995·2005
Panamá (R) 1990·2000·2010 1960·1970·1980·1990
2000·2010
Paraguay (R) 2002 1962·1972·1982·1992
2002
Perú (R) 1981·1993·2007 1993·2007
Puerto Rico 1970·1980·1990·2000
2005·2010
Rep. Dominicana (R) 1981·2002·2010 1960·1970·1981·2002
2010
Uruguay (R) 2011 1963·1975·1985·1996
2011
1996·2011
Venezuela (R) 2001·2011 1971·1981·1990·2001

Notas:

R Procesador REDATAM en línea
B&A Cuestionarios básico y ampliado
1 Descarga de microdatos de muestra (censo ampliado)
2 Procesamiento mediante solicitud para microdatos del cuestionario básico
* Está disponible un conjunto de tabulaciones pero no el procesador en línea

         4. Solicitudes directas a las oficinas nacionales de estadística

¿Qué se hace cuando las opciones de acceso a datos censales mencionadas más arriba no satisfacen los requerimientos de información de los usuarios, ya sea porque se precisa información sobre un conjunto de variables específicas, o para un año censal en particular o para poder analizar los datos con mayores niveles de desagregación territorial? Pues bien, siempre está la opción de recurrir a la ONE del país.

Sabido es que muchas ONEs conservan -de alguna manera y en algún sitio- una copia de las bases de los censos realizados en el país. ¿Se puede acceder a las mismas? Si así fuera, ¿en qué formato y condiciones se podrían adquirir? ¿Cuál es el procedimiento a seguir para realizar esta solicitud? ¿Tiene algún costo?

Lamentablemente no tenemos respuestas claras para estas preguntas pero es probable que existan posibilidades y criterios diferentes en cada país. A modo de ejemplo, el DANE de Colombia permite el procesamiento de los datos del censo 2005 únicamente en las Salas de Procesamiento Especializado Externo, disponibles en algunas ciudades de Colombia, y para lo cual es necesario solicitar autorización indicando el objeto y destino de la información, y firmando un compromiso de confidencialidad. En Uruguay, también a modo de ejemplo, el INE entrega un CD-ROM con las bases de datos censales de 1975 a 2011 en formato REDATAM a quienes presenten una solicitud vía correo electrónico.

En este sentido, resulta difícil de identificar los procedimientos vigentes en las ONEs de la región. En algunas de ellas existen procedimientos claros y estandarizados para atender los pedidos de bases de datos censales, pero en otras no. Cuando ocurre esto último, suele suceder que los criterios varían en el tiempo y en función de las autoridades presentes en el organismo.

¿Lo que ves es lo que hay?

Y, como en todo, hay también opciones no oficiales, que pueden ser útiles y traen serias preguntas y dudas acerca de la producción de estadísticas oficiales en la actualidad. A modo de ejemplo, en el caso de Argentina, más de allá de los microdatos de los  censos de 1869 y 1895, recuperados gracias al enorme trabajo de un usuario, como vimos en un post previo, ha circulado recientemente una versión «no oficial» del Censo de 1991 en formato REDATAM (también la de otros países). Esto se adelantó a la propia liberación de microdatos propia INDEC, lo que nos lleva a preguntarnos cómo puede ser que los institutos se queden por detrás a la demanda de los usuarios, sobre todo teniendo en cuenta que es sabido que las bases de todos los censos nacionales de población de Argentina se encuentran en un servidor en el INDEC, desde el censo de 1947. ¿Por qué estas bases no están publicadas o sólo son accesibles a un minúsculo grupo de usuarios?¿Sucede lo mismo en otros países de América Latina?

A modo de cierre

Las estrategias de difusión y liberación de datos varían entre países de América Latina lo que denota la ausencia de un marco o criterio regulatorio común, así como las disimilitudes que existen en la concepción sobre los usos potenciales y resguardos requeridos con los datos. Si bien muy oportuno hoy en día, el acceso a los microdatos de censos históricos (digamos, previos al año 2000) no resulta una tarea sencilla. IPUMS-I ha facilitado enormemente esa tarea pero todavía queda mucho por hacer para que los usuarios tengan acceso a buenos datos censales. Un ejemplo de inventario de bases de datos censales y encuestas para usuarios de países subdesarrollados es el IREDA, con el tiempo desde OLAC iremos llegando a una compilación de este estilo. Eso sí, siempre que sea posible.

[1] Naciones Unidas (2010). Principios y recomendaciones para los censos de población y habitación. Revisión 2. DESA, División de Estadística. Serie M No. 67/Rev.2, pp. 249.

[2] Acrónimo de REcuperación de DATos para Áreas pequeñas por Microcomputador (REDATAM).

[3] Durante los últimos años, el uso del procesador REDATAM en línea se ha expandido hacia otras regiones del mundo, más allá de América Latina, y en otras fuentes de datos, como las encuestas de hogares y los registros vitales.

[4] La curva de aprendizaje para adquirir los conocimientos básicos para programar en REDATAM es bastante corta. Se trata de un lenguaje de programación propio y específico, que suele ser de uso menos popular que el de otros paquetes.

4 comentarios en “Modos de acceso a los datos censales en los países de América Latina

  1. Les agrego otra modalidad que ocurre en Argentina, pero no creo que sea particular de aquí, y es la difusión de las bases de datos de microdatos (REDATAM en el caso del censo) en CD-ROM entre las depedencias estatales (oficinas estadísticas provinciales, ministerios, secretarías). Al menos desde el censo de 2001, esto fue frecuente, y a la vez que INDEC no ofrecía dicha base como un producto que pudiera ser adquirido por particulares, sí la distribuía al interior del estado. Los investigadores no estaban oficiamlente incluidos en esta distribución, por lo que terminaban accediendo por relaciones personales con otras áreas del estado. Esta vía produjo muchas veces un enorme retraso en el uso de los datos, pues se terminaba accediendo a ellos de maneras muy informales e incidentales.

    Me gusta

Deja un comentario