Recuperación de microdatos de los censos argentinos de población 1869 – 1895

Diego QuartulliInstituto de Investigaciones Gino Germani, Facultad de Ciencias Sociales, Universidad de Buenos Aires

Se supone que los censos desde su origen tienen una función administrativa y de planificación para los Estados. De forma derivada, los datos de aquellos son importantes para historiadores y demás investigadores de la ciencia social.  En ese sentido, pueden considerarse como una ventana al pasado, que sirve tanto para realizar mejores descripciones de esas sociedades como mejores testeos a las teorías contemporáneas. Después de todo, un desiderátum de las teorías científicas es albergar algún grado de generalidad y esto implica que, en algunos casos, ellas mismas deberían funcionar tanto para sociedades modernas como pasadas.

Con este trasfondo, este post intenta difundir el proceso de realización y posterior digitalización de dos muestras de los primeros censos de población de la Argentina, levantados en 1869 y 1895.

Ambas muestras, selecciones aleatorias de los respectivos universos de cédulas censales del Archivo General de la Nación, fueron ejecutadas bajo la dirección de Gino Germani, Jorge Somoza y Alfredo Lattes en 1967.

La idea de la realización de las muestras sobre las cédulas censales de un censo antiguo fue toda una innovación mundial. Lo interesante para la temática de OLAC es que toda esta rica información estuvo a punto de perderse antes de realizarse el trabajo que aquí se comenta. El peligro de la extinción de los datos siempre estuvo presente ya que los formatos y los soportes de los datos tuvieron que ir actualizándose al tiempo que emergían, difundían y sucumbían nuevas tecnologías y sus respectivos formatos.

El primer soporte fueron las originales tarjetas perforadas como las de las foto, que para su traslado requerían el alquiler de un camión y para su uso el alquiler de alguno de los escasos mainframe del país por esa época (generalmente en horario nocturno). Luego le siguieron las cintas perforadas, los diskettes de 3,5 pulgadas y posteriormente los discos rígidos.

Problema

El problema de las bases anteriores se debió a la interacción de dos factores. El rápido cambio tecnológico y la escasa difusión de los datos. De haberse mitigado alguno de estos factores, el factor restante casi con seguridad no hubiera ofrecido mayores problemas. Si hubiera habido una mayor difusión, es plausible que alguien hubiera llegado a esta solución con anterioridad. Si hubiera habido un menor cambio tecnológico, el proceso de difusión hubiera sido más acumulativo y no cortado por cada nueva tecnología con su respectivo soporte y posterior obsolescencia tecnológica.

Solución

La estrategia de la solución se abordó de dos maneras complementarias. Codificar los datos en un código lo más universal posible y convertir los datos en dos formatos antagónicos pero que en conjunto minimicen los problemas de compatibilidad y maximicen las ventajas de la difusión.

Como primera acción se realizó la codificación de los datos bajo el código UNICODE con la premisa que este es uno de los más compatibles y universales. Luego, bajo ese código, los datos se ofrecen en dos archivos. Uno de texto plano a tono con el primer objetivo y otro en formato .SAV (SPSS) a tono con el segundo objetivo. Como última acción se facilitó un acceso abierto, a través de una página web, a la descarga de esos archivos junto con información complementaria que facilite el uso de los mismos.

Resultado

Luego de algunos chequeos, se elaboraron sintaxis que replican antiguas publicaciones basadas en los datos de la muestra para validar que los datos no habrían sufrido mutaciones. Luego, gracias a la inestimable ayuda de Alfredo Lattes, quien casi hace 50 años atrás comenzaba con el trabajo de las muestras su carrera de investigador de la mano de Germani y Somoza, se pudo localizar los manuales de código originales que permitieron la creación de más variables en comparación a las que se encontraban en base original de 1967.  Posteriormente también se realizó un ponderador.

Link a la página: http://censos1869-1895.sociales.uba.ar

Para más información acerca de la historia de las muestras ver acá.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s