PyEPH. Una herramienta para científicos sociales

PyEPH. Una herramienta para científicos sociales

En un mundo cada vez más interconectado, el software libre está transformando la forma en que trabajamos colectivamente, especialmente en el ámbito de las ciencias sociales. Esta es la historia detrás de PyEPH, una herramienta open source diseñada para facilitar el análisis de datos de las Encuestas Permanentes de Hogares (EPH) publicadas por el INDEC.

¿Qué es PyEPH?

PyEPH es una librería de Python que busca simplificar el procesamiento de las EPH, un insumo clave para el análisis socioeconómico en Argentina. Su principal objetivo es centralizar y automatizar cálculos relacionados con estos datos, promoviendo la transparencia metodológica mediante el uso de licencias de código abierto.

Esta herramienta está pensada para comunidades de investigadores, científicos de datos, desarrolladores, periodistas y cualquier persona interesada en explorar las estadísticas del mercado laboral, la pobreza y otros indicadores sociales. Al promover la colaboración, PyEPH se convierte en un espacio donde los cálculos y análisis se comparten y enriquecen colectivamente.

¿Cómo surgió PyEPH?

Todo comenzó con Caro, una economista apasionada por las EPH. Mientras trabajaba, notó que muchos de los cálculos que realizaba, tanto ella como sus colegas, se repetían constantemente. Esto reveló una necesidad clara de centralizar y estandarizar esos procesos.

Por casualidad, nos cruzamos con un grupo que ya había desarrollado una librería similar para R. Ellos nos conectaron con Fran Gaska, quien ya había avanzado en herramientas para descargar archivos del INDEC. Así, combinando ideas y esfuerzos, nació PyEPH.

¿Qué puede hacer PyEPH?

PyEPH incluye herramientas útiles para los análisis más comunes con las EPH:

  • Descargar datos: Obtén los microdatos, metadatos y otros insumos relevantes.
  • Cálculos de mercado laboral: Estimaciones de empleo, desempleo y actividad económica.
  • Cálculos de pobreza e indigencia: Procesos automatizados para medir estos indicadores clave.
  • Etiquetado de datos: Facilita la comprensión de las variables con nombres claros y descriptivos. Estas herramientas hacen que trabajar con las EPH sea más eficiente, reduciendo tiempos y evitando errores repetitivos.

¿Cómo se usa PyEPH?

Usar PyEPH es simple. Solo necesitas instalarla con:

pip install pyeph

Luego, puedes realizar cálculos de manera rápida con unas pocas líneas de código. Por ejemplo:

import pyeph

# Obtener datos
eph = pyeph.get(data="eph", year=2021, period=2, base_type='individual') 
basket = pyeph.get(data="canastas") 
adequi = pyeph.get(data="adulto-equivalente") 

# Cálculo de pobreza
poverty = pyeph.Poverty(eph, basket)
population_poverty = poverty.population(group_by='CH04') 
labeled_poverty = pyeph.map_labels(population_poverty)

# Cálculo de desempleo
labor_market = pyeph.LaborMarket(eph)
unemployment = labor_market.unemployment(group_by="REGION", div_by="PT")
labeled_unemployment = pyeph.map_labels(unemployment)

Este enfoque automatizado te permite concentrarte en analizar los datos, en lugar de preocuparte por su procesamiento.

¿Qué sigue para PyEPH?

Aunque hemos avanzado mucho, todavía hay un largo camino por recorrer. Queremos:

  • Incorporar más cálculos: Ampliar la capacidad de la herramienta para incluir nuevos indicadores.
  • Fortalecer la comunidad: Promover la colaboración entre investigadores y usuarios interesados.
  • Fomentar el aprendizaje: Crear tutoriales y recursos para que más personas puedan usar PyEPH fácilmente. Si eres un científico social, desarrollador o simplemente alguien curioso, te invitamos a unirte a este proyecto. Juntos podemos hacer que el análisis de datos sea más accesible, colaborativo y transparente.

Entonces...

PyEPH es más que una librería de Python. Es un ejemplo de cómo el software libre puede mejorar la experiencia colectiva, ayudando a científicos sociales y comunidades a trabajar de manera más eficiente. Si alguna vez soñaste con simplificar el análisis de las EPH, PyEPH está aquí para hacerlo realidad.

¡Prueba PyEPH y sumate a la construcción de herramientas abiertas para el futuro! 🚀