Economía y Ciencia de Datos: Reproducibilidad y Repetibilidad

Apr 12, 2019 · 2 min read
Image credit: BEST
Abstract
La conferencia explora la intersección entre Economía y Ciencia de Datos, centrándose en la “crisis de replicabilidad” que afecta a la investigación económica. Se argumenta que, mediante el uso de herramientas de software libre como R y RMarkdown, los economistas pueden adoptar un flujo de trabajo que garantice la transparencia y reproducibilidad de sus resultados, fortaleciendo así la integridad de la ciencia.
Event
Location

Universidad ESAN - Facultad de Economía

Lima,

Recuerda que puedes descargar los Slides en el botón!

Conferencia: Economía y Ciencia de Datos: Reproducibilidad y Repetibilidad

En esta conferencia, se exploró la intersección fundamental entre la Economía y la emergente disciplina de la Ciencia de Datos, con un enfoque especial en los desafíos de la reproducibilidad y la repetibilidad en la investigación académica.

El Problema: La Crisis de Replicabilidad en Economía

La presentación abordó la creciente “crisis de replicabilidad” que enfrenta la economía, donde muchos estudios publicados en importantes revistas científicas no logran ser replicados por otros investigadores, lo que pone en duda la validez de sus conclusiones. Se citaron ejemplos concretos para ilustrar la magnitud del problema:

  • Un análisis de los economistas Andrew Chang y Phillip Li intentó reproducir 65 papers de economía y solo tuvo éxito en el 49% de los casos.
  • Se recordó el conocido caso del influyente paper de Reinhart y Rogoff (2013), cuyos resultados sobre deuda y crecimiento contenían errores y manipulaciones en la base de datos que usaron.
  • También se mencionó el problema del “p-hacking” como una práctica que busca forzar resultados estadísticamente significativos sin rigor científico, afectando la integridad de la investigación.

La Solución: Ciencia de Datos y Herramientas de Código Abierto

Como solución, la charla propuso la adopción de las metodologías y herramientas de la Ciencia de Datos. Se definió esta disciplina como la combinación de tres áreas clave, según el diagrama de Drew Conway:

  1. Habilidades de Programación (Hacking Skills)
  2. Conocimiento en Matemáticas y Estadística
  3. Experiencia en el Dominio de Aplicación (en este caso, la economía)

Se destacó que, en la práctica, gran parte del trabajo de un científico de datos (hasta un 60%) consiste en la limpieza y organización de la información.

La propuesta central fue el uso del ecosistema de R y RMarkdown como una solución práctica para crear investigación 100% reproducible, al permitir integrar el código, los datos y el texto en un único documento dinámico.

Beneficios para el Economista Moderno

Finalmente, se mostraron los beneficios prácticos de adoptar estas nuevas formas de trabajo, que permiten a los economistas:

  • Crear libros, artículos y tesis de formato moderno y totalmente abiertos.
  • Generar gráficos dinámicos y aplicaciones web interactivas para comunicar resultados de forma más efectiva.
  • Fomentar una cultura de ciencia abierta y transparente, reforzando la credibilidad de sus investigaciones.

En resumen, la conferencia fue un llamado a los economistas para adoptar prácticas de ciencia de datos que no solo modernizan sus herramientas, sino que también refuerzan la integridad y el rigor de la ciencia económica.

Arturo Chian
Authors
Economist, Data Scientist & Educator