Por: Carl Coates
12 de abril de 2026¾Hace poco participé en un taller con los mejores educadores de Ciencia de datos para todos para algunos magníficos profesores de economía de Carolina del Norte. Describí la presentación como “dos grandes sabores que saben muy bien juntos”, recordando un anuncio de chocolatinas de mi juventud. Hubo tantos aspectos positivos de esta experiencia que quise ampliar este emparejamiento para nuestro boletín.
La economía es fundamentalmente una disciplina empírica – sus afirmaciones son tan sólidas como los datos que las respaldan. La ciencia de los datos es la disciplina que nos enseña a conservar y enmarcar esos datos de forma honesta y eficaz. Este binomio es natural, incluso necesario. Pero conlleva una vulnerabilidad compartida: ambos campos (economía y ciencia de datos) son sólo son tan buenos como las preguntas que hacen y la información que recogen. Fundamentalmente, las conclusiones, predicciones y respuestas dependen de una base de datos libre de falacias. Estos dos campos, estudiados conjuntamente, pueden construir el tipo de ciudadano reflexivo que ni se fía ni desprecia un número, sino más bien interroga a lo.
Datos que inducen a error
Como el profesor John List expuso este mismo mes en su microcurso E4E de la UChicago, los datos pueden ser un campo minado en el que incluso personas inteligentes y con credenciales pueden equivocarse y ser víctimas de falacias, entre ellas:
- Tercera variable de confusión: cuando un tercer factor oculto crea una falsa apariencia de relación entre dos variables.
- Sesgo de selección: cuando tu muestra no representa a tu población de interés, por lo que tus conclusiones están sesgadas.
- Ley de Goodhart: cuando una medida se convierte en un objetivo, deja de ser una medida útil.
Ser consciente de estas trampas de datos es especialmente importante porque los datos generados en la investigación académica pueden informar el desarrollo y la aplicación de las políticas. Ni siquiera la revisión por pares inmuniza contra los datos engañosos. Merece la pena repasar algunos ejemplos para recordarnos los posibles resultados negativos de los datos mal interpretados.
Robert McNamara supervisó la guerra de Vietnam como Secretario de Defensa y era, por formación, un analista de sistemas de datos. Su reto era identificar métricas, que son datos seleccionados y enmarcados con un propósito, que pudieran medir si se estaba ganando la guerra. El dominio geográfico, indicador tradicional del éxito en una guerra, era inútil en un conflicto basado en la guerrilla. McNamara se decidió por el recuento de cadáveres: muertes de soldados del ejército norvietnamita y de combatientes del Vietcong. Menos combatientes enemigos se equiparaba a progreso militar. A medida que esa cifra aumentaba, creaba la impresión de progreso. Pero McNamara había convertido en medida en un objetivoy cuando una medida se convierte en un objetivo, deja de ser una buena medida. Esta era la Ley de Goodhart operando a una escala desastrosa. La búsqueda incesante del recuento de cadáveres socavó activamente un objetivo estadounidense más difícil de medir: ganar corazones y mentes. Cada muerte, combatiente o civil, generaba desconfianza y nuevos reclutas potenciales contra las fuerzas estadounidenses. Body Count no rastreaba el éxito, sino que producía su contrario.
Un mal uso de los datos menos consecuente pero instructivo procede de las escuelas públicas. A principios de la década de 2000, los investigadores identificaron una correlación consistente: los alumnos que desayunaban obtenían mejores resultados académicos en muchos aspectos, como mejores notas, mayor concentración y mayor asistencia. El hallazgo parecía intuitivamente sólido y se repitió en varios estudios. School districts expanded breakfast programs in response, and many schools began providing breakfast on standardized testing days for todos los alumnos específicamente para mejorar los resultados.
La correlación era real. La inferencia causal no lo era. Un análisis más riguroso reveló una variable de confusiónlos alumnos que desayunaban regularmente antes de ir a la escuela tenían más probabilidades de proceder de hogares estables y con buenos recursos. La estabilidad del hogar fue el motor más fuerte de los resultados académicos positivos, no el desayuno en sí. El programa de desayunos proporcionaba auténticos beneficios como la nutrición y la rutina, pero abordaba una síntoma y no causa. Dadas las limitaciones presupuestarias con las que operan la mayoría de los distritos, cabe preguntarse si esos recursos habrían producido resultados más sólidos invertidos en programas de intervención académica. Los datos bienintencionados habían conducido a una política bienintencionada, construida sobre una cadena causal mucho más turbia de lo que sugería el estudio original.
Datos que aclaran
El progreso tecnológico, y las perturbaciones que lo acompañan, son un hecho en los sistemas de mercado. Esta realidad fue codificada por Josef Schumpeter con su observación de Destrucción creativa. El primer cambio tecnológico significativo que condujo a la revolución industrial fue la mecanización de la industria textil, desde finales de 18a hasta mediados del siglo XIXdel siglo XIX siglo. Las consecuencias de esta transición de la producción doméstica a las fábricas como lugar de trabajo son variadas y complicadas. La capacidad productiva de máquinas como la mula de hilar, la máquina de hilar y el telar mecánico prácticamente acabaron con el tejido y el hilado a mano como empleo viable a mediados del siglo XIX. th siglo.

La historia suele centrarse en la parte de destrucción de la afirmación de Schumpeter. Los luditas hicieron su aparición en el escenario de la historia al principio de la transición a una industria textil mecanizada. Los luditas ocuparon fábricas y destruyeron telares mecánicos para conservar sus puestos de trabajo. Aún no se había observado el patrón de las nuevas oportunidades de empleo en industrias aún por crear. El movimiento ludita duró poco (los historiadores sugieren 1811-1816 como su apogeo), pero la violenta consecuencia de la diezma del trabajo doméstico que provocó el movimiento sólo cuenta una parte de la historia de la mecanización textil.
Otras investigaciones ofrecen una imagen más completa. Sólo el empleo como operarios de telares mecánicos se multiplicó por 100 durante el mismo periodo del cuadro anterior. Mientras que el empleo de los tejedores manuales cayó en picado tras el pico de 1835, las fábricas textiles siguieron creciendo, sobre todo en el sector textil de la lana y el estambre, un 13% y un 20% respectivamente. Y mientras los salarios de los tejedores manuales se hundían, los de los trabajadores de las fábricas aumentaban nominalmente y en términos reales durante ese mismo periodo. Los precios de la tela cruda y de la ropa acabada disminuyeron significativamente y los precios en general bajaron un 37%. (IPC: 1800= 13.5, 1850= 8.4) Para complicar aún más el panorama, estaba el crecimiento de los centros urbanos, donde la falta de instalaciones y viviendas se comería el aumento de los salarios reales a medida que el crecimiento de la ciudad superara la capacidad de alojamiento.
Los datos dicen algo más que siempre quise que mis alumnos comprendieran: resulta que la historia es complicada. Hacer mejores preguntas a los datos y buscar más información puede producir una imagen más útil. Ciertamente, en este caso histórico, no hay duda de que los resultados del cambio tecnológico fueron variados. Implicaron a ganadores y perdedores, con individuos y gobiernos adoptando medidas de adaptación tanto a corto como a largo plazo.
Una historia más completa, aunque complicada, alimentada por datos también puede ayudarnos a considerar posibles predicciones basadas en patrones históricos, especialmente importante a medida que empezamos a ver el impacto del aumento del uso de la IA. Los datos sobre esta última de las disrupciones tecnológicas son limitados, pero podemos investigar los sectores laborales que están expuestos a la IA, al igual que los tejedores a mano de 19 th-En la Inglaterra del siglo XIX se utilizaron telares mecánicos e hilanderías. Podemos identificar qué tipos de empleo podrían ser sustituido por los LLM (Grandes Modelos Lingüísticos) y qué tipos de empleo se podrían complementados o aumentados por LLMs. Y podemos aportar algo de claridad a la ansiedad que acompaña a estas alteraciones tecnológicas.
Datos que enseñan
Los enfoques eficaces para utilizar los datos como vehículo de aprendizaje son inherentemente constructivistas. Se trata de la afirmación de que las personas no aprenden pasivamente. Lo construyen activamente a través de la experiencia, la indagación y los desafíos a sus modelos mentales existentes. (Consulta esta Lección E4E sobre Empirismo sobre la importancia de los datos y las posibles trampas de los datos.)
No aprendiste a atarte los zapatos con un manual de instrucciones; tienes que tropezar con ellos y atarte los cordones empapados hasta que aprendes. No puedes aprender a montar en bicicleta leyendo sobre el pedaleo y el equilibrio. Tienes que caerte unas cuantas veces. El aprendizaje es iterativo por naturalezay los datos ofrecen exactamente ese tipo de oportunidad constructivista en el aula. Un alumno al que se le ha dicho que correlación no es causalidad lo olvidará. Un alumno que ha cuestionado correlaciones espurias y cazado variables de confusión desarrolla una alfabetización causal duradera y transferible que les convierte en mejores pensadores en cualquier contexto.
Cuando los alumnos reciben datos que no están preestablecidos para su consumo, pueden “fijarse y preguntarse“, volviendo a él a medida que profundizan en su conocimiento del contenido para hacer nuevas observaciones y revisar sus conclusiones iniciales. Esto refleja el funcionamiento real de ambos campos: los economistas no sacan conclusiones, sino que construyen modelos, los contrastan con los datos y los revisan. Los científicos de datos no encuentran respuestas, sino que formulan preguntas, interrogan a los datos y refinan sus preguntas. Ambos campos modelan, explícitamente, el hábito de tratar tu comprensión actual como provisional.
La variable de confusión de la ciudadanía
McNamara tenía acceso a muchos datos. Los luditas tenían datos de sus propias observaciones. Los investigadores del desayuno tenían datos. Lo que faltaba, en cada caso, era el hábito de interrogarlos. El estudio del desayuno destacado anteriormente es una metáfora útil de gran parte de la vida cívica: vemos cómo se amplían programas y se inician políticas que tratan los síntomas visibles pero no abordan la causa subyacente. La desviación de la misión, la mala asignación de los recursos y las políticas reactivas e ineficaces continuarán, no por malicia, sino por analfabetismo informático. Una ciudadanía dispuesta a preguntarse “¿cuál es la variable de confusión aquí?” tiene más probabilidades de abordar las cuestiones subyacentes más difíciles de medir e incómodas. Enseñar economía y ciencia de datos juntas es, en este sentido, no sólo enriquecimiento académico. Es construir la capacidad de diagnóstico que el autogobierno realmente requiere.