En este artículo Frids Gonzales analiza cómo la inteligencia artificial en educación obliga a rediseñar la evaluación auténtica y formativa, recuperando la metacognición, la oralidad argumentativa y la integridad académica como pilares de una evaluación pedagógicamente justa.
Desde nuestra tribuna educativa, si definimos la evaluación, podríamos decir que es un proceso sistemático de recolección y análisis de información para medir el desempeño, valor o mérito de algo o alguien respecto a criterios establecidos y que sirve para tomar decisiones informadas, identificar áreas de mejora y comprobar el cumplimiento de objetivos en ámbitos educativos, laborales o productivos.
Sin embargo, la expansión de la inteligencia artificial generativa ha puesto en evidencia que, en demasiados casos, lo que realmente evaluábamos era la capacidad de entregar un texto final plausible, no necesariamente la comprensión profunda que lo hacía posible.
El post que inspiró este artículo (Gustavo Coronel Linkedin 2026) resume esa incomodidad con precisión: ya no basta con vigilar el producto final, porque el proceso de producción del conocimiento ha cambiado de forma radical. La pregunta importante no es cómo “detener” la IA, sino qué tipo de aprendizaje queremos reconocer y valorar en su presencia.
La discusión actual en la praxis docente entre los que usamos estas herramientas y los que no, suele quedar atrapada entre dos extremos. En uno, se sataniza la IA como si fuera una amenaza moral que corrompe todo trabajo estudiantil. En el otro, se celebra ingenuamente como una solución tecnológica que resolverá problemas de enseñanza, retroalimentación y personalización.
Ambas posiciones son insuficientes. La primera ignora que la educación siempre ha incorporado mediaciones técnicas, desde la calculadora hasta el buscador. La segunda olvida que toda herramienta incorpora sesgos, desigualdades y nuevos riesgos éticos. Por ello, considero que el verdadero desafío no es escoger entre prohibición o entusiasmo, sino rediseñar la evaluación para que siga siendo intelectualmente valiosa y pedagógicamente justa.
La tesis de este artículo es simple: la IA no está destruyendo la evaluación; está obligando a abandonar la evaluación débil, rutinaria y fácilmente externalizable. Esa evaluación, centrada casi exclusivamente en productos escritos descontextualizados, era vulnerable incluso antes de la IA, aunque ahora su fragilidad se vea con más claridad.
Las instituciones que respondan solo con detectores o castigos estarán tratando el síntoma, no la causa. La causa es que seguimos usando instrumentos pensados para otro ecosistema cognitivo, comunicativo y tecnológico.
Un cambio de época
La inteligencia artificial generativa ha convertido la producción textual en una operación de baja fricción. Redactar, resumir, corregir, traducir, estructurar y simular argumentos es cada vez más accesible. Esto no elimina el aprendizaje, pero sí cambia la relación entre esfuerzo visible y comprensión real.
Cuando una herramienta puede producir con rapidez un texto razonable, la docencia ya no puede asumir que la mera extensión, corrección formal o apariencia académica equivalen a pensamiento. La evaluación basada solo en el artefacto final deja de ser suficiente porque el artefacto puede haber sido co-producido por sistemas automáticos de formas difíciles de distinguir.
UNESCO (2025) ha señalado que la IA obliga a reexaminar nuestras prioridades evaluativas, desplazando el énfasis desde la memoria rutinaria hacia tareas más complejas, dialogadas y auténticas.
En la misma dirección, la literatura sobre integridad académica advierte que la respuesta institucional no puede limitarse a “detectar” uso de IA, porque las herramientas de detección son imperfectas y suelen generar nuevas injusticias. Si el examen consiste en repetir información, organizar un texto previsible o ensamblar respuestas convencionales, la tecnología actual no solo ayuda: también expone la pobreza de la tarea.
Por eso, el problema no es que los estudiantes usen IA. El problema es que muchas evaluaciones siguen premiando exactamente aquello que la IA hace mejor: síntesis rápida, redacción fluida, reformulación de ideas y armado de respuestas genéricas.
Si el diseño evaluativo se apoya en habilidades fácilmente automatizables, la institución termina evaluando una competencia que ya no distingue con claridad entre autoría humana y asistencia algorítmica.
Escucha también nuestro podcast: Cuando la máquina escribe, el problema no es el estudiante: es la evaluación. Te invitamos a disfrutar de este episodio especial donde exploramos las ideas principales de este tema con el apoyo de un archivo de audio que puedes escuchar en cualquier momento.


Del producto al proceso
Una de las propuestas más sólidas frente a este escenario es recuperar el proceso como objeto explícito de evaluación. Black y Wiliam (2009) demostraron hace décadas que la evaluación formativa mejora el aprendizaje cuando se usa para retroalimentar, ajustar y orientar el trabajo del estudiante, no solo para calificarlo al final. Ese principio hoy adquiere una nueva urgencia.
Si el producto final puede ser asistido por IA, entonces importa más observar cómo el estudiante planifica, argumenta, revisa, corrige, justifica y toma decisiones durante el trayecto.
Evaluar el proceso no significa burocratizar la enseñanza con más papeles o controles innecesarios. Significa diseñar evidencias intermedias: esquemas, mapas conceptuales, versiones preliminares, bitácoras, registros de lectura, autoevaluaciones y reflexiones de progreso.
Significa también pedir explicaciones sobre elecciones metodológicas y conceptuales. En otras palabras, el aprendizaje debe volverse visible en su desarrollo, no solo en su resultado. La imagen analizada apunta justamente a eso: más proceso, más reflexión, más evidencias.
Aquí conviene recordar a Wiggins (1990), quien defendió la evaluación auténtica como aquella que examina directamente el desempeño del estudiante en tareas intelectuales valiosas, no mediante aproximaciones artificiales o pruebas descontextualizadas.
Su idea es hoy más pertinente que nunca. Una evaluación auténtica no pregunta únicamente “¿qué escribió?”, sino “¿qué sabe hacer con eso que escribió?, ¿puede defenderlo?, ¿puede transferirlo?, ¿puede revisarlo críticamente?”. Esa diferencia es decisiva en tiempos de IA.
La oralidad debe volver
Uno de los efectos más interesantes del auge de la IA es el retorno de la oralidad como forma seria de evaluación. No se trata de regresar románticamente a una educación de principios del siglo pasado, sino de reconocer que la conversación, la defensa oral y el intercambio cara a cara permiten observar comprensión, flexibilidad argumentativa y capacidad de respuesta en tiempo real.
Cuando el estudiante debe explicar por qué eligió una hipótesis, cómo organizó un argumento o qué límites encontró en su trabajo, emergen huellas de aprendizaje mucho más difíciles de simular con un texto estándar.
La evidencia reciente y los informes de UNESCO coinciden en que las defensas orales, los seminarios socráticos y las conversaciones evaluativas pueden ser mecanismos valiosos para verificar comprensión profunda. Incluso en estudios recientes sobre el uso de IA en evaluación, la tendencia apunta a combinar enfoques híbridos, donde el estudiante produce con apoyo tecnológico pero luego debe justificar, discutir o defender lo producido.
Eso no elimina la IA; la integra en una arquitectura pedagógica más exigente. La oralidad también tiene un valor formativo. Obliga al estudiante a pasar del texto como objeto terminado al pensamiento como actividad viva. Esa transición es importante porque, en el fondo, aprender no consiste solo en redactar bien, sino en poder sostener una idea, revisarla y someterla a crítica. Un examen oral bien diseñado no es una traba para la modernidad; es una respuesta inteligente a la automatización de la escritura rutinaria.
Reflexión y metacognición
Otra lección que debemos tomar en cuenta es la centralidad de la reflexión. Si el estudiante puede usar IA para producir una respuesta, la docencia necesita recuperar preguntas metacognitivas: ¿por qué elegiste esa estrategia?, ¿qué descartaste?, ¿qué aprendiste del error?, ¿cómo cambió tu comprensión después de revisar fuentes o recibir retroalimentación? La reflexión no es un añadido decorativo; es una forma de evidenciar agencia intelectual.
La literatura sobre IA y aprendizaje insiste en que la alfabetización en IA debe incluir criterio, ética y juicio, no solo habilidad instrumental. Un estudiante que usa IA sin reflexión puede terminar delegando su pensamiento; uno que la usa críticamente puede fortalecer su comprensión, siempre que la evaluación obligue a explicitar decisiones y límites.
Por eso, pedir diarios de aprendizaje, comentarios autorreflexivos o informes de uso de herramientas no es una pérdida de tiempo: es una forma de volver visible la construcción del conocimiento.
Además, la reflexión mejora la equidad. No todos los estudiantes llegan a la misma velocidad de apropiación de herramientas digitales, y no todos tienen acceso a iguales condiciones de apoyo. Si una institución asume que la IA resolverá por sí sola las brechas, corre el riesgo de ampliar desigualdades.
La UNESCO (2025) insiste en que la integración de IA debe ser humanocentrada, inclusiva y atenta a la justicia educativa. Una evaluación reflexiva permite valorar no solo el rendimiento, sino también la conciencia que el estudiante desarrolla sobre su propio aprendizaje.
Evidencias, evidencias y más evidencias
La evaluación tradicional suele concentrarse en una entrega final. Eso era ya problemático antes de la IA, porque convertía un proceso complejo en una instantánea tardía. Hoy esa limitación se vuelve más seria. La solución ya conocida, no es aumentar la desconfianza, sino multiplicar las evidencias: borradores, entregables parciales, sustentaciones breves, bitácoras, registros de revisión y productos escalonados. Así, el docente puede observar evolución, consistencia y capacidad de revisión.
Este enfoque coincide con la recomendación de pasar de una lógica de control a una lógica de diseño. En lugar de preguntar “¿cómo descubro si usó IA?”, conviene preguntar “¿qué secuencia de tareas hace imposible evaluar solo con un único producto final?”.
La respuesta lleva a modelos más robustos: proyectos por etapas, tareas contextualizadas, resolución de problemas situados y productos que requieran transferencia a situaciones nuevas. De ese modo, la IA puede usarse como apoyo sin volver inútil la evaluación.
Las evidencias también protegen al estudiante honesto. Un sistema que valora el desarrollo reduce el incentivo de entregar un texto ajeno o de ocultar ayudas tecnológicas. Además, permite una retroalimentación más oportuna y específica.
En lugar de corregir al final, el docente acompaña el aprendizaje mientras ocurre. Esa es, precisamente, la lógica de la evaluación formativa que Black y Wiliam (1998) defendieron: usar la información de la evaluación para mejorar el aprendizaje antes de que sea demasiado tarde.
Los riesgos reales
Defender una evaluación más auténtica no significa idealizarla. Evaluar procesos, orales y evidencias intermedias también tiene desafíos: más tiempo, más criterios, mayor necesidad de calibración docente y riesgo de subjetividad si no se establecen rúbricas claras.
Además, no todas las instituciones cuentan con condiciones para implementar este cambio de inmediato. La transición requiere formación docente, coordinación curricular y acuerdos sobre integridad académica y uso responsable de IA. Tampoco conviene caer en la ilusión de que todo lo oral o procesual es automáticamente mejor.
Una mala defensa oral puede ser superficial; un portafolio puede convertirse en acumulación de documentos sin sentido; una autoevaluación puede ser formalista. Por eso, el problema no es el formato en sí, sino la calidad del diseño. La evaluación auténtica exige criterios claros, tareas relevantes y acompañamiento pedagógico. Sin eso, solo cambia la apariencia de la evaluación, no su fondo.
También debemos reconocer que la IA abre posibilidades legítimas de apoyo al aprendizaje. Hay evidencia de que, en contextos bien orientados, los estudiantes usan estas herramientas para desarrollar mayor conciencia crítica y mejorar su proceso de trabajo.
Eso obliga a abandonar la narrativa simplista de “usar IA = hacer trampa”. El asunto real es cómo se usa, con qué propósito, bajo qué reglas y con qué nivel de transparencia. La evaluación del siglo XXI debe distinguir entre asistencia, dependencia, colaboración y suplantación.
Una agenda necesaria
La pregunta central ya no es si la IA debe entrar o no en la escuela y la universidad. Ya está dentro. La pregunta es si la institución educativa será capaz de responder con inteligencia pedagógica o si se limitará a una vigilancia cada vez menos eficaz.
La ruta más prometedora parece clara: más procesos visibles, más oralidad argumentativa, más reflexión metacognitiva y más evidencias intermedias. Eso implica revisar sílabos, rúbricas y secuencias didácticas. También implica formar a los docentes en alfabetización en IA, no para convertirlos en técnicos, sino para que puedan tomar decisiones evaluativas informadas.
La política institucional debe favorecer criterios comunes: cuándo la IA se permite, cómo se declara su uso, qué tipos de tareas exigen producción humana directa y cómo se protege la integridad sin criminalizar la innovación. Sin un marco claro, la evaluación seguirá siendo un terreno de sospecha y arbitrariedad.
Hay una oportunidad histórica aquí. La IA puede empujar a la educación a abandonar prácticas agotadas y a recuperar el sentido profundo de evaluar: comprender lo que el estudiante sabe hacer, piensa, argumenta y transforma. En ese sentido, la tecnología no destruye la evaluación; destruye la comodidad de una evaluación pobre. Y eso, aunque incomode, puede ser una buena noticia.
Este artículo fue publicado originalmente en la revista Pie de Página de la Universidad de Lima – N° 18 – Abril 2026. Se reproduce con autorización del autor. Puede ver la versión original aquí:
Referencias
Desai, H. (2025). ¿Qué vale la pena medir? El futuro de la evaluación en la era de la IA. UNESCO. https://www.unesco.org/es/articles/que-vale-la-pena-medir-el-futuro-de-la-evaluacion-en-la-era-de-la-ia
UNESCO. (2025). Artificial intelligence in education. UNESCO. https://www.unesco.org/en/digital-education/artificial-intelligence
UNESCO. (2025). Guidance for the classroom‑based assessment of multilingual learners: Assessing languages, literacies and learning across the curriculum. UNESCO. https://www.unesco.org/en/articles/guidance-classroom-based-assessment-multilingual-learners-assessing-languages-literacies-and
UNESCO. (2025). Assessment for improved learning outcomes. UNESCO. https://www.unesco.org/en/learning-assessments
Black, P., & Wiliam, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation and Accountability, 21(1), 5–31.
https://www.researchgate.net/publication/225590759_Developing_the_theory_of_formative_assessment
Wiggins, G. (1990). The case for authentic assessment (ERIC Digest, ED328611). Practical Assessment, Research & Evaluation. https://eric.ed.gov/?id=ED328611
Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. http://edci770.pbworks.com/w/file/fetch/48124468/BlackWiliam_1998.pdf
Coronel, G. (2026). Profes, hay una nueva trampa con IA y no te lo van a decir [Publicación en LinkedIn]. LinkedIn. https://www.linkedin.com/posts/gustavocoronel_profes-hay-una-nueva-trampa-con-ia-y-no-activity-7444360593953808385-fxdd
