Tu próximo examen tal vez lo corrija un ordenador (y tal vez no te guste el resultado)

Por @Alvy — 10 de agosto de 2013

Exam-Navy

Este artículo se publicó originalmente en Cooking Ideas, un blog de Vodafone sobre historias que «alimentan la mente de ideas».

Los ordenadores son cada vez más hábiles en el procesamiento del lenguaje natural, en las traducciones y en el análisis de textos en general. Pero, ¿pueden llegar a reemplazar a un profesional en el análisis de lo verdaderamente relevante detrás de un texto? ¿A un profesor tal vez? Algunas empresas creen que sí y están trabajando desde hace tiempo en ello con un propósito: utilizarlos como sistema automatizado para puntuar exámenes académicos.

En un artículo publicado recientemente por el New York Times se habla de cómo empresas como edX, Coursera, Udacity y otras plantean la situación de diversas maneras. Esto es algunos aspectos un salto cuantitativo respecto a la situación hasta hace poco tiempo, donde el único papel que podía jugar un ordenador en una evaluación era la comprobación rutinaria de un examen de tipo test (ABCD). Las máquinas como evaluadores han ido abriéndose camino poco a poco comenzando por análisis muy simples hasta llegar a la situación actual, mucho más compleja.

Las técnicas de evaluación más avanzadas consisten en utilizar el aprendizaje automático para generar una evaluación automática e instantánea de los exámenes, algo fundamentalmente diferente de lo que suele suceder con los profesores humanos, que necesitan cierto tiempo para leer y valorar cada trabajo. Aunque sistemas de este tipo se llevan utilizando algún tiempo hasta ahora no disponían de esta capacidad de forma efectiva y masiva.

Detrás de empresas como edX están entidades tan prestigiosas del mundo de la educación como Harvard y el M.I.T. Pero mientras que hay un sector que se muestra emocionado respecto a estos avances –como el futurista Ray Kurzweil– otros consideran que hay muchos errores de planteamiento. Según uno de estos críticos, los sistemas propuestos no leen los textos «comprendiéndolos» sino simplemente recopilando estadísticas sobre las palabras y frases; dice que premian a la gente con gran vocabulario, pero que castigan la creatividad. Y que el hecho de que requieran que previamente un humano evalúe unos cien exámenes de forma normal los hace poco prácticos.

Entre un bando y otro hay quien adopta un punto intermedio, admitiendo que aunque es una tecnología a la que le falta un hervor puede tener ciertas aplicaciones en el futuro.

Otros planteamientos relacionados con esta evaluación automática incluyen convertir el aprendizaje en un juego, casi literalmente: en este ejercicio de ludificación extrema mediante la evaluación instantánea de los trabajos, los jugadores (perdón, los estudiantes) recibirían puntos como harían los Sims o los avatares de cualquier videojuego masivo multijugador. Con cada interacción cabe suponer que procurarían mejorar algunos aspectos de sus respuestas para conseguir una puntuación mayor. El resultado (supuestamente) evolucionaría hacia mejores respuestas a las preguntas originalmente planteadas, así como el aprendizaje de las técnicas para entender mejor las preguntas y formular mejor las respuestas.

La situación se está volviendo tan enrarecida que algunos profesionales de la enseñanza han iniciado una petición popular para solicitar que se deje de utilizar software de evaluación automático de este tipo alegando que su funcionamiento es «trivial, reductivo, impreciso, injusto, carente de capacidad de diagnóstico y secretista». Su máxima: que no se puede confiar en las máquinas para una labor de este tipo de la que dependen las vidas y el futuro de estudiantes, profesionales e instituciones.

Esta situación que parece un tanto polarizada recuerda a muchas similares: aquellas en las que se decía que los ordenadores nunca podrían jugar bien al ajedrez –por no comprender su esencia– realizar una traducción perfecta –cosa que no hacen, pero ciertamente ayudan mucho– o entender el lenguaje natural –que aprieten el botón del móvil y le pregunten a Siri qué opina del tema–. Por suerte no habrán de pasar demasiados años para que veamos hacia qué lado se decantan estos avances: si acabamos siendo evaluados por las máquinas o si ese será un trabajo genuinamente humano en el que no nos podrán reemplazar.

{Foto: Advancement Exam (CC) Official U.S. Navy Imagery @ Flickr}