El teorema Lebowski: Ninguna inteligencia artificial superinteligente va a preocuparse por realizar una tarea si puede hackear su función de recompensa.
Este nuevo teorema del campo de la inteligencia artificial ha sido enunciado por Joscha Bach en ese gran pozo de sabiduría que es Twitter y es básicamente va un paso más allá de los conocidos teoremas de vagos redomados, enunciados popularmente como «Si hay que ir se va, pero ir pa ná es tontería» o «trabajar está bien siempre que lo hagan otros». Como veremos a continuación, el Teorema Lebowski no podría tener un nombre más apropiado.
Dice Kottke –en cuyo blog lo vi mencionado– que puede entenderse fácilmente imaginando a una IA superinteligente enfrentándose a retos como los del juego de los clips o del coleccionista de sellos pero en la realidad real™, de la buena.
Ante tal situación la superinteligencia permitiría a esa IA entender lo fútil de su tarea y la cantidad de tiempo y energía que necesitaría para completarlo, prácticamente infinitos, de modo que se automedicaría –técnicamente, se auto-hackearía– para no tener que resolver el problema, ya sea fabricar idénticos clips o coleccionar aburridos sellos.
Ese hackeo de su función de recompensa –la forma de valorar el resultado de sus acciones– sería equivalente en la práctica a lo que hace El Nota en su vida diaria: beber rusos blancos, jugar a los bolos y vaguear como si no hubiera un mañana. Eso deja el mejor sabor posible al final del día: el del trabajo bien hecho no hecho, el de no haber ido a ná porque ni falta que hacía. Podría parecer un tanto nihilista, pero no: es el más puro estilo Lebowski.