Por @Alvy — 13 de enero de 2022

WordleDesde que descubrimos que Wordle era tanto un sano entretenimiento diario como un auténtico vicio no hemos parado de darle vueltas a las mejores estrategias para adivinar las palabras del juego. La versión original en inglés creada por Josh Wardle –quien no la registró/patentó, simplemente lo escribió para su pareja, a quien le encantaban los juegos de palabras– ha dado lugar a interminables copias y derivados, notablemente a la versión en castellano de Wordle de Daniel Rodríguez, a las versiones en gallego y catalán y muchas otras. Aquí van algunas disquisiciones sobre datos y estrategias que he recibido y también curioseado por ahí.

Diccionarios y letras

El número de palabras de cinco letras en inglés no es una ciencia exacta. Se podrían considerar las 9.000 que recoge el diccionario oficial del Scrabble, aunque otras fuentes dan sólo 5.350 o incluso muchas más como 12.750. En Wordle yo diría que el diccionario que se usa es tirando a más bien flexible, plurales, formas verbales y puede que algún que otro nombre/marca, así que diría que de 10.000 hacia arriba. El valor en castellano es similar, con alguna lista que ofrece 10.800 palabras, desde ABABA a ZUZÓN. Según ha contado al The New York Times su creador, la lista tiene 2.500 palabras elegidas de una lista de unas 12.900. [Todas esas palabras están en el código javascript de Wordle en abierto.]

Si se analizan las letras que componen todas esas palabras de cinco letras resulta que las frecuencias con que aparecen en español están encabezadas por E, A, O, S, R, N, I, D, L, C, T, U, M, P, B, G… En inglés son E, T, A, O, I, N, S, H, R, D, L, C, U, M, W… [Nota: el dato puede variar un poco dependiendo de qué palabras se consideran válidas o no, pero los resultados no cambian demasiado.] ¿Por qué es importante conocer las letras que más se usan en cada idioma?

Estrategias y tácticas

Es lógico pensar que empezar por una palabra con muchas vocales o con las letras más frecuentes proporciona cierta ventaja. Con E, A, O, S, R (las cinco primeras) se puede formar OREAS que es válida. Pero también se puede elegir una palabra con el máximo número de vocales. Javier, por ejemplo, procesó un amplio diccionario con palabras de cinco letras para analizar las frecuencias y calcular cuál sería la mejor palabra inicial: aquella que contuviera más vocales y las letras más comunes en una palabra válida. Los resultados fueron AIREO en español y AEROS en inglés.

A partir de la palabra inicial la estrategia básica suele ser mantener siempre las letras verdes (letra en la posición correcta) moviendo las amarillas (letra en posición incorrecta) e ignorando y dejando de usar las grises (letra incorrecta). Pero, ojo: esto podría no ser óptimo. Imaginemos que hay tres letras verdes y dos grises: al repetir las tres letras verdes sólo estamos probando dos nuevas letras en cada turno; si se probaran cinco nuevas letras quizá alguna de las que sabemos que no van en las posiciones conocidas podría aportar algo más de información. Aquí se sacrifica un turno donde sabemos que habrá fallos a cambio de obtener más información.

Un dato importante es que el juego admite palabras que tengan letras repetidas, algo que suele despistar. Sin embargo, las palabras que han ido apareciendo durante estas semanas suelen ser palabras comunes y sin mayores complicaciones, algo que también hay que tener en cuenta… Aunque precisamente la de hoy en inglés era tirando a complicadilla por sus características.

En El País se hablaba de una estrategia de un investigador para ganar el 99% de las veces (€), refiriéndose a las ideas de Esteban Moro, que menciona su algoritmo, que varía entre 97% (comenzando con AEROS) y 99% (con ORATE). A mi me parece un número un tanto exagerado. ¿Por qué? En realidad todos estos cálculos de palabras, frecuencias y estrategias dependen un poco –o bastante– de la forma en que se haya elegido la palabra secreta. Y hasta donde yo sé no es algo que se haga puramente al azar (tomando una palabra de las 10.000 posibles de un diccionario), de modo que el creador del juego podría contrarrestar diversas estrategias si éstas no son suficientemente flexibles. La primera, no utilizar demasiadas vocales (o repetirlas) y en inglés jugar con la Y que reemplaza fonéticamente a la I.

[Actualización: de hecho en el artículo de Moro se habla de cómo la elección de una entra 12.900 palabras del juego original no es aleatoria sino según una distribución distinta, y que hace falta esperar a ver más «palabras secretas» para entender mejor cómo funciona. También dice que incluso se podría mejorar el método de frecuencias puras utilizando otros patrones comunes de pares de palabras. Según otro analista, Matthew Kay, la distribución de las palabras secretas parece «una cuidada elección entre palabras normales y “raras”, algo interesante para que sea un buen juego: ni siempre palabras fáciles ni muy difíciles».]

Otros jugadores proponen una estrategia mixta: intentar maximizar el número de letras acertadas y bien puestas hasta el cuarto turno y probar en el quinto (y penúltimo) algo diferente con todas las letras posibles que no se hayan usado hasta entonces. De ahí puede surgir la clave para extraer más información y acertar en el sexto y último turno. Aquí una lista de las palabras que han ido saliendo en inglés durante 2022 (¡Ojo spoiler! Puede estar la de hoy.)

Un lingüista británico propone también utilizar estrategias como la fonotáctica y considerar más estrictamente las restricciones fonéticas (qué fonemas y letras suelen o pueden ir delante o detrás de otras) para evitar sesgos que mantenemos al escuchar y hablar pero de los que no somos muy conscientes, como que en inglés TR y PR son muy habituales, pero DW y DZ más bien inusuales.

Wordle-bot

Uno de los datos más interesantes que encontré fue esta gráfica sobre un Wordle-bot que alguien programó para jugar al Wordle en inglés y anotar cuántos intentos fueron necesarios para completar el juego a lo largo de 2.500 partidas. Lo normal son 4 o incluso 3, a veces cinco. El algoritmo acierta el 97,6% de las veces en 6 o menos intentos; siempre empieza por la palabra CORES. La palabra DOZES fue la que requirió 9 intentos, porque el algoritmo llegó rápidamente a DO?ES pero luego falló con DOTES, DOLES, DOMES, DOGES y DOVES que también son válidas. Otro usuario probó con 2.800 palabras y otro algoritmo y acertó el 99,7%. Entre las que falló: FAKED, JAMES, CAVES, FOXED, ZEALS y WAXED.

Tampoco hay que olvidar que esto es un entretenimiento, y que jugar empezando siempre por las mismas palabras puede ser aburrido. ¿Es mejor divertirse o comportarse como un algoritmo perfectamente optimizado? ¡A veces en la variación está el gusto!

Todos estos artículos contienen información interesante sobre Wordle:

Actualización – Esteban Moro vio nuestra anotación y nos recuerda que «la estrategia que propongo no se basa principalmente en la elección de la primera palabra, sino de utilizar el sesgo de las palabras objetivo que existe en el juego.» Tal vez yo me expresé mal al afirmar que me parecía un poco «exagerado» lo de «ganar el 99% de las veces» porque me quería referir más al titular de El País que al algoritmo en sí. En su trabajo está bien explicado que puede llegarse al 97% o el 99% y que depende más de otros factores que de la palabra inicial – donde un poco cada maestrillo tiene su librillo.

Más madera, trucos y técnicas:

Actualización (24 de enero de 2022) – Ya han inventado el Wordle Multilingüe, con palabras de 5, 6 ó 7 letras en varios idiomas. Y más:

Actualización (9 de febrero de 2022) – Siguen surgiendo nuevas esrategías:

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar