«Yoda al estilo de los jeroglíficos egipcios.»
DALL·E mini está en Hugging Face, una comunidad dedicada a la inteligencia artificial, y ya se puede probar, aunque sea a pequeña escala. Es una especie de versión desnatada de pruebas de Dall•E 2, la IA de OpenAI que genera imágenes artísticas a partir de textos.
La principal diferencia es que sólo genera imágenes de baja calidad, en todos los sentidos: de tamaño reducido, rasgos borrosos e indefinidos y poco precisos en general. Y es lento, muy lento: necesita dos o tres minutos para generar los resultados una vez pulsas «Run»… Todo esto si tienes suerte y hay «atasco» en el servicio y te permite usarlo. Pero sirve para hacerse una idea de la potencia de DALL·E 2.
Esta versión mini es divertida y sobre todo sirve ver qué tipo de cosas se pueden hacer y cómo entiende el modelo el lenguaje natural. Probablemente en el futuro será normal usar estas versiones «mini» para las pruebas rápidas y luego alimentar las descripciones más refinadas en la versión completa de Dall•E 2 para obtener imágenes más fotorrealistas.
«Un modelo de IA que genera imágenes a partir de los textos que se le introducen.»
Otra de las curiosidades es que el texto de aviso ya advierte de que los resultados pueden «reforzar o exacerbar los sesgos sociales», principalmente porque el modelo está entrenado con datos sin filtrar de Internet y allí estamos todos con todos nuestros defectos y no sólo con nuestras virtudes.
La gente de momento está usando DALL·E mini para echarse unas risas con frases como Cthulhu en Barrio Sésamo, «R2-D2 siendo bautizado» o «Leticia Sabater dibujada por H.R. Giger. Con lo creativa que es la gente más la habilidad de estas IAs otra cosa no sé, pero reírnos nos vamos a reír un rato.
Relacionado:
- Un ingeniero de Google monta un lío que acaba en despido por sugerir que una de las IAs de su laboratorio es consciente y tiene alma
- Dall•E 2, la inteligencia artificial de OpenAI, nos regala nuevas perspectivas de las obras de M.C. Escher (y misterios sobre Velázquez)
- La curiosa historia sobre cómo un simple plátano acabó siendo la respuesta perfecta a un Test de Turing
- Copilot de GitHub, un ayudante entrenado mediante IA para completar y escribir código de programación
- DALL·E es una inteligencia artificial que crea imágenes a partir de descripciones en lenguaje natural
- «Crear un chatbot que conversa como una persona específica», una patente solicitada por Microsoft
- Enigma GPT-2: ¿Puedes distinguir un artículo real de otro falso generado mediante inteligencia artificial simplemente leyendo el resumen?