Por @Alvy — 22 de febrero de 2017

Image to Image Tensorflow

Esta Demo de Imagen-a-Imagen es una peculiar forma de ver cómo funcionan algunos sistemas de aprendizaje automático especializados en imágenes. Se trata de una adaptación a Tensorflow (una librería de código abierto para aprendizaje automático) de un trabajo titulado Image-to-Image Translation with Conditional Adversarial Networks.-

El experimento funciona así: el tipo de imágenes es, por ejemplo, «fachadas». Primero un humano entrena al sistema categorizando los elementos de diversas imágenes, por ejemplo ventanas, puertas, balcones, cornisas, columnas, muros, etcétera. Entonces se lleva a cabo el proceso inverso: dibujar en un esquema los elementos que se desean y el software calcula y construye la imagen que mejor encajaría en esa clasificación.

Es muy entretenido jugar con la demo interactiva a borrar, dibujar o probar «diseños aleatorios».

El resultado es, cuando menos, sorprendente. Las imágenes geométricas son bastante realistas, ajustan bien los elementos y en realidad no hay dos iguales puesto que al proceder de diversas fuentes –pueden surgir en varios estilos y colores. El sistema no solo sirve para un tipo de dibujos: como se puede entrenar con imágenes de todo tipo puede servir para muebles, ropa, e incluso gatos:

Gatos ML

El problema con los gatos parece ser que el algoritmo no tiene suficiente «entrenamiento» o que se le va un poco la olla con ciertos trazos: la mayor parte de los imaginarios bichos resultantes son criaturas mutantes que parecen salidas de un freak show. En especial parece tener algún problema con los ojos (¡ah, ojitos!), y es más que probable encontrarse con gatos con tres ojos, con ojos en las orejas, en las patas… En fin, que debe mejorar un poco en este aspecto.

Impresionante en cualquier caso, y el código se puede bajar para jugar con él.

Compartir en Flipboard Publicar / Tuitear Publicar