De momento los humanos somos más precisos que las máquinas clasificando fotos, pero no por mucho

Por @Alvy — 4 de agosto de 2019

La gente de Perficient Digital ha publicado un interesante estudio que compara diferentes sistemas de reconocimiento de imágenes: Image Recognition Accuracy Study. Se comparan cuatro sistemas: Amazon AWS Rekognition, Google Vision, IBM Watson y Microsoft Azure Computer Vision, a los que se añade como control y comparación «humanos clasificando a mano». En total se utilizaron unas 500 imágenes para evaluar diversos parámetros.

En cuanto a precisión los humanos todavía estamos por delante, con una precisión del 88% seguidos de Google Vision (hace poco hablamos de su demo), Rekognition de Amazon, y los sistemas de Microsoft e IBM. Curiosamente tres de los cuatro sistemas clasifican con un 90% de confianza más de 5 etiquetas (que es hasta donde llegan los humanos)

La clasificación humana también es muy superior cuando se trata de describir una imagen (la siguiente en la lista es Google Vision). También hay alguna que otra curiosidad, como que Watson de IBM es la que tiene una mayor capacidad para distinguir y nombrar colores (términos como «jade», «azul metálico», «gris ceniza»… frente a «amarillo») y Amazon –apropiadamente– para reconocer términos relacionados con la vestimenta: camisetas, pantalones y ropa interior.

Relacionado: