Por @Alvy — 27 de febrero de 2017

YOLO (You Only Look Once, «sólo se mira una vez») es un algoritmo de visión artificial que detecta y clasifica objetos en tiempo real. Lo hace tan rápido que una tarjeta gráfica Nvidia Titan X es capaz de procesar entre 40 y 90 fotogramas por segundo, muchos más que los 30 fps con los que solemos visualizar las películas. Además esa identificación la hace con una precisión de entre el 40 y el 80% de certeza, según el tipo de pruebas a las que se le someta.

El vídeo es básicamente una demostración de poderío y en esta otra charla puede verse a Joseph Redmon, uno de sus creadores, explicando cómo funciona y cómo ha sido la evolución en los últimos años, en los que hubo que innovar mucho respecto a cómo se realizaba ese procesamiento de imágenes y detección:

Este tipo de algoritmo solían necesitar entre 15 y 20 segundos para procesar e identificar los objetos presentes en cada imagen, algo que volvía totalmente incapaces de procesar vídeo en tiempo real a los ordenadores hace unos años. Con el tiempo se pasó a necesitar tan solo 22 milisegundos por imagen, lo que permite obtener los mismos resultados, tanto o más precisos, en vídeos en movimiento.

YOLO está escrito en código abierto y puede descargarse en Github.

Compartir en Flipboard Publicar / Tuitear Publicar