Matt Reed decidió que tanta reunión por videoconferencia través de Zoom no era precisamente lo más productivo del mundo, de modo que decidió crear Zoombot, una especie de «gemelo digital» para hacerse pasar por él. El bot utiliza una especie de «inteligencia artificial tosca» (también conocida como if… then) y aunque fracasa en cuanto abre la boca la idea recibe puntos por su originalidad.
La receta es básicamente:
- Grabar algunos clips poniendo caras
- Artyom.js para el reconocimiento de voz-a-texto y la síntesis de voz
- Un poco de programación para reconocer frases y palabras típicas:
- Hola / Adiós
- ¿Cómo estás?
- ¿Me se oye?
- ManyCam como webcam virtual
La cosa no funciona mal en cuanto a que da un poco igual si la imagen no es perfecta y un poco con menos expresividad que la cara de Espinete. Que no hagan falta muchos fotogramas por segundo o parezca «atascado» también ayuda. El reconocimiento de voz funciona, eso es un plus. Pero la síntesis de voz… ¡Maldición! Ahí ya no cuela. Como se ve en el vídeo todo el mundo se da cuenta con las primeras frases que ese Matt no es nuestro Matt y que se lo han cambiado.
Un diez en concepto y un ocho alto en ejecución, una idea sin duda sobresaliente. Imagino grandes aplicaciones para esto en cuanto esté un poco mejorado.
Relacionado: