Febrero2025

Por @Alvy

El «valle inquietante» conversacional con voz artificial también existe, y lo estamos cruzando a pasos agigantados

En su día hablamos del concepto de «valle inquietante» como ese punto en el que un sistema artificial como un robot o una IA nos resultan demasiado humanos cuando somos conscientes de que no lo son. Hoy en día resulta que con los algoritmos conversacionales de voz también se está ya cruzando ese valle. Pero no es ya que puedan simular la voz humana y te engañen en una llamada de telemárketing; es que están yendo varios pasos más allá.

Un grupo llamado Sesame trabaja muy activamente en este tipo de técnicas, las cuales pueden verse en una nota y una demostración que recomiendo probar. Basta conectar unos auriculares y activar el micrófono y ponerse a hablar con Maya o con Miles.

Demo: Sesame conversacional

Sesame trabaja buscando una forma de conversar auténtica, haciendo que la IA conteste, interrumpa (poco) y permita interrupciones. Intenta que la latencia (retardo) sea lo más baja posible y es capaz de adaptar el tono: alegre, seria, dicharachera…

En esta búsqueda de la expresividad y la velocidad emplean nuevos modelos y los combinan de diversas maneras, por ejemplo para que el arranque de las respuestas sean más rápidos. También tiene que analizar lo que la persona está diciendo, y no solo el texto, sino el contexto. Las claves que analiza son, según sus creadores:

  • Inteligencia emocional: comprende y responde a emociones.
  • Dinámicas conversacionales: gestiona pausas, interrupciones y énfasis.
  • Conciencia contextual: adapta tono y estilo a cada situación.
  • Personalidad coherente: mantiene un comportamiento estable y confiable.

Según las evaluaciones que han realizado actualmente están en «niveles casi humanos de calidad». Si se le puede hacer alguna crítica es que todavía le falta un poco prosodia (pausas, división de palabras en sílabas, acentuación…), algo de continuidad y que no es tan ágil y fluida como una persona en respuestas rápidas (por ejemplo en lo que sería una discusión rápida y acalorada). Para compensarlo, es capaz de distinguir varias voces de un grupo y filtra bastante bien el ruido.

Por cierto que todo este trabajo de Sesame se liberará como software libre en Github: A Conversational Speech Generation Model.

A mi la demo me ha impresionado gratamente. Felicidades al equipo creador de esta interesante IA.

§

A todo esto, alguien debería ir pensando seriamente en hacer alguna normativa que exija que las IAs que se comuniquen verbalmente de esta forma se identifiquen como tales al principio de la conversación.

Relacionado:

Compartir en Flipboard Publicar
PUBLICIDAD


Por @Alvy

Una aplicación para crear una infografía de tu vida semana a semana

Your Life in Weeks es una versión en forma de aplicación web de la visualización creada por Tim Urban en 2014 con el mismo, que también recrearía Gina Trapani. El objetivo: crear una infografía a modo de cronología de tu vida, fácil de leer y entender.

La idea de que cada cajita represente una semana es realmente práctica. En la aplicación lo que se puede hacer es introducir dato a dato, ya sea una fecha concreta o un periodo.

Otro detalle interesante es que se pueden añadir automáticamente tus fechas de cumpleaños, los grandes eventos mundiales y marcar los eventos como públicos o privados, por si acaso quieres compartir la cronología. Se pueden introducir textos largos, que aparecen al pasar el ratón por encima, y también exportar los datos.

Para mi lo mejor es poder apreciar de un vistazo cómo la vida tiene un tiempo finito, cómo los bloques son muchos pero limitados y cómo hay un límite inexorable, que en este caso parecen ser tu 100º cumpleaños.

Relacionado:

Compartir en Flipboard Publicar
PUBLICIDAD


Por @Alvy

La nueva joya de Asprey Studio: Las teclas 'Esc' diseñadas por Susan Kare son un must para los amantes de la tecnología.

Esc Key es nombre de una nueva colección de iconos de la mismísima Susan Kare para Asprey Studio. La buena mujer se prodiga poco pero ocasionalmente aparece con sus pequeñas perlas de diseño, más que de sabiduría.

Kare creó la iconografía de los Macintosh de Apple y de las primeras versiones de Windows, además de tipografías y otros elementos de interfaz.

En total hay 32 iconos con flores, sobres, perretes, aliens, corazoncitos y otros motivos gráficos. Están disponibles en dos + un formatos: como teclas para teclados mecánicos, esmaltadas en plata u oro, como colgantes también en versiones de plata y oro.

Lo del «más uno» es porque, como extra, se entregan también en formato digital inscritos en la blockchain, que es algo suena chulo aunque tampoco es que sirva para gran cosa excepto para epatar diciendo «mira lo que me he comprao con dos mil lereles».

Y es que si se les puede poner un pero a estos bonitos iconos es el precio: entre 600 y 2.000 euros la pieza, dependiendo del diseño y el formato elegido. No apto para pobres ni para tiempos de crisis, definitivamente. Pero, bueno «cosas del diseño de famosos», supongo. Aunque son eso de subirse a la parra con los precios y el blockchainismo no tengo yo muy claro si la Kare ha saltado el tiburón definitivamente. Veremos.

Relacionado:

Compartir en Flipboard Publicar
PUBLICIDAD


Por @Wicho

Esta pasada noche un Falcon 9 de SpaceX ha lanzado el aterrizador Athena de la misión IM-2 de Intuitive Machines hacia la Luna. Se trata de un aterrizador NOVA-C igual que el de la misión IM-1.

Forma parte del programa CLPS (Commercial Lunar Payload Services, Servicios Comerciales de Carga Útil Lunar) de la NASA. Es la cuarta del programa en haber sido lanzada tras Peregrine Mission 1, IM-1 y BlueGhost Mission 1.

Seguir leyendo: «El aterrizador Athena de Intuitive Machines ya viaja hacia la Luna»

Compartir en Flipboard Publicar
PUBLICIDAD