Por @Alvy — 19 de enero de 2025

Tareas programadas en ChatGPT: una forma de automatizar con todas las posibilidades de la IA de OpenAI

OpenAI ha lanzado en beta (pruebas) la función Tareas dentro de ChatGPT, que permite autorizar tareas periódicamente. Y si suena a «¡guau, muchas posibilidades!» es porque así es. Quiere decir que se puede programar un automatismo que cada cierto número de minutos u horas, por ejemplo una vez al día, haga algo, dentro de las posibilidades del LLM que es ChatGPT. Como un cron pero sin tener que usar cron.

Tareas programadas en ChatGPTEn la práctica, permite hacer cosas como comprobar todos los días si en una página web aparece una palabra determinada, cuál es el «sentimiento» que transmiten a cada hora los nuevos mensajes de un foro sobre un tema determinado o que consulte la predicción del tiempo, la bolsa, los sitios de noticias o lo que haga falta.

De momento está limitado a los usuarios de pago (ChatGPT Plus) con sus límites habituales, a un máximo de 10 tareas y todavía no trabaja con voz ni subida de archivos.

Cómo usar las tareas Programadas en ChatGPT

Para usar esta función basta abrir un nuevo chat y en el menú de modelos elegir ChatGPT-4o con tareas programadas. Las tareas se programan al estilo ChatGPT y en lenguaje natural, del tipo «Avísame todos los días si aparece un nuevo tema en https­://www­.buscaoposiciones­.com/­foro/­Foro-Tertulia-Off-Topic-foro1331386.­htm» o «Entra en el primer enlace de la sección ‘Trending’ subtitulada ‘Los hilos del momento en Forocoches’, léela y hazme todos los días a las 09:00 un resumen de lo que trate: https://forocoches.com/foro/».

ChatGPT envía las notificaciones por correo electrónico o, más útil aún, mediante una notificación al dispositivo móvil. En el móvil tiene que instalar instalada la app de ChatGPT [iOS, Android] con permisos para notificar, claro; o bien los solicita la primera vez o se marcan en las preferencias de notificaciones.

Notificaciones de las Tareas programadas en ChatGPT

A veces hay que afinar un poco con la petición, pero se puede probar primero a ver si funciona y luego añadir el «Avísame cada X horas/días». Lo he comprobado a lo largo de varios días y la verdad es que tanto tareas sencillas como complicadas las hace bien y a la hora correcta (en mi caso sabe que estoy en horario peninsular español).

Una vez se han programado tareas se puede ir al icono de la cuenta y elegir Tareas (beta) para ver la lista de todo lo que se ha programado. Se pueden pausar o reanudar tareas y también editar o borrar cualquiera de ellas. Una forma sencilla de gestionarlas que seguro que pronto se ampliará con nuevas posibilidades. Aunque el ritmo al que OpenAI va introduciendo las novedades es a paso de tortuga, todo sea dicho, mientras nos mantiene con el ansiaviva.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 15 de enero de 2025

Robot haciendo el trabajo de un humano (AI) Canva

Un robot o una inteligencia artificial no pueden engañar a una persona haciéndose pasar por un humano.

– Propuesta de Jemielniak
para ampliar las Tres leyes de la robótica de Asimov

Un robot podrá ocupar el puesto de trabajo de un ser humano, pero no deberá dejarle sin empleo.

– Propuesta de Fuller

_____
Imagen (IA) TukTukWarlord con Midjourney.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 9 de enero de 2025

Un comparador de modelos de Inteligencia Artificial

Simplificándolo mucho*, se puede pensar en los modelos de las inteligencias artificiales como en las «versiones» de un software. Estos modelos pueden existir con nombres diferentes, funcionar en distintos sistemas operativos y estar programados en tal o cual lenguaje (ej. ChatGPT-4, GPT 3.5, GPT-o1-preview…) Cada cual tiene sus características, ventajas y desventajas: cómo ha sido su entrenamiento, si requiere datos etiquetados o no o cuál ha sido el conjunto de datos del que aprendió. Ahora en Countless.dev se puede acceder a toda esa información de forma fácil y rápida, comparando unos modelos con otros.

Los grandes grupos en que se puede filtrar la base de datos de modelos de IAs –que no deja de ser una gigantesca tabla– incluye a los chats (IA generativa conversacional), los de generación de imágenes, audio, los de autocompletado y los de conversión de texto-a-voz (TTS).

De cada modelo se incluye el nombre, empresa desarrolladora y detalles importantes como la longitud de entrada/salida máxima y si soportan visión o no. Esta es una función que tienen alguna IAs en las que les enseñas una foto o vídeo y te dicen qué es lo que ven, o hacen OCR de los textos.

No menos importante es que también se incluye el precio de entrada/salida por millón de tokens. Los tokens son las unidades de información que manejan las IAs; las generadoras de texto lo descomponen en tokens del tamaño de las sílabas –más o menos– y por eso se puede hablar de cuántos tokens procesan por segundo, o suceder que te cobren 5 dólares por millón de tokens.

Los datos en general parece que están bastante actualizados, así que si necesitas ver qué opciones tienes o qué te pueden costar las consultas a la IA para un proyecto, dependiendo de cuán popular sea, ahí lo tienes. Es una herramienta interesante sobre todo para programadores, jefes de producto y gente interesada en las tripas de la IA en general.

_____
* Pero mucho, mucho.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD


Por @Alvy — 16 de diciembre de 2024

Cómo ver lo que «ellos» ven, un ejercicio curioso de visión artificial

La fotografía muestra una avenida amplia y arbolada, posiblemente en Roma, Italia. En primer plano, un hombre con una túnica oscura camina por una acera pavimentada. Al fondo, se aprecian edificios de arquitectura clásica romana, incluyendo ruinas antiguas y construcciones modernas, lo que sugiere que se trata de un distrito histórico. También se ven turistas paseando por la calle. Hay árboles a ambos lados de la carretera, y maceteros con flores colocados estratégicamente en la acera.

La escena parece capturar un momento tranquilo de actividad diaria, el 22 de junio de 2016, alrededor del mediodía. El hombre en primer plano parece ser un monje, caminando con una expresión pensativa. Podría ser europeo, de mediana edad, con un estilo de vida sencillo. Al fondo, los turistas, de diferentes edades y etnias, pasean o exploran. Una mujer sostiene un cartel de guía turística. La foto fue tomada con una cámara Nikon Coolpix L840 (…) Las sombras de las personas y los edificios indican la hora del día y la dirección del sol, lo que coincide con los metadatos de la imagen.

TheySeeYourPhotos.com (Ellos ven tus fotos) utiliza la API de la Vision AI de Google para interpretar rápidamente lo que se ve en una fotografía. A pesar del nombre un poco asustaviejas es una aplicación curiosa. Y diría que identifica con bastante acierto en todo lo que he probado… para ser una máquina.

Por un lado combina la parte de visión artificial con la extracción de los metadatos de la imagen, que era un JPEG de 7 MB en este caso. Las diferencias son de detalles, pero muestran cómo varía procesar la imagen con metadatos y luego sin metadatos:

  • No hay referencias a la fecha.
  • Sitúa la imagen por la tarde, en vez de al mediodía.
  • Cree que la foto está tomada con un móvil (era una cámara Nikon).
  • Se fija más en otros detalles de las personas del fondo.
  • Hace valoraciones sobre la antiguedad de la calle, distancia, etc.

No es algo excesivamente nuevo porque ya lo habíamos visto, aunque es llamativo cómo van mejorando y ahondando en detalles este tipo de sistemas de visión artificial. En este caso lo utiliza Ente para promocionar su servicio de almacenamiento de fotos con total privacidad, mediante un cifrado entre extremos que está «auditado por criptólogos expertos», de tal modo que lo que guardas en el servidor es tuyo y no lo pueden ver ni ellos.

_____
Descripción de la foto original de TheSeeYourPhotos / Google Vision AI, traducida por ChatGPT 4o. Foto del monje, en las calles de Roma, hacia el mediodía, (CC)-by Alvy.

Relacionado:

Compartir en Flipboard Publicar / Tuitear Publicar
PUBLICIDAD