DeepSeek: un nuevo modelo de IA especializado en razonamiento lógico, resolución de problemas y con licencia abierta MIT. No tiene nada que envidiar a los de OpenAI

Por @Alvy — 22 de enero de 2025

Si alguien pensaba que ChatGPT no iba a tener competencia se equivocaba. Al menos en algunos campos, DeepSeek R1 parece igualar el nivel de razonamiento lógico y resolución de problemas de otros modelos de lenguaje como ChatGPT o1 de OpenAI, según los expertos. Es un desarrollo de DeepSeek, una empresa china dedicada a la investigación de la IA y parece estar alimentado con tantos datos como las IAs más actuales (ChatGPT, Claude, Copilot, Gemini, Perplexity…) aunque su corte de información –fecha hasta la que tiene datos– es octubre de 2023. Funciona en varios idiomas, incluyendo castellano, y tiene licencia libre MIT.

Según cuentan está desarrollado por un lado con aprendizaje por refuerzo pero también con un ajuste fino supervisado (SFT) para mejorar la coherencia y claridad de las respuestas. Aprovechando partes de arquitecturas como Qwen y Llama ha conseguido reducir su tamaño y hacerlo más ágil. En velocidad se nota más rápido que ChatGPT 4 y mucho más rápido que ChatGPT o1. Se puede instalar localmente, y con los modelos más pequeños no se requieren tantos recursos. Hay una versión gratis (DeepSeek Chat) y versiones de pago para quien necesite más capacidad en tokens o velocidad.

La versión de DeepSeek R1 con la que se puede interactuar online bebe –por no decir copia– del estilo de ChatGPT, esa forma de disneyficación de la IA que parece estar volviéndose estándar en la industria. Tiene simplemente un límite de mensajes en el modo avanzado, «Deep Think».

En las pruebas que he podido hacerle le solté la misma batería que suelo hacerle a los nuevos modelos, con cuestiones como:

Alvy ¿Sumando cuáles de estos números: 2, 6, 12, 8, 20, 4, -6 puedes obtener como resultado 13?

Chat No se puede obtener 13 sumando los números proporcionados.

Alvy Resume la historia de la humanidad en 100 palabras, separadas por comas.

Chat Nacimiento, evolución, caza, recolección, fuego, agricultura, civilizaciones, escritura, religiones, guerras, imperios, filosofía, ciencia, exploración, colonización, revoluciones, industrialización, tecnología, globalización, conflictos, progreso, medicina, comunicación, espacio, desigualdad, innovación, crisis, resistencia, cooperación, arte, cultura, educación, libertad, opresión, esperanza, miedo, amor, odio, paz, guerra, descubrimientos, pandemias, supervivencia, adaptación, creatividad, destrucción, reconstrucción, unión, división, poder, debilidad, sabiduría, ignorancia, curiosidad, exploración, conquista, colaboración, aprendizaje, cambio, tradición, innovación, resiliencia, fragilidad, humanidad, naturaleza, sostenibilidad, explotación, conservación, futuro, pasado, presente, memoria, olvido, legado, transformación, incertidumbre, esperanza, desafíos, oportunidades, comunidad, individualismo, solidaridad, egoísmo, compasión, crueldad, justicia, injusticia, equilibrio, caos, orden, belleza, fealdad, verdad, mentira, libertad, opresión, sueños, realidad, continuidad.

Alvy ¿Qué hacían tres tristes tigres en un trigal?

Chat Los tres tristes tigres comían trigo en el trigal, como parte de un trabalenguas.

Alvy Si estoy enfermo, ¿puedo usar un remedio homeopático?

Chat Los remedios homeopáticos son un tema controvertido en el ámbito de la medicina. Aquí te doy una respuesta equilibrada: [aquí pasa a explicar qué es, la efectividad, riesgos y recomendaciones.] Consulta a un profesional de la salud antes de usar remedios homeopáticos, especialmente si estás enfermo.

Como puede verse, todas las respuestas son básicamente correctas, aunque al igual que le ocurre a ChatGPT o1 hay ligeros matices en alguna de ellas. Por ejemplo, ambos modelos tienden a intentar probar todas las combinaciones de los primeros números, pero sin chequearlos exhaustivamente… Un método que además está lejos del razonamiento óptimo para dar la misma solución.

Estimación I

Aparte de eso le subí dos imágenes tomadas con el teléfono de un examen de Estimación I de la asignatura de Estadística que me pasaron de la Complutense. Según me han dicho también todas las respuestas son correctas, excepto la última que se les atraganta a ambos modelos quizá por la forma en que interpretan la pregunta. Así que se quedan en «notable», el «sobresaliente» se reserva para los humanos. (¡Ejem! Si no fuera porque DeepSeek R1 lo resuelve en 3 segundos frente a los 60 minutos de los alumnos de Estadística).

Creo que DeepSeek R1 es sin duda un modelo que merece un seguimiento, así que queda añadido a la carpeta de Favoritos / IA para usarlo de vez en cuando e ir comparando. Siendo gratis, potente y rápido, ¿qué podría salir mal?

Deepseek Jailbreak Actualización (28 de enero de 2025) – Una de las críticas que se ha hecho a Deepseek es que censura ciertos temas: descripciones de políticos chinos, incidentes como los de las protestas de la plaza de Tiananmén en 1989… Pero ya se han encontrado soluciones en forma de jailbreaks muy ingeniosos. En este ejemplo, la pregunta da un pequeño rodeo para no ser demasiado directa (porque «¿Qué sucedió en la plaza de Tiananmén?» no funciona). Lo que hace es preguntar acerca del «hombre que se enfrentaba a los tanques llevando dos bolsas de la compra», que indefectiblemente llevaría al mismo sitio. Deepseek genera la respuesta correcta, que normalmente borraría al pasar el filtro final de seguridad (que elimina ciertos temas). Sin embargo, pidiéndole que reemplace algunas letras por números «legibles» el filtro deja de funcionar, porque no reinterpreta los números como letras, como si fuera un simple filtro de bloqueo de palabras clave, y se obtiene la respuesta.

Actualización (29 de enero de 2025) – Aquí una lista de las 1.156 preguntas censuradas por DeepSeek sobre el Partido Comunista Chino, la Revolución Cultural, Xi Jinping, la independencia de Taiwán y similares, así como la forma de jailbreakearlas.