Deepseek tiene un nuevo modelo actualizado que está sorprendiendo a los codificadores

Deepseek acaba de lanzar una versión mejorada de su modelo V3 ya impresionante, y tiene a los desarrolladores hablar. Esta startup de IA china lanzó los modelos V3 y R1 a principios de este año, e inmediatamente llamaron la atención al ofrecer un rendimiento que rivaliza con los modelos de primer nivel de OpenAI y Google, de código abierto y gratuito.

Ahora, vuelven a hacerlo con la versión actualizada del modelo V3 – Deepseek-v3-0324. Esto ya está generando rumores para escribir cientos de líneas de código sin sudar.

Vamos a desglosarlo.

¿Qué hay de nuevo en Deepseek-V3-0324?

El gran cambio aquí es el poder. El recuento de parámetros saltó de 671 mil millones a 685 mil millonesdándole más capacidad mientras usa lo eficiente Mezcla de expertos (MOE) arquitectura. Solo se activan 37 mil millones de parámetros por tarea, por lo que es inteligente con la forma en que utiliza los recursos.

También cambiaron al Licencia de MITque es amigable para los desarrolladores y hace que la integración sea mucho más fácil.

Los puntos de referencia también muestran fuertes ganancias:

  • MMLU-Pro: 75.9 → 81.2 (+5.3)
  • GPQA: 59.1 → 68.4 (+9.3)
  • AIME: 39.6 → 59.4 (+19.8)
  • LivecodeBench: 39.2 → 49.2 (+10.0)

Esto tampoco es solo pelusa de referencia. Estos son los cambios que notará al usar el nuevo modelo.

Lo que notarás al usarlo

  • Es mucho mejor para resolver problemas matemáticos. Verá un impulso claro cuando le dé tareas pesadas de razonamiento, especialmente las complejas como preguntas de estilo Aime.
  • Ya no se ahoga en las generaciones de código largo. Puede pedirle que escriba sitios web o aplicaciones completos, y manejará más de 700 líneas de código de una vez sin bloquear.
  • El código que genera para los sitios web ahora se ve más limpio y más pulido. Si te gusta el trabajo frontal, el HTML y el CSS que escupe se sentirá mucho más cerca de algo que implementarías.
  • Si está trabajando con contenido chino, notará que la escritura se siente más natural y mejor estructurada. Los artículos medianos a largo, especialmente, muestran un mejor tono y flujo.
  • Las conversaciones son más suaves ahora. Recuerda lo que dijiste anteriormente en el chat y responde con respuestas más relevantes, incluso en múltiples turnos.
  • Las tareas de traducción y búsqueda también son más nítidas, especialmente cuando se cambian entre chino e inglés. Las respuestas se sienten más completas y menos genéricas.
  • Es más preciso al generar código que implica llamadas de funciones. Entonces, si lo está utilizando para escribir Python, JavaScript o cualquier otra cosa que requiera una lógica precisa, se equivocará con menos frecuencia.

Entonces, ¿cómo funciona?

La gente lo ha probado, y los resultados son impresionantes.

Petri Kuittinenun profesor finlandés, lo consiguió para generar una página de destino totalmente receptiva para una compañía de IA,958 líneas de código de trabajo. Jasper Zhang, medallista de oro de la Olimpiada Matemática, le dio un problema de AIME de 2025. Lo resolvió sin problemas.

Manzana Twni hannun lo corrió en un 512GB M3 Ultra Mac. La velocidad fue de alrededor de más de 20 tokens por segundo, pero el uso de la memoria máxima fue solo 381GBque es sólido para un modelo de este tamaño.

También lo probamos.

Cuando le pedimos que creara una aplicación web de Python usando Flask, incluida la funcionalidad de inicio de sesión y la seguridad de la contraseña de hash, generó el código. Para mi sorpresa, también funcionó.

Probamos lo mismo en Chatgpt y Gemini. ChatGPT siguió reiniciando la salida. Gemini logró terminarlo después de algunos intentos, pero el código estaba incompleto y no funcionó sin una fijación seria.

¿Cómo acceder al último Deepseek V3?

Puede acceder directamente al V3 desde el Sitio web de Deepseek y la aplicación móvil. Por defecto, utiliza el nuevo modelo Deepseek-V3-0324. Entonces puedes subir y probar el nuevo modelo de inmediato.

Los desarrolladores pueden integrar Deepseek en sus aplicaciones y sitios web utilizando la API, que cuesta lo mismo. Puedes usar lo mismo Punto final de la API (modelo = Deepseek-chat)

Para descargar y ejecutar el modelo localmente, puede hacerlo desde el Plataforma Huggingface.

¿Qué sigue?

Los rumores apuntan a un próximo modelo de razonamiento R2, posiblemente incluso antes de lo esperado. Y según lo bueno que es V3-0324, R2 podría causar un chapoteo aún mayor.

Sin embargo, no todos están encantados. Con su creciente influencia, Deepseek está bajo el escrutinio del gobierno de los Estados Unidos sobre la seguridad nacional y la privacidad de los datos. Se habla de prohibir sus aplicaciones de dispositivos oficiales. Aún así, Deepseek-V3-0324 está demostrando que la IA de código abierto puede ser poderoso, práctico y rentable. Si eres un codificador, constructor o simplemente curioso sobre lo que sigue en IA, debes probarlo por ti mismo.

Previous Article

Actualización de Motorola Android 15: dispositivos compatibles, fecha de lanzamiento y más

Next Article

¿Qué significan varios iconos y símbolos en Waze?

Write a Comment

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

x