Operai concluye «12 días de OpenAi» con anuncios O3 y O3 Mini

La campaña de 12 días de Openai de Openai concluyó hoy con dos anuncios principales: presentaron modelos O3 y O3 Mini. Solo unos días después del lanzamiento completo del modelo O1, OpenAi se ha superado al anunciar un modelo de razonamiento aún mejor realizado. Aquí está todo lo que necesitas saber.

1. Modelo de razonamiento de O3

Los modelos de AI de la Serie O de OpenAI son modelos de razonamiento, lo que significa que toman tiempo para pensar paso a paso para llegar a una conclusión. Este enfoque permite una mejor precisión y permite que estos modelos resuelvan problemas complejos, particularmente en programación, matemáticas y ciencias.

La versión completa del modelo O1 se lanzó el día 1 de la campaña «12 Days of Operai». Sin embargo, a medida que la competencia se intensifica con modelos como Gemini 2.0 Flash Thinking, OpenAi ha elevado la barra con el modelo O3, lo que demuestra mejoras significativas sobre el modelo O1 tanto en los puntos de referencia como en la precisión.

Por ejemplo, en las tareas de programación, la precisión del modelo mejoró de 48.9% a 71.7%.

El modelo O3 también mostró avances notables para resolver problemas matemáticos y preguntas de ciencias a nivel de doctorado.

Además, logró una mejora significativa en el Punto de referencia del premio de arco (Corpus de abstracción y razonamiento para inteligencia general artificial). Básicamente, prueba la capacidad de una IA para resolver rompecabezas desconocidos utilizando el reconocimiento de lógica y patrones. En lugar de confiar en capacitación o datos anteriores, el punto de referencia se centra en qué tan bien la IA puede pensar y generalizar para resolver nuevos problemas, similar al razonamiento humano.

2. O3 Mini: modelo rentable

Junto con el modelo O3, Operai también anunció O3 Mini, un modelo diseñado para la velocidad y la eficiencia.

O3 Mini se centra en tareas bajas, medianas y de alta condición, ofreciendo un equilibrio de capacidad y rentabilidad. En los puntos de referencia de programación, mientras que O3 Mini (bajo) alcanzó la misma clasificación ELO que la O1 Mini, el O3 Mini (alto) superó incluso al modelo O1 completo.

Se observó una tendencia similar en los puntos de referencia de matemáticas. Sin embargo, vale la pena señalar que si bien O3 Mini (bajo) tiene la misma precisión del O1 Mini, logra esto con mayor eficiencia, reduciendo la latencia de sus salidas.

Durante la demostración en vivo, O3 Mini demostró su versatilidad al escribir scripts que evaluaron su propio rendimiento.

Lea también:

  • Operai presenta ajuste fino reforzado para el modelo O1-Mini
  • ChatGPT ahora puede ver y hablar contigo: modo de voz avanzado con video lanzado
  • ChatGPT expande «Trabajar con aplicaciones»: más aplicaciones, búsqueda e integración de voz

Disponibilidad

Los modelos Mini O3 y O3 aún no están disponibles para el público. OpenAI prioriza la seguridad, otorga acceso temprano exclusivamente a investigadores seleccionados para pruebas de seguridad externas. Las aplicaciones para pruebas de seguridad externas se abren hoy, y puede Aplicar desde aquí.

Si bien no se proporcionó una fecha de lanzamiento específica, se espera que O3 Mini se lance poco después del lanzamiento de O3.

El final de los 12 días de Openai

La campaña de Openai concluye hoy, y entre todos los anuncios, Sora, su modelo de generación de texto a video, se destaca como el más emocionante. Las actualizaciones de lienzo y búsqueda también son altamente prácticas y beneficiosas para una amplia gama de usuarios.

Si bien las actualizaciones de los modelos de razonamiento, como O3 y O3 Mini, representan un salto significativo en las capacidades de IA, pueden ser menos relevantes para los usuarios que no están en resolver problemas a nivel de doctorado.

Previous Article

Cómo agregar un acceso directo de configuración a la pantalla de inicio en los teléfonos Samsung Galaxy

Next Article

Cómo habilitar y usar extensiones en Google Bard

Write a Comment

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

x