Operai presentó GPT 4.5 - ¿Es este modelo de IA el último de su tipo?

Operai acaba de presentar GPT-4.5, su último modelo de lenguaje grande. El CEO Sam Altman lo describe como la primera IA que se siente como hablar con una «persona reflexiva». Sin embargo, este modelo marca un cambio significativo: Openai confirma que GPT-4.5 será el último modelo que no es de condición. El siguiente paso? Fusionando la serie GPT y la serie O en un sistema de IA unificado, probablemente GPT-5.

Pero que hace GPT-4.5 traer a la mesa? ¿Cómo se compara con los modelos anteriores y dónde encaja exactamente en el arsenal de OpenAI? Vamos a desglosarlo todo.

¿Qué es GPT-4.5?

GPT-4.5, con nombre en código interno ‘Orion’, es el último modelo de idioma grande de OpenAI, una actualización sobre sus modelos GPT anteriores como GPT 4O. Esto está diseñado para mejorar la calidad de la conversación, la asistencia de escritura y la resolución de problemas. Es más grande y más costoso de ejecutar que cualquier modelo Operai anterior y ha sido entrenado con más datos y potencia informática que nunca.

El modelo CHATGPT 4.5 se puede resumir a estos aspectos más destacados:

Más conversaciones similares a los humanos: Operai dice que este modelo tiene una «personalidad refinada» y responde de una manera más natural e intuitiva.
Mejor soporte de escritura y programación: GPT-4.5 se destaca por mejorar la escritura, el código de depuración y la automatización de tareas.
Conocimiento mundial más fuerte: Entiende la información más profundamente, lo que la hace mejor para responder preguntas objetivas.
Menos alucinaciones: OpenAI afirma que GPT-4.5 es más confiable y es menos probable que genere información falsa que los modelos anteriores.

A pesar de ser el último modelo, definitivamente tiene muchas limitaciones o debilidades:

No es lo mejor para el razonamiento lógico: Este no es un modelo de la serie O y no tiene capacidades de razonamiento extendidos. Este modelo está diseñado para respuestas rápidas y bajo rendimiento en comparación con modelos como Deepseek’s R1, el soneto Claude 3.7 de Anthrope y el propio O3-Mini de OpenAI.
Extremadamente caro: GPT-4.5 cuesta $ 75 por millón de tokens de entrada y $ 150 por millón de tokens de producción, en comparación con solo $ 2.50 y $ 10 para GPT-4O. Operai está considerando si continuar ofreciéndolo a los desarrolladores.
Características limitadas en chatgpt: No admite características multimodales como modo de voz, video o intercambio de pantalla (todavía).
Rollout retrasado: La escasez de GPU significa que ahora solo está disponible para los usuarios de Pro ahora, y los usuarios más obtienen acceso más tarde.

Lea también:

Operai lanza una investigación profunda a todos los usuarios pagados, pero es suficiente para vencer a Gemini
Elon’s Xai Grok 3 está aquí: ¿Cómo se compara con ChatGPT-4O y Gemini 2.0?

¿Cómo funciona GPT-4.5 en puntos de referencia?

Los puntos de referencia nos ayudan a medir qué tan bien funcionan los modelos de IA en diferentes áreas. Así es como GPT-4.5 se compara con los modelos anteriores de OpenAI y sus competidores:

GPT-4.5 muestra mejoras sólidas sobre GPT-4O en la precisión fáctica, obteniendo un 62.5% en el punto de referencia SimpleQA en comparación con el 38.2% de GPT-4O y el O1 de OpenAI al 47%. También tiene una tasa de alucinación más baja (37.1%) que GPT-4O (61.8%) y O1 (44%), aunque modelos como Deepseek’s R1 y la investigación profunda de Perplexity aún mejoran en la verificación de hechos. Cuando se trata de codificar, GPT-4.5 funcionó mejor que GPT-4O y O3-Mini en el punto de referencia SWE-Lancer de OpenAi, pero se retrasó detrás del soneto Claude 3.7 de Anthrope y los modelos de investigación profundas de OpenAi.

Sin embargo, lucha con la resolución compleja de problemas, anotando solo el 36,7% en AIME (matemáticas) en comparación con el 87.3% de O3-Mini y el 71,4% en GPQA (ciencia), siguiendo el R1 de Deepseek. En el lado positivo, supera a GPT-4O en tareas multilingües (85.1% frente a 81.5%) y multimodales (74.4% frente a 69.1%), pero aún carece de capacidades multimodales completas como soporte de voz y video.

Las clasificaciones de preferencias humanas son un método utilizado por OpenAI para evaluar cómo los usuarios reales perciben la calidad de las respuestas de diferentes modelos de IA. En esta calificación, los usuarios prefieren GPT-4.5 sobre GPT-4O para escritura creativa, consultas profesionales y conversaciones cotidianas, pero aún se rastrea detrás de modelos como Claude 3.7 Sonnet en razonamiento estructurado y redacción de documentos legales.

En general, GPT-4.5 es un paso adelante en el conocimiento fáctico y las habilidades de conversación, pero cuando se trata de razonamiento profundo y resolución de problemas estructurados, modelos como Deepseek’s R1 y Claude 3.7 Sonnet todavía tienen la ventaja.

Cómo acceder a GPT-4.5

A partir de hoy, Usuarios de ChatGPT Pro ($ 200/mes) puede acceder a GPT-4.5. Operai planea lanzarlo a los usuarios ChatGPT Plus ($ 20/mes) y los usuarios del equipo ($ 30/mes) la próxima semana una vez más GPUS están disponibles. Los usuarios pueden probar GPT 4.5 simplemente eligiendo ese modelo del selector del modelo.

Para los desarrolladores, GPT-4.5 se está poniendo a disposición a través de la API de OpenAi, incluida la API de finalización de chat, la API de asistentes y la API por lotes. Admite características clave como llamadas de funciones, salidas estructuradas, transmisión, mensajes de sistema e entradas de imágenes, lo que lo convierte en una herramienta versátil para varias aplicaciones basadas en AI. Sin embargo, actualmente no admite capacidades multimodales, como el modo de voz, el video o el intercambio de pantalla.

GPT-4.5 es un paso adelante emocionante, especialmente para la escritura, la conversación general y la precisión objetiva. Sin embargo, se queda corto en un razonamiento profundo y la resolución de problemas estructurados, que la compañía insinúa fuertemente no será el caso de los modelos posteriores.