Si incluso estás siguiendo el espacio de IA, probablemente hayas escuchado el zumbido este fin de semana. Meta dejó caer su nueva familia de modelos de Llama 4, extravamente, un sábado, pero no hay nada discreto sobre lo que estos modelos de IA traen a la mesa. Llama 4 es el mayor impulso de Meta para competir con personas como GPT, Gemini y Claude. Aquí está todo lo que necesita saber sobre los modelos de AI Llama 4 AI de Meta AI.

Meta liberado Llama 4
Meta ha lanzado tres modelos bajo la colección Llama 4: Scout, Maverick y Behemoth.
- Explorar: Modelo de parámetros livianos, 109B
- Disidente: Modelo de nivel medio, parámetros totales de 400B
- Gigante: El modelo más grande de Meta, 2 billones de parámetros
En términos simples, los parámetros son como las células cerebrales del modelo AI. Cuantos más parámetros tenga un modelo, más información puede entender incluso cuando se capacita en la misma cantidad de datos.
Sin embargo, a partir de ahora, solo Scout y Maverick están disponibles. Behemoth todavía está en entrenamiento. Los modelos fueron entrenados en cantidades masivas de datos de texto, imagen y video no etiquetados para habilitar capacidades multimodales nativas, sí, estos modelos entienden tanto texto como imágenes desde cero, similar a otros modelos como Gemini 2.0 y ChatGPT 4O.
Scout y Maverick están abiertamente disponibles a través de Llama.com y plataformas como abrazar la cara. Ahora también alimentan meta ai en WhatsApp, Instagram, Messenger y la aplicación web Meta AI en 40 países. Sin embargo, las características multimodales se limitan a los usuarios ingleses en los EE. UU.
¿Qué hay de nuevo en Llama 4?
1. Eficiente con la mezcla de la arquitectura de expertos (MOE)
A diferencia de los modelos densos que usan cada parte del modelo para cada tarea, MOE solo activa «expertos» seleccionados según la tarea.
Por ejemplo, cuando hace una pregunta relacionada con las matemáticas, en lugar de usar todo el modelo, esta arquitectura activa solo al experto relacionado con las matemáticas, manteniendo el resto del modelo inactivo. Por lo tanto, el modelo se vuelve muy eficiente, rápido y también puede ser rentable para los desarrolladores. Esto fue popularizado por primera vez por Deepseek Models, y ahora, muchas compañías están utilizando MOE para la eficiencia.
- Scout tiene parámetros totales 109B, 16 expertos, pero solo 17b activo a la vez.
- Maverick tiene parámetros totales 400B, 128 expertos, también 17b activo a la vez.
- Behemoth tendrá 2 billones de parámetros totales, 288b activo en 16 expertos.

2. Enorme actualización de memoria con un gran contexto Windows
Scout admite hasta 10 millones de tokens en una sola entrada. En pocas palabras, la ventana de contexto no es más que memoria que la IA puede tener en mente mientras responde. Cuanta más ventana de contexto tenga una IA, más de las conversaciones pasadas y los archivos cargados pueden recordar al responder cada pregunta.
Anteriormente, Géminis solía ser el más alto que también con solo 1 millón de fichas. Con las 10 veces la ventana de contexto a Gemini, ahora puede cargar bases de código enteras o incluso documentos largos y múltiples para el modelo Scout de Llama.
Por otro lado, Maverick solo admite 1 millón de tokens, que aún es más que suficiente para la mayoría de las tareas de alta gama.
3. Soporte multimodal nativo
Todos los modelos LLAMA 4 pueden manejar texto e imágenes juntos, similar a otros modelos como ChatGPT y Gemini. Sin embargo, Meta afirma que su capacidad multimodal no solo se agrega más tarde, era parte del entrenamiento central del modelo. Eso significa que estos modelos entienden y razonan sobre ambos tipos de entrada de manera más natural.
Sin embargo, no tenemos suficiente información sobre cómo ChatGPT y Gemini han entrenado sus capacidades multimodales y no estamos seguros de qué tan bien este sistema de fusión temprano será útil en el mundo real. No obstante, las capacidades de comprensión de texto e imagen serán mucho mejores en comparación con los modelos de llama anteriores.
4. Rendimiento de referencia más fuerte
Scout vence a Gemma 3, Gemini 2.0 Flash Lite y Mistral 3.1 en muchos puntos de referencia reportados mientras se ejecutan en un GPU NVIDIA H100 Single. Maverick anota 1417 en la tabla de clasificación de Lmarena Elo, superando a GPT-4O, GPT-4.5 y Claude Sonnet 3.7. Tiene el segundo lugar en general, justo debajo de Gemini 2.5 Pro.
Según los informes, Behemoth (todavía en el entrenamiento) vence a GPT-4.5, Gemini 2.0 Pro y Claude Sonnet 3.7 en pruebas relacionadas con STEM.

5. Barandas más sueltas
Meta dice que Llama 4 responde más preguntas políticas y sociales que antes. Los modelos están sintonizados para ser menos despectivos con las indicaciones «polémicas» y tienen como objetivo dar respuestas objetivas y equilibradas sin rechazos directamente. Después de que Grok se hizo popular, esto se convirtió en un movimiento común para muchas compañías de IA, y espero que esta tendencia continúe.
6. Restricciones de licencia
Sin embargo, no todo está bien. Llama 4 es de peso abierto, no de código abierto como antes. Las empresas con más de 700 millones de maus necesitan un permiso especial. Y cualquier persona en la UE tiene prohibido usarla o distribuirla en los términos actuales. De todos modos, aún así, Llama es la única IA de Big Tech que es abierta y completamente gratuita, al menos para la mayoría de las personas.
Meta Llama 4 AI Model Llama
Llama 4 no es solo un paso adelante: es una respuesta meta para Chatgpt, Grok y Gemini. Con multimodalidad nativa, arquitectura MOE, contexto más largo y un poderoso rendimiento con menos parámetros activos, Meta apunta tanto a la escala como a la eficiencia.
Y la historia no ha terminado. Behemoth todavía viene. Se esperan más actualizaciones en el evento Llamacon de Meta el 29 de abril. Si pensas que Meta se quedó atrás en la carrera de IA, Llama 4 demuestra que no solo están en él, están corriendo.