Operai inicia el operador, un agente de IA que puede realizar tareas para usted

A principios de año, el CEO de Operai, Sam Altman, mencionó en su publicación de blog que 2025 será el año de los agentes de IA. Básicamente, los agentes son herramientas de IA que no solo responden con texto o generan imágenes, sino que realizan tareas para usted.

Operai inicia el operador, un agente de IA que puede realizar tareas para usted

Hoy, Openai presentado Su primer agente de IA llamado operador, una herramienta que puede ejecutar tareas y tomar medidas para usted en un navegador web. Por ejemplo, puede preguntarle al operador algo como «Revise la receta de pollo de mantequilla y agregue todos los ingredientes necesarios a mi carrito de compras. Ya tengo yogurt y palitos de canela». El operador verificará la receta y agregará todos los ingredientes en su carrito de compras, excepto los que ya tiene. Una herramienta útil para llevar a cabo tareas diarias, mundanas y repetitivas.

Del mismo modo, puede reservar boletos de avión, completar formularios, verificar el extracto bancario del mes pasado, comprar en línea o incluso cancelar una compra y solicitar un reembolso: el operador de Openai puede hacerlo todo. Bastante fascinante, ¿verdad? Romperemos todo para ver qué es el operador, cómo funciona y cómo puede comenzar.

¿Qué es el operador de OpenAI?

El operador es el primer agente de IA de OpenAI que combina capacidades de visión y razonamiento para realizar tareas en su nombre en su computadora. Esta tecnología está impulsada por Operai’s Agente de uso de la computadora (CUA) modelo. Espera, ¿qué? Esencialmente, CUA toma capturas de pantalla para «ver» lo que está en la pantalla y luego interactúa con el navegador haciendo clic, escribiendo y desplazándose, imitando básicamente lo que haría con un mouse y un teclado. Funciona de manera similar al uso de la computadora de Claude y el Proyecto Mariner de Google.

Ahora, aquí está la captura: el operador se encuentra actualmente en su fase de vista previa de investigación, por lo que solo puede funcionar dentro de un entorno de navegador virtual por ahora. El control completo del nivel del sistema operativo es un objetivo a largo plazo, todavía no está disponible.

Incluso en esta etapa temprana, el operador muestra resultados impresionantes. En puntos de referencia basados ​​en navegador como Webarena (un entorno web simulado) y Webvoyager (Pruebas en sitios web en vivo como Amazon y Google Maps), el operador logró tasas de éxito de 58.1% y 87%respectivamente. Para el contexto, humanos tener una tasa de éxito de 78.2% en Webarena. No demasiado mal, ¿eh?

No solo eso, Openai afirma que el operador es capaz de aprender de sus errores e incluso autocorrectarlos. Impresionante si es cierto.

Cómo usar el operador ahora

Si está emocionado de probar el operador, aquí está el trato: actualmente, está en una fase de vista previa de investigación y solo está disponible para Usuarios profesionales en los Estados Unidos Operai planea expandir el acceso a los usuarios de Plus, Team y Enterprise en el futuro y eventualmente lo lanzará a un público más amplio, integrándolo directamente en ChatGPT. Sin embargo, si estás en Europa, deberás esperar un poco más.

Comenzar con el operador es sencillo:

  1. Iniciar sesión en operador.chatgpt.com usando su cuenta profesional.
  2. Dé un aviso explicando lo que desea que haga el operador. Por ejemplo: «Encuentre las mejores ofertas en vuelos a Miami y reserve uno dentro de mi presupuesto» o «Busque aperturas de trabajo en marketing y guarde los detalles en un documento».
  3. El operador se hace cargo del navegador virtual, realiza la tarea y le permite saber cuándo está hecho. Pide su información al manejar tareas confidenciales como ingresar contraseñas o detalles de pago.

Puede tomar el control en cualquier momento que desee usar Modo de adquisición. Entonces, si siente que algo está mal o mal y necesita ser corregido, puede detener al operador en el medio. ¿Necesitas hacer algo a diario? Crear el aviso perfecto y luego Guardar ese aviso en la página de inicio para usar diariamente.

Por ahora, el operador es un vistazo a lo que es posible cuando la IA evoluciona de herramientas pasivas a asistentes digitales activos que funcionan con IA. Ya sea que esté automatizando tareas repetitivas o explorando sus límites, el operador ofrece una mirada fascinante al futuro de la IA. Entonces, si eres un usuario profesional en los Estados Unidos, ¿por qué no darle una oportunidad?

Pero al mismo tiempo, también plantea varios como lo que sucede si alguien piratea y el operador anula las instrucciones humanas, algunos errores que conducen a acciones y consecuencias involuntarias, datos (todas esas capturas de pantalla) y, por supuesto, privacidad y seguridad. Operai ha enumerado varias medidas de seguridad como modo de reloj, escuchaetc. para contrarrestarlos, pero siempre hay un riesgo. Sin embargo, a la larga, la conveniencia gana sobre los riesgos potenciales si la ventaja es grande. El operador puede ahorrarle mucho tiempo que puede dirigir hacia algo más productivo o creativo.

Previous Article

3 formas de fusionar o eliminar contactos duplicados en los teléfonos Samsung Galaxy

Next Article

9 correcciones para fotos de Apple que no muestran todas las fotos en iPhone y iPad

Write a Comment

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

x