Tech

O agente do operador da Openai me ajudou a me mover, mas eu tive que ajudar também

5 minutes read

O agente do operador da Openai me ajudou a me mover, mas eu tive que ajudar também

Openai me deu uma semana para testar seu novo agente de IA, operadorum sistema que pode realizar tarefas independentemente para você na Internet.

O operador é a coisa mais próxima que eu já vi da indústria de tecnologia visão de agentes de IA – Sistemas que podem automatizar as partes chatas da vida, libertando -nos para fazer as coisas que realmente amamos. No entanto, a julgar pela minha experiência com o agente do Openai, os sistemas de IA verdadeiramente “autônomos” ainda estão fora de alcance.

Openai treinou um novo modelo para o operador de energiaque combina o entendimento visual do GPT-4O com os recursos de raciocínio de O1.

Esse modelo parece funcionar bem para tarefas básicas; Eu assisti os botões de clique no operador, navegaram nos menus em sites e preencher formulários. A IA foi ocasionalmente bem-sucedida em tomar ações de forma independente, e funciona muito mais rápido do que os agentes baseados na Web que eu já vi Antrópico e Google.

Mas durante o meu julgamento, me vi ajudando mais o agente do Openai do que gostaria. Parecia que eu estava treinando operador em cada problema, enquanto eu queria afastar certas tarefas do meu prato.

Muitas vezes, durante o teste, tive que responder a várias perguntas, conceder permissões, preencher informações pessoais e ajudar o agente quando ela ficou presa.

Em termos de carro, o operador é como dirigir um carro com controle de cruzeiro-ocasionalmente tirando o pé dos pedais e deixando o carro dirigir-mas está longe de ser o piloto automático completo.

De fato, o Openai diz que as pausas frequentes do operador são por design.

O operador de alimentação da IA, assim como os chatbots que alimentam a IA como o ChatGPT do Openai, não podem trabalhar de forma confiável de forma independente por longos períodos de tempo, e é propenso ao mesmo tipo de alucinação. Por esse motivo, o OpenAI não deseja fornecer ao sistema muito poder de tomada de decisão ou informações confidenciais do usuário. Talvez seja uma escolha segura do Openai, mas reduz a praticidade do operador.

Dito isto, o primeiro agente do OpenAI é uma prova impressionante de conceito – e interface – para uma IA que pode usar o front -end de qualquer site. Mas, para criar sistemas de IA verdadeiramente independentes, as empresas de tecnologia precisarão criar modelos de IA mais confiáveis que não exigem tanta direção.

Um pouco demais 'mãos em'

Meu julgamento do operador coincidiu com a semana em que eu estava mudando de apartamentos, então tive a ajuda do agente do Openai na mudança de logística.

Pedi à operadora que me ajudasse a comprar uma nova licença de estacionamento. O agente do Openai me disse: “Claro”, então abriu uma janela para o navegador na tela do meu PC.

O operador realizou uma busca por uma licença de estacionamento de São Francisco no navegador, me levou ao site correto da cidade e até à página certa.

O operador ainda permite que você use o restante do seu computador enquanto ele está funcionando, algo que não pode ser dito para o Project Mariner do Google. Isso ocorre porque o agente do OpenAI não está realmente funcionando no computador, mas, na nuvem, em algum lugar.

A interface do operador (Crédito: Maxwell Zeff/Openai)

Para minha licença de estacionamento, tive que conceder permissão do operador para iniciar diferentes processos algumas vezes. Também parou para me pedir para preencher formulários com informações pessoais – como meu nome, número de telefone e endereço de e -mail. Às vezes, o operador também se perdeu, forçando -me a assumir o controle do navegador e colocar o agente de volta aos trilhos.

Em outro teste, pedi à operadora que me fizesse uma reserva em um restaurante grego. Para seu crédito, a operadora me encontrou um bom lugar na minha área com preços razoáveis. Mas tive que responder a mais de meia dúzia de perguntas ao longo do fluxo.

Algumas etapas para fazer uma reserva com o operador (crédito: Maxwell Zeff/Openai)

Se você precisar intervir seis ou mais vezes apenas para reservar uma reserva através de um agente de IA, em que momento é mais fácil fazê -lo sozinho? Essa é uma pergunta que me fiz muito enquanto testava o operador.

Agente-as-a-platform

Em alguns dos meus testes, encontrei sites que bloqueavam o operador por qualquer motivo. Por exemplo, tentei reservar um eletricista usando o TaskRabbit, mas o agente do OpenAI me disse que ele teve um erro e perguntei se ele poderia usar um serviço alternativo. A Expedia, Reddit e YouTube também impediram o agente da IA de acessar suas plataformas.

No entanto, outros serviços estão adotando o operador de braços abertos. Instacart, Uber e eBay colaboraram com o OpenAI para o lançamento do operador, permitindo que o agente navegue em seus sites em nome dos humanos.

Essas empresas estão se preparando para um futuro em que um subconjunto de interações do usuário é facilitado por um agente de IA.

“Os clientes estão usando o Instacart através de uma variedade de pontos de entrada diferentes”, disse Daniel Danker, diretor de produtos da Instacart, em entrevista ao TechCrunch. “Vemos o operador como, potencialmente, outro desses pontos de entrada”.

Deixar que o agente do Openai use o site da Instacart em nome de uma pessoa parece separar o Instacart de seus clientes. No entanto, Danker diz que a Instacart quer conhecer clientes onde quer que estejam.

“Nós realmente somos otimistas em relação à nossa crença, semelhante ao OpenAI, que os sistemas Agentic terão um grande impacto na maneira como os consumidores interagem com as propriedades digitais”, disse o diretor de IA do eBay, Nitzan Mekel-Bobrov, em entrevista ao TechCrunch.

Mesmo que os agentes da IA subam de popularidade, Mekel-Bobrov diz que espera que os usuários sempre cheguem ao site do eBay, observando que “os destinos on-line não vão a lugar nenhum”.

Questões de confiança

Eu tive alguns problemas em confiar no operador depois que ele alucinou algumas vezes e quase me custou várias centenas de dólares.

Por exemplo, pedi ao agente que me encontrasse uma garagem perto do meu novo apartamento. Acabou sugerindo duas garagens que, segundo ele, levaria apenas alguns minutos para caminhar.

Alucinação sobre as distâncias do local de estacionamento (Crédito: Maxwell Zeff/Openai)

Além de estar fora da minha faixa de preço, as garagens estavam realmente longe do meu apartamento. Um ficava a 20 minutos a pé e o outro a 30 minutos a pé. Acontece que o operador colocou o endereço errado.

É exatamente por isso que o OpenAI não fornece ao seu agente o número do seu cartão de crédito, senhas ou acesso ao email. Se o Openai não me deixasse intervir aqui, o operador teria desperdiçado centenas de dólares em uma vaga de estacionamento que eu não precisava.

Andulações como essa são um obstáculo importante para agentes autônomos realmente úteis – aqueles que podem tirar tarefas incômodas do seu prato. Ninguém confiará nos agentes se estiverem propensos a cometer erros básicos, especialmente erros com consequências do mundo real.

Com o operador, o OpenAI parece ter construído algumas ferramentas impressionantes para permitir que os sistemas de IA naveguem na web. Mas essas ferramentas não serão muito até que a IA subjacente possa fazer com segurança o que os usuários pedem para fazer. Até então, os humanos ficarão presos a agentes de assistência – não o contrário. E esse tipo de derrota o ponto.

Source

Saumya Agnihotri 6 hours ago

5 minutes read