Google Reorganiza Equipe de Agente de Navegador à Medida que a Indústria se Desloca em Direção a Agentes de Codificação e Baseados em Terminal com Inteligência Artificial

Google Reshuffles Browser Agent Team as Industry Shifts Toward Coding and Terminal‑Based AI Agents

Pontos principais

  • A Google reatribui funcionários do Projeto Mariner a projetos de maior prioridade e integra sua tecnologia ao Gemini Agent.
  • O foco da indústria está se deslocando em direção a agentes baseados em terminal, como o OpenClaw e o Claude Code, para maior eficiência.
  • Os agentes de automação de navegador da Google, OpenAI e Perplexity têm lutado para alcançar adoção em massa.
  • Startups, como a Standard Intelligence, afirmam ganhos de eficiência significativos ao treinar modelos de uso de computador em dados de vídeo.
  • Especialistas preveem uma divisão 80/20 entre soluções de terminal e automação de GUI para aplicações legadas.
  • Os agentes de codificação que podem editar arquivos e gerar software personalizado estão ganhando tração em laboratórios de inteligência artificial.
  • A Google e a OpenAI imaginam agentes de consumidores lidando com tarefas, como pedidos de compras e reservas de restaurantes.

Google está reorganizando a equipe por trás do Projeto Mariner, seu agente de automação de navegador experimental, à medida que a empresa integra a tecnologia em produtos de agentes mais amplos, como o Gemini Agent. A mudança reflete uma mudança mais ampla na indústria em direção a agentes baseados em terminal mais eficientes, como o OpenClaw e o Claude Code, e em direção a agentes de codificação que podem manipular software e arquivos.

Mudanças na Equipe da Google

A Google está reestruturando o grupo que construiu o Projeto Mariner, um protótipo de inteligência artificial projetado para navegar no navegador Chrome e realizar tarefas em nome do usuário. De acordo com dois insiders, vários membros da equipe do Google Labs que contribuíram para o protótipo de pesquisa foram reatribuídos a projetos de maior prioridade. Um porta-voz da Google confirmou a realocação, observando que as capacidades de uso de computador desenvolvidas sob o Projeto Mariner serão incorporadas à estratégia geral de agentes da empresa e incorporadas a produtos como o recentemente lançado Gemini Agent.

Contexto da Indústria: Ascensão dos Agentes Baseados em Terminal

A mudança interna ocorre à medida que laboratórios de inteligência artificial em todo o Vale do Silício respondem ao surgimento de agentes poderosos como o OpenClaw. O CEO da Nvidia, Jensen Huang, comparou o OpenClaw a um novo sistema operacional para "computadores agênticos", instando todas as empresas a desenvolver uma estratégia para o OpenClaw. Esses agentes diferem das ferramentas de automação de navegador anteriores por controlar computadores por meio de terminais baseados em texto, um método que os pesquisadores dizem ser muito mais eficiente do que processar capturas de tela de interfaces gráficas.

Desafios para os Agentes de Navegador

Os agentes de navegador inicialmente geraram entusiasmo em eventos como a conferência I/O da Google, onde o CEO Sundar Pichai destacou o Projeto Mariner como um possível próximo grande investimento. Produtos da OpenAI e da Perplexity prometiam automatizar tarefas online clicando, rolando e preenchendo formulários. No entanto, a adoção de usuários está atrasada. O agente de navegador Comet da Perplexity registrou cerca de 2,8 milhões de usuários ativos semanais em dezembro de 2025, enquanto o agente ChatGPT da OpenAI caiu abaixo de um milhão de usuários ativos semanais nos últimos meses. Em comparação com os centenas de milhões de usuários ativos semanais do ChatGPT, o uso de agentes de navegador permanece como uma pequena fração do engajamento geral de inteligência artificial.

Ganhos de Eficiência com Interação de Terminal

Os especialistas argumentam que os agentes baseados em terminal requerem menos etapas computacionais porque tanto os agentes quanto os modelos de linguagem subjacentes operam em texto. Kian Katanforoosh, CEO da plataforma de treinamento de inteligência artificial Workera, explicou que trabalhar com um terminal pode ser "10 a 100 vezes menos etapas" do que processar capturas de tela visuais. As startups também estão explorando novas abordagens para melhorar a eficiência. A Standard Intelligence lançou um modelo de uso de computador treinado em fluxos de vídeo, alegando um aumento de eficiência 50 vezes maior do que os modelos anteriores baseados em capturas de tela e demonstrando a capacidade ao dirigir brevemente um carro de forma autônoma em São Francisco.

O Papel Continuado dos Agentes de GUI

Apesar do momento dos agentes baseados em terminal, alguns líderes veem uma necessidade duradoura de automação de interface gráfica de usuário (GUI). Ang Li, CEO da Simular e ex-pesquisador do Google DeepMind, descreveu uma "divisão 80/20" onde a maioria dos problemas pode ser resolvida por meio do terminal, mas certas aplicações legadas - como portais de seguros de saúde - ainda requerem interação de GUI porque falta APIs acessíveis.

Mudança em Direção a Agentes de Codificação

Em todo o cenário de inteligência artificial, as empresas estão apostando cada vez mais em agentes de codificação que podem não apenas operar aplicações, mas também modificar arquivos e gerar software personalizado. Esses agentes podem, por exemplo, ingerir extratos bancários e criar um painel de orçamento personalizado. A OpenAI planeja alimentar agentes de propósito geral dentro do ChatGPT com sua tecnologia Codex, enquanto a Anthropic lançou o Claude Cowork, um desmembramento do Claude Code que não requer um terminal. A Perplexity, que anteriormente se concentrou em agentes de navegador, recentemente introduziu um produto chamado Computador Pessoal que se alinha com essa tendência de agente de codificação.

Implicações para os Consumidores

Tanto a Google quanto a OpenAI sugeriram que os agentes de consumidores futuros poderiam lidar com tarefas cotidianas, como pedir compras no Instacart ou reservar uma mesa de jantar. Embora essas utilizações pareçam convenientes, a adoção generalizada pode depender da confiança dos usuários de que os agentes realizarão tarefas de forma confiável sem erros. A trajetória atual da indústria indica um equilíbrio: manter capacidades baseadas em GUI para tarefas legadas, enquanto expande as funcionalidades de agente baseado em terminal e de codificação mais eficientes.

#Google#agentes de inteligência artificial#Projeto Mariner#Gemini Agent#OpenClaw#automação de navegador#agentes de codificação#agentes baseados em terminal#Nvidia#tendências da indústria de inteligência artificial

Também disponível em:

Google Reorganiza Equipe de Agente de Navegador à Medida que a Indústria se Desloca em Direção a Agentes de Codificação e Baseados em Terminal com Inteligência Artificial | AI News