Anthropic Relata que Metade das Chamadas de API do Claude Vêm de Engenharia de Software à medida que a Autonomia Cresce

Anthropic afirma que cerca de metade de todas as chamadas de ferramentas de API públicas para o modelo Claude são originadas de cargas de trabalho de engenharia de software, enquanto outras áreas, como atendimento ao cliente, vendas, finanças e comércio eletrônico, representam apenas alguns por cento cada. O Claude Code agora opera autonomamente por mais de 45 minutos, contra menos de 25 minutos três meses antes. O modelo faz perguntas de esclarecimento com mais frequência do que os humanos o interrompem, e a supervisão humana diminui em tarefas de codificação de alta complexidade. A Anthropic destaca a importância de treinar modelos para reconhecer a incerteza e alerta contra aprovações manuais obrigatórias que adicionam atrito sem melhorar a segurança.

Descobertas da Anthropic sobre o Uso do Claude

A Anthropic divulgou que cerca de metade de todas as chamadas de ferramentas de API públicas para o modelo Claude são geradas por cargas de trabalho de engenharia de software. Em contraste, setores como atendimento ao cliente, vendas, finanças e comércio eletrônico cada um representa apenas alguns pontos percentuais das chamadas totais. Essa concentração sugere que os desenvolvedores são os principais usuários do Claude, empregando o modelo muito mais do que equipes em outras funções de negócios.

Deslocamento em Direção à IA Autônoma

O Claude Code agora opera autonomamente por períodos mais longos do que nunca. A sessão autônoma média subiu para mais de 45 minutos, em comparação com menos de 25 minutos apenas três meses atrás. A OpenAI observou uma tendência semelhante, notando que o aumento da autonomia não está limitado aos seus novos modelos de alto desempenho, mas reflete um movimento mais amplo em direção à IA agente em toda a indústria.

Supervisão Humana Varia de Acordo com a Complexidade da Tarefa

Quando o Claude lida com tarefas de codificação, o nível de supervisão humana depende fortemente da complexidade da tarefa. Para trabalhos de alta complexidade — como descoberta de exploits ou escrita de compiladores — a supervisão humana gira em torno de 67 por cento. Tarefas mais simples, como chamadas de API básicas, veem uma supervisão mais alta, de cerca de 87 por cento. Além disso, o Claude faz cerca de duas vezes mais perguntas esclarecedoras em tarefas complexas em comparação com as mais simples, indicando uma tendência a buscar mais informações quando o problema é mais difícil.

Implicações para a Segurança e Interação da IA

A Anthropic destaca a importância de treinar modelos para reconhecer a incerteza e fazer perguntas esclarecedoras proativamente. A empresa também aconselha contra a exigência de aprovação manual para cada ação do modelo, argumentando que tais requisitos adicionam atrito sem entregar um aumento necessário na segurança. Ao incentivar os modelos a pausar e buscar esclarecimentos, a Anthropic busca construir confiança enquanto reduz a necessidade de intervenção humana constante.

No geral, os dados apontam para uma crescente dependência do Claude para tarefas de engenharia de software, uma capacidade expandida para operação autônoma e uma abordagem matizada para a supervisão humana que equilibra eficiência com segurança.

Anthropic Relata que Metade das Chamadas de API do Claude Vêm de Engenharia de Software à medida que a Autonomia Cresce

Pontos principais

Descobertas da Anthropic sobre o Uso do Claude

Deslocamento em Direção à IA Autônoma

Supervisão Humana Varia de Acordo com a Complexidade da Tarefa

Implicações para a Segurança e Interação da IA

Também disponível em: