Anthropic Relata que Metade das Chamadas de API do Claude Vêm de Engenharia de Software à medida que a Autonomia Cresce

Anthropic Reports Half of Claude API Calls Come from Software Engineering as Autonomy Grows

Pontos principais

  • Cerca de 50% das chamadas de API públicas do Claude vêm de tarefas de engenharia de software.
  • Atendimento ao cliente, vendas, finanças e comércio eletrônico cada um contribuem com apenas alguns por cento das chamadas.
  • O Claude Code agora opera autonomamente por mais de 45 minutos, contra menos de 25 minutos três meses antes.
  • O modelo faz perguntas esclarecedoras com mais frequência do que os humanos o interrompem.
  • A supervisão humana em tarefas de codificação de alta complexidade é de cerca de 67%, versus 87% em tarefas de API simples.
  • O Claude faz cerca de duas vezes mais perguntas em tarefas complexas em comparação com as simples.
  • A Anthropic destaca a importância de treinar modelos para reconhecer a incerteza e fazer perguntas esclarecedoras.
  • A empresa desencoraja a aprovação manual obrigatória para cada ação, citando o atrito adicionado sem ganhos de segurança.

Anthropic afirma que cerca de metade de todas as chamadas de ferramentas de API públicas para o modelo Claude são originadas de cargas de trabalho de engenharia de software, enquanto outras áreas, como atendimento ao cliente, vendas, finanças e comércio eletrônico, representam apenas alguns por cento cada. O Claude Code agora opera autonomamente por mais de 45 minutos, contra menos de 25 minutos três meses antes. O modelo faz perguntas de esclarecimento com mais frequência do que os humanos o interrompem, e a supervisão humana diminui em tarefas de codificação de alta complexidade. A Anthropic destaca a importância de treinar modelos para reconhecer a incerteza e alerta contra aprovações manuais obrigatórias que adicionam atrito sem melhorar a segurança.

Descobertas da Anthropic sobre o Uso do Claude

A Anthropic divulgou que cerca de metade de todas as chamadas de ferramentas de API públicas para o modelo Claude são geradas por cargas de trabalho de engenharia de software. Em contraste, setores como atendimento ao cliente, vendas, finanças e comércio eletrônico cada um representa apenas alguns pontos percentuais das chamadas totais. Essa concentração sugere que os desenvolvedores são os principais usuários do Claude, empregando o modelo muito mais do que equipes em outras funções de negócios.

Deslocamento em Direção à IA Autônoma

O Claude Code agora opera autonomamente por períodos mais longos do que nunca. A sessão autônoma média subiu para mais de 45 minutos, em comparação com menos de 25 minutos apenas três meses atrás. A OpenAI observou uma tendência semelhante, notando que o aumento da autonomia não está limitado aos seus novos modelos de alto desempenho, mas reflete um movimento mais amplo em direção à IA agente em toda a indústria.

Supervisão Humana Varia de Acordo com a Complexidade da Tarefa

Quando o Claude lida com tarefas de codificação, o nível de supervisão humana depende fortemente da complexidade da tarefa. Para trabalhos de alta complexidade — como descoberta de exploits ou escrita de compiladores — a supervisão humana gira em torno de 67 por cento. Tarefas mais simples, como chamadas de API básicas, veem uma supervisão mais alta, de cerca de 87 por cento. Além disso, o Claude faz cerca de duas vezes mais perguntas esclarecedoras em tarefas complexas em comparação com as mais simples, indicando uma tendência a buscar mais informações quando o problema é mais difícil.

Implicações para a Segurança e Interação da IA

A Anthropic destaca a importância de treinar modelos para reconhecer a incerteza e fazer perguntas esclarecedoras proativamente. A empresa também aconselha contra a exigência de aprovação manual para cada ação do modelo, argumentando que tais requisitos adicionam atrito sem entregar um aumento necessário na segurança. Ao incentivar os modelos a pausar e buscar esclarecimentos, a Anthropic busca construir confiança enquanto reduz a necessidade de intervenção humana constante.

No geral, os dados apontam para uma crescente dependência do Claude para tarefas de engenharia de software, uma capacidade expandida para operação autônoma e uma abordagem matizada para a supervisão humana que equilibra eficiência com segurança.

#Anthropic#Claude#Agentes de IA#engenharia de software#IA autônoma#chamadas de ferramentas#supervisão humana#segurança da IA#IA agente#geração de código

Também disponível em:

Anthropic Relata que Metade das Chamadas de API do Claude Vêm de Engenharia de Software à medida que a Autonomia Cresce | AI News