Anthropic lança Sonnet 4.6 com janela de contexto expandida e ganhos em benchmarks

Anthropic launches Sonnet 4.6 with expanded context window and benchmark gains

Pontos principais

  • A Anthropic lançou o Sonnet 4.6 como o modelo de tamanho médio mais recente.
  • A atualização segue um ciclo de lançamento de quatro meses.
  • O Sonnet 4.6 se torna o modelo padrão para os usuários dos planos Free e Pro.
  • A versão beta inclui uma janela de contexto de um milhão de tokens, duas vezes o máximo anterior.
  • As melhorias visam a codificação, o seguimento de instruções e o uso de computador.
  • O lançamento ocorre duas semanas após o Opus 4.6; a atualização do Haiku é esperada em breve.
  • As pontuações em benchmarks incluem resultados superiores no OS World e no SWE-Bench.
  • Alcança uma pontuação de 60,4% no ARC-AGI-2, superando a maioria dos modelos comparáveis.
  • Ainda está atrás do Opus 4.6, do Gemini 3 Deep Think e do GPT 5.2 refinado.

A Anthropic introduziu o Sonnet 4.6, a última iteração de seu modelo de tamanho médio, como parte de seu ritmo de atualização de quatro meses. A nova versão melhora a codificação, o seguimento de instruções e as capacidades de uso de computador e se torna o padrão para os usuários dos planos Free e Pro.

Visão Geral do Lançamento do Modelo

A Anthropic anunciou o lançamento do Sonnet 4.6, continuando seu cadence regular de quatro meses de atualizações de modelo. A nova versão é posicionada como a oferta padrão para os usuários dos planos Free e Pro, sinalizando uma ampla disponibilidade em toda a base de usuários da plataforma.

Melhorias Técnicas

O Sonnet 4.6 traz melhorias notáveis em três áreas-chave: assistência de codificação, seguimento de instruções e uso de computador. Essas melhorias visam tornar o modelo mais eficaz para desenvolvedores, trabalhadores do conhecimento e usuários que exigem execução de tarefas avançadas.

Na fase beta, o Sonnet 4.6 introduz uma janela de contexto capaz de processar um milhão de tokens. Essa capacidade é descrita como duas vezes o tamanho da maior janela oferecida anteriormente para os modelos Sonnet, fornecendo espaço suficiente para conter código-fonte completo, contratos longos ou dezenas de artigos de pesquisa em uma única solicitação.

Posicionamento no Portfólio da Anthropic

O lançamento ocorre apenas duas semanas após a Anthropic lançar o Opus 4.6, seu modelo de maior escala. Uma versão atualizada do modelo Haiku é esperada para seguir nas próximas semanas, indicando um lançamento coordenado da família de modelos da empresa.

Desempenho em Benchmarks

O Sonnet 4.6 alcança um novo conjunto de pontuações em benchmarks. Ele registra o desempenho superior no benchmark OS World para uso de computador e no SWE-Bench para tarefas de engenharia de software. Mais proeminentemente, o modelo atinge uma pontuação de 60,4% no benchmark ARC-AGI-2, uma métrica projetada para avaliar capacidades vinculadas à inteligência humana. Essa pontuação coloca o Sonnet 4.6 acima de modelos comparáveis, embora ainda atrás do Opus 4.6 da Anthropic, do Gemini 3 Deep Think da Google e de uma versão refinada do GPT 5.2 da OpenAI.

Implicações para os Usuários

Ao tornar o Sonnet 4.6 o modelo padrão para os planos Free e Pro, a Anthropic garante que um grande segmento de sua comunidade de usuários possa se beneficiar imediatamente da janela de contexto expandida e do desempenho refinado em tarefas de codificação e seguimento de instruções. A disponibilidade beta da janela de token expandida sugere que desenvolvedores e pesquisadores poderão trabalhar com entradas substancialmente maiores sem precisar dividir o conteúdo em várias solicitações.

Perspectiva Futura

A rápida sucessão de lançamentos de modelos da Anthropic, destacada pelo lançamento próximo do Sonnet 4.6 e do Opus 4.6, aponta para um ênfase estratégico na melhoria contínua e diversificação de suas ofertas de IA. A atualização esperada do Haiku irá ainda mais arredondar o portfólio, fornecendo opções personalizadas para diferentes requisitos de desempenho e custo.

#Anthropic#Sonnet 4.6#modelo de IA#modelo de linguagem grande#janela de contexto#pontuações em benchmarks#IA de codificação#seguimento de instruções#computador#Opus 4.6#Gemini 3 Deep Think#GPT 5.2

Também disponível em: