Anthropic lança Sonnet 4.6 com janela de contexto expandida e ganhos em benchmarks

Pontos principais
- A Anthropic lançou o Sonnet 4.6 como o modelo de tamanho médio mais recente.
- A atualização segue um ciclo de lançamento de quatro meses.
- O Sonnet 4.6 se torna o modelo padrão para os usuários dos planos Free e Pro.
- A versão beta inclui uma janela de contexto de um milhão de tokens, duas vezes o máximo anterior.
- As melhorias visam a codificação, o seguimento de instruções e o uso de computador.
- O lançamento ocorre duas semanas após o Opus 4.6; a atualização do Haiku é esperada em breve.
- As pontuações em benchmarks incluem resultados superiores no OS World e no SWE-Bench.
- Alcança uma pontuação de 60,4% no ARC-AGI-2, superando a maioria dos modelos comparáveis.
- Ainda está atrás do Opus 4.6, do Gemini 3 Deep Think e do GPT 5.2 refinado.
A Anthropic introduziu o Sonnet 4.6, a última iteração de seu modelo de tamanho médio, como parte de seu ritmo de atualização de quatro meses. A nova versão melhora a codificação, o seguimento de instruções e as capacidades de uso de computador e se torna o padrão para os usuários dos planos Free e Pro.
Visão Geral do Lançamento do Modelo
A Anthropic anunciou o lançamento do Sonnet 4.6, continuando seu cadence regular de quatro meses de atualizações de modelo. A nova versão é posicionada como a oferta padrão para os usuários dos planos Free e Pro, sinalizando uma ampla disponibilidade em toda a base de usuários da plataforma.
Melhorias Técnicas
O Sonnet 4.6 traz melhorias notáveis em três áreas-chave: assistência de codificação, seguimento de instruções e uso de computador. Essas melhorias visam tornar o modelo mais eficaz para desenvolvedores, trabalhadores do conhecimento e usuários que exigem execução de tarefas avançadas.
Na fase beta, o Sonnet 4.6 introduz uma janela de contexto capaz de processar um milhão de tokens. Essa capacidade é descrita como duas vezes o tamanho da maior janela oferecida anteriormente para os modelos Sonnet, fornecendo espaço suficiente para conter código-fonte completo, contratos longos ou dezenas de artigos de pesquisa em uma única solicitação.
Posicionamento no Portfólio da Anthropic
O lançamento ocorre apenas duas semanas após a Anthropic lançar o Opus 4.6, seu modelo de maior escala. Uma versão atualizada do modelo Haiku é esperada para seguir nas próximas semanas, indicando um lançamento coordenado da família de modelos da empresa.
Desempenho em Benchmarks
O Sonnet 4.6 alcança um novo conjunto de pontuações em benchmarks. Ele registra o desempenho superior no benchmark OS World para uso de computador e no SWE-Bench para tarefas de engenharia de software. Mais proeminentemente, o modelo atinge uma pontuação de 60,4% no benchmark ARC-AGI-2, uma métrica projetada para avaliar capacidades vinculadas à inteligência humana. Essa pontuação coloca o Sonnet 4.6 acima de modelos comparáveis, embora ainda atrás do Opus 4.6 da Anthropic, do Gemini 3 Deep Think da Google e de uma versão refinada do GPT 5.2 da OpenAI.
Implicações para os Usuários
Ao tornar o Sonnet 4.6 o modelo padrão para os planos Free e Pro, a Anthropic garante que um grande segmento de sua comunidade de usuários possa se beneficiar imediatamente da janela de contexto expandida e do desempenho refinado em tarefas de codificação e seguimento de instruções. A disponibilidade beta da janela de token expandida sugere que desenvolvedores e pesquisadores poderão trabalhar com entradas substancialmente maiores sem precisar dividir o conteúdo em várias solicitações.
Perspectiva Futura
A rápida sucessão de lançamentos de modelos da Anthropic, destacada pelo lançamento próximo do Sonnet 4.6 e do Opus 4.6, aponta para um ênfase estratégico na melhoria contínua e diversificação de suas ofertas de IA. A atualização esperada do Haiku irá ainda mais arredondar o portfólio, fornecendo opções personalizadas para diferentes requisitos de desempenho e custo.