Anthropic lança Sonnet 4.6 com janela de contexto expandida e ganhos em benchmarks

A Anthropic introduziu o Sonnet 4.6, a última iteração de seu modelo de tamanho médio, como parte de seu ritmo de atualização de quatro meses. A nova versão melhora a codificação, o seguimento de instruções e as capacidades de uso de computador e se torna o padrão para os usuários dos planos Free e Pro.

Visão Geral do Lançamento do Modelo

A Anthropic anunciou o lançamento do Sonnet 4.6, continuando seu cadence regular de quatro meses de atualizações de modelo. A nova versão é posicionada como a oferta padrão para os usuários dos planos Free e Pro, sinalizando uma ampla disponibilidade em toda a base de usuários da plataforma.

Melhorias Técnicas

O Sonnet 4.6 traz melhorias notáveis em três áreas-chave: assistência de codificação, seguimento de instruções e uso de computador. Essas melhorias visam tornar o modelo mais eficaz para desenvolvedores, trabalhadores do conhecimento e usuários que exigem execução de tarefas avançadas.

Na fase beta, o Sonnet 4.6 introduz uma janela de contexto capaz de processar um milhão de tokens. Essa capacidade é descrita como duas vezes o tamanho da maior janela oferecida anteriormente para os modelos Sonnet, fornecendo espaço suficiente para conter código-fonte completo, contratos longos ou dezenas de artigos de pesquisa em uma única solicitação.

Posicionamento no Portfólio da Anthropic

O lançamento ocorre apenas duas semanas após a Anthropic lançar o Opus 4.6, seu modelo de maior escala. Uma versão atualizada do modelo Haiku é esperada para seguir nas próximas semanas, indicando um lançamento coordenado da família de modelos da empresa.

Desempenho em Benchmarks

O Sonnet 4.6 alcança um novo conjunto de pontuações em benchmarks. Ele registra o desempenho superior no benchmark OS World para uso de computador e no SWE-Bench para tarefas de engenharia de software. Mais proeminentemente, o modelo atinge uma pontuação de 60,4% no benchmark ARC-AGI-2, uma métrica projetada para avaliar capacidades vinculadas à inteligência humana. Essa pontuação coloca o Sonnet 4.6 acima de modelos comparáveis, embora ainda atrás do Opus 4.6 da Anthropic, do Gemini 3 Deep Think da Google e de uma versão refinada do GPT 5.2 da OpenAI.

Implicações para os Usuários

Ao tornar o Sonnet 4.6 o modelo padrão para os planos Free e Pro, a Anthropic garante que um grande segmento de sua comunidade de usuários possa se beneficiar imediatamente da janela de contexto expandida e do desempenho refinado em tarefas de codificação e seguimento de instruções. A disponibilidade beta da janela de token expandida sugere que desenvolvedores e pesquisadores poderão trabalhar com entradas substancialmente maiores sem precisar dividir o conteúdo em várias solicitações.

Perspectiva Futura

A rápida sucessão de lançamentos de modelos da Anthropic, destacada pelo lançamento próximo do Sonnet 4.6 e do Opus 4.6, aponta para um ênfase estratégico na melhoria contínua e diversificação de suas ofertas de IA. A atualização esperada do Haiku irá ainda mais arredondar o portfólio, fornecendo opções personalizadas para diferentes requisitos de desempenho e custo.