Mistral AI Lança Devstral 2, Modelo de Codificação e Mistral Vibe CLI

A startup francesa de IA, Mistral AI, apresentou Devstral 2, um modelo de codificação de 123 bilhões de parâmetros que alcançou uma pontuação de 72,2% no benchmark SWE-bench Verified. Além disso, a empresa lançou a interface de linha de comando Mistral Vibe, que permite que desenvolvedores interajam com os modelos Devstral diretamente no terminal.

Novo Modelo de Codificação de Pesos Abertos

A startup francesa de inteligência artificial, Mistral AI, anunciou o lançamento de Devstral 2, um modelo de codificação de pesos abertos construído com 123 bilhões de parâmetros. O modelo foi projetado para operar como parte de um agente de engenharia de software autônomo e apresentou um desempenho forte no benchmark SWE-bench Verified, alcançando uma pontuação de 72,2%. Isso coloca Devstral 2 entre os modelos de pesos abertos de melhor desempenho para resolver problemas do mundo real no GitHub.

Mistral Vibe CLI

Em conjunto com o modelo, a Mistral introduziu um novo aplicativo de desenvolvimento chamado Mistral Vibe. A ferramenta é uma interface de linha de comando (CLI) semelhante a ofertas existentes, como Claude Code, OpenAI Codex e Gemini CLI. Os desenvolvedores podem interagir com os modelos Devstral diretamente do terminal, onde a CLI pode scanear estruturas de arquivos e status do Git para manter o contexto em todo o projeto, fazer alterações em vários arquivos e executar comandos de shell de forma autônoma. A Mistral lançou a CLI sob a licença Apache 2.0.

Contexto do Benchmark

O benchmark SWE-bench Verified testa sistemas de IA em 500 problemas de engenharia de software reais extraídos de repositórios Python populares no GitHub. Os modelos devem ler descrições de problemas, navegar pelas bases de código e gerar patches de trabalho que passem nos testes unitários. Embora muitas tarefas envolvam correções de bugs relativamente simples, o benchmark permanece como uma das poucas maneiras padronizadas de comparar modelos de codificação.

Devstral Small 2

Além de Devstral 2, a Mistral também lançou Devstral Small 2, uma versão de 24 bilhões de parâmetros do modelo. Esse modelo menor alcançou uma pontuação de 68% no mesmo benchmark e foi projetado para executar localmente em hardware de consumidor, como um laptop, sem necessidade de conexão com a internet. Ambos os modelos Devstral 2 e Devstral Small 2 suportam uma janela de contexto de 256.000 tokens, permitindo que eles processem bases de código moderadamente grandes.

Licenciamento e Disponibilidade

Devstral 2 é lançado sob uma licença MIT modificada, enquanto Devstral Small 2 é oferecido sob a licença Apache 2.0 mais permissiva. A estratégia de licenciamento de código aberto reflete o compromisso da Mistral em tornar ferramentas de codificação de IA poderosas amplamente acessíveis a desenvolvedores e pesquisadores.