DeepMind Apresenta Agente de IA SIMA 2 Capaz de Aprender Novos Jogos de Vídeo

Pontos principais
- DeepMind lança o SIMA 2, um agente de IA que constrói sobre o sistema SIMA anterior.
- O SIMA 2 incorpora o modelo Gemini do Google para raciocínio avançado e interpretação de metas.
- O agente pode operar em jogos de vídeo que nunca encontrou, demonstrando forte generalização.
- Disponível como uma pré-visualização de pesquisa limitada para acadêmicos e desenvolvedores.
- A DeepMind posiciona o SIMA 2 como um terreno de treinamento para aplicações de IA do mundo real, e não como uma ferramenta de jogos de consumo.
- A pesquisadora sênior Jane Wang chama o sistema de um passo valioso em direção ao deploy no mundo real.
- O cientista de pesquisa Joe Marino cita a adaptabilidade do agente como um passo fundamental em direção à IAG.
- O lançamento destaca o avanço da DeepMind em relação a concorrentes como Meta, OpenAI e Anthropic.
DeepMind introduziu o SIMA 2, um agente de IA avançado que expande o sistema SIMA anterior incorporando o modelo Gemini do Google. O novo agente pode interpretar metas de alto nível do usuário, realizar raciocínio complexo e executar ações em uma variedade de jogos de vídeo, incluindo títulos que nunca encontrou. Lançado como uma pré-visualização de pesquisa limitada para acadêmicos e desenvolvedores, o SIMA 2 é posicionado como um terreno de treinamento para aplicações do mundo real, e não como uma ferramenta de jogos de consumo. Os funcionários da DeepMind descrevem o desenvolvimento como um passo significativo em direção à inteligência artificial geral, com implicações potenciais para robótica e encarnação de IA.
Contexto
DeepMind, a divisão de pesquisa de IA do Google, construiu sobre seu sistema Scalable Instructable Multiworld Agent (SIMA) anterior - lançado em março de 2024 - com o lançamento do SIMA 2. Este sistema de próxima geração integra a inteligência artificial Gemini do Google pela primeira vez, permitindo que o agente vá além do simples seguimento de instruções em direção a uma compreensão mais profunda das intenções do usuário.
Recursos e Capacidades Chave
O SIMA 2 demonstra a capacidade de entender metas de alto nível fornecidas pelo usuário, realizar raciocínio complexo para alcançar essas metas e executar ações habilmente em ambientes de jogos de vídeo. Notavelmente, o agente pode operar em jogos que nunca viu antes, mostrando um nível de generalização que os pesquisadores consideram essencial para aplicações de IA mais amplas. O sistema está sendo oferecido atualmente como uma pré-visualização de pesquisa limitada para acadêmicos e desenvolvedores selecionados, permitindo que a comunidade explore seu potencial enquanto coleta feedback.
Propósito e Visão
De acordo com os funcionários da DeepMind, o objetivo principal do SIMA 2 não é criar um assistente de jogos de consumo. Em vez disso, a cientista de pesquisa sênior Jane Wang descreveu o agente como "um terreno de treinamento realmente grande" para transferir habilidades aprendidas para contextos do mundo real. Testando o comportamento da IA em mundos virtuais interativos, a DeepMind espera acelerar o progresso em direção à inteligência artificial geral (IAG) e, em última análise, informar o desenvolvimento de robôs de propósito geral.
Implicações para IAG e o Paisagem de IA
O blog da DeepMind apresenta o lançamento como um "passo significativo" em direção à IAG, enfatizando sua relevância para robótica e encarnação de IA. O cientista de pesquisa Joe Marino destacou a capacidade do agente de atuar em ambientes virtuais e se adaptar a cenários anteriormente não vistos como "fundamental" para construir sistemas de IA mais versáteis. O anúncio ocorre em meio a uma competição intensificada entre as principais organizações de IA - incluindo Meta, OpenAI e Anthropic - cada uma lutando para alcançar avanços na inteligência geral.
Próximos Passos
Embora o SIMA 2 esteja atualmente limitado a uma audiência de pesquisa, a DeepMind planeja continuar refinando a tecnologia e expandindo sua acessibilidade. Iterações futuras podem fechar ainda mais a lacuna entre a proficiência virtual e a autonomia do mundo real, movendo o campo mais próximo do objetivo de longo prazo de criar agentes de IA adaptáveis e de propósito geral.