AWS Expande Ferramentas de LLM Personalizadas com SageMaker Sem Servidor e Melhorias no Bedrock

Pontos principais
- A AWS lançou a personalização de modelo sem servidor no SageMaker, eliminando a necessidade de os desenvolvedores gerenciarem recursos de computação.
- Duas opções de fluxo de trabalho estão disponíveis: uma interface de ponto-e-clique e uma pré-visualização de agente dirigida por linguagem natural.
- O Bedrock agora suporta o ajuste fino por reforço, permitindo funções de recompensa personalizadas ou fluxos de trabalho pré-definidos.
- O Nova Forge oferece um serviço gerenciado para construir modelos Nova personalizados por uma taxa anual fixa de $100.000.
- A personalização funciona com os modelos Amazon Nova, DeepSeek e Meta Llama que têm pesos públicos.
- As melhorias visam ajudar as empresas a diferenciar suas soluções de IA em um mercado dominado por outros grandes fornecedores.
A Amazon Web Services introduziu uma série de novas capacidades visando simplificar a criação de modelos de linguagem grandes personalizados para clientes empresariais. Na conferência re:Invent, a AWS lançou a personalização de modelo sem servidor no SageMaker, oferecendo fluxos de trabalho de ponto-e-clique e dirigidos por linguagem natural, e anunciou o ajuste fino por reforço no Bedrock. A empresa também lançou o Nova Forge, um serviço que constrói modelos Nova personalizados por uma taxa anual fixa.
Personalização de Modelo Sem Servidor no SageMaker
A AWS anunciou a personalização de modelo sem servidor como parte de sua plataforma de IA SageMaker, permitindo que os desenvolvedores comecem a construir modelos de linguagem grandes sem gerenciar recursos de computação subjacentes. Os usuários podem escolher entre uma interface de ponto-e-clique autoorientada ou uma experiência liderada por um agente que aceita prompts de linguagem natural. O recurso liderado por agente está sendo lançado em pré-visualização. Na prática, uma organização de saúde pode fornecer dados rotulados, selecionar uma técnica de ajuste fino e deixar que o SageMaker ajuste automaticamente o modelo para melhor entender a terminologia médica.
Ajuste Fino por Reforço no Bedrock
Complementando as atualizações do SageMaker, a AWS introduziu o ajuste fino por reforço dentro de seu serviço Bedrock. Os desenvolvedores podem definir uma função de recompensa personalizada ou selecionar um fluxo de trabalho pré-definido, e o Bedrock executará todo o processo de personalização do modelo do início ao fim. Essa capacidade estende a flexibilidade do Bedrock além do ajuste fino padrão, permitindo um comportamento de modelo mais nuances alinhado com objetivos comerciais específicos.
Nova Forge: Serviço de Modelo Personalizado de Chave na Mão
Durante a keynote, a AWS lançou o Nova Forge, um serviço gerenciado que constrói modelos Nova personalizados para clientes empresariais por um preço fixo de $100.000 por ano. A oferta é posicionada para clientes que buscam uma solução de IA diferenciada sem investir no ciclo de desenvolvimento completo. A AWS enfatiza que os modelos personalizados permitem que as empresas ajustem o desempenho, a marca e o tratamento de dados para seus casos de uso exclusivos.
Modelos Suportados e Opções de Código Aberto
Os novos recursos de personalização são compatíveis com os modelos Nova proprietários da Amazon, bem como com modelos de código aberto selecionados que têm pesos públicos disponíveis, incluindo DeepSeek e Meta Llama. Essa amplitude de suporte dá aos desenvolvedores a liberdade de escolher um modelo base que se alinha com suas preferências técnicas e de licenciamento.
Implicações Estratégicas
Pesquisas de indústria indicam que as empresas atualmente favorecem modelos de Anthropic, OpenAI e Google Gemini. Ao reduzir as barreiras para a criação de modelos personalizados e oferecer um serviço gerenciado como o Nova Forge, a AWS visa capturar uma participação maior do mercado de IA empresarial. A capacidade de diferenciar soluções de IA em cima de modelos de fundação compartilhados pode fornecer uma vantagem competitiva para os clientes da AWS que buscam capacidades exclusivas em setores movimentados.