Amazon Bedrock AgentCore e MCP stateful: o que muda

TL;DR

A Amazon Bedrock AgentCore Runtime agora suporta features stateful de MCP, incluindo elicitation, sampling e progress notifications, o que muda a forma como agentes interagem com tools longas e fluxos multi-turn. O impacto prático é simples: em vez de tratar cada chamada como isolada, você consegue manter contexto de sessão e coordenar ida e volta com o cliente durante a execução.

O que a AWS adicionou

O anúncio oficial da AWS sobre o suporte a MCP stateful no AgentCore Runtime descreve três capacidades centrais: elicitation, sampling e progress notifications. A documentação também mostra que a sessão passa a ser amarrada por Mcp-Session-Id, com continuidade entre chamadas enquanto a sessão permanece ativa.

Esse recorte importa porque MCP deixa de ser só uma camada de tool calling “uma chamada, uma resposta”. Com estado, o servidor pode pedir dados faltantes no meio do fluxo, solicitar geração ao cliente quando fizer sentido e emitir atualizações enquanto executa passos demorados.

Como cada recurso funciona

Elicitation: pedir informação no meio do fluxo

Na prática, elicitation é o mecanismo que permite ao servidor pausar uma tarefa e solicitar um dado que ainda não foi informado. A documentação da AWS usa um cenário de travel booking agent, em que o fluxo precisa coletar informação adicional antes de concluir a ação, e retomar a execução depois da resposta do cliente.

Esse padrão reduz a necessidade de “chutar” campos ausentes ou obrigar o usuário a reiniciar tudo. Em interfaces agentivas, isso melhora bastante a experiência quando a tarefa depende de um detalhe pequeno, como destino, data ou preferência que só aparece depois do primeiro passo.

Sampling: deixar o cliente gerar parte do conteúdo

O recurso de sampling permite que o servidor solicite ao cliente a geração de texto via LLM em vez de produzir tudo localmente. O material oficial da AWS descreve esse uso para conteúdo personalizado e variações de resposta, o que encaixa bem em sistemas em que o cliente já controla políticas, temperatura ou modelo preferido.

Esse desenho é útil quando o servidor executa uma etapa operacional e quer que a camada do cliente faça a parte criativa ou contextual. Em uma arquitetura corporativa, isso pode ajudar a separar responsabilidade entre lógica de negócio e geração de linguagem.

Progress notifications: visibilidade em operações longas

As progress notifications resolvem um problema bem comum em autosserviço: o usuário não sabe se a operação travou ou só está demorando. No anúncio, a AWS cita exemplos como busca de voos e processamento de reservas, com updates ao longo da execução.

Para times de produto, isso é relevante porque evita UX opaca em tarefas longas. Em vez de esperar o resultado final, o cliente pode exibir estados intermediários e reduzir abandono de fluxo.

Sessão, afinidade e o papel do `Mcp-Session-Id`

A documentação do contrato de protocolo do AgentCore mostra que o estado é mantido usando Mcp-Session-Id. Esse identificador atua como chave da sessão e preserva a continuidade entre trocas sucessivas, além de sustentar a afinidade com a mesma microVM durante a execução.

Esse detalhe é importante para quem vem de arquitetura stateless. Sem o identificador correto, a aplicação perde o contexto e pode precisar reinicializar o fluxo. A própria documentação informa que, quando a sessão expira, novas requisições podem retornar 404, exigindo novo início de sessão.

Esta seção descreve a versão atual do AgentCore Runtime e do contrato MCP associado. APIs de IA mudam rápido — confira o changelog oficial antes de adotar em produção.

O que muda na arquitetura de agentes

O ganho principal está em tornar o tool execution mais conversacional sem forçar o desenvolvedor a construir um protocolo paralelo por cima do MCP. Isso simplifica a orquestração de passos que dependem de ida e volta entre servidor e cliente, especialmente quando há coleta de dados, geração assistida ou etapas demoradas.

Também há implicações para observabilidade. Quando o servidor emite progresso e preserva sessão, fica mais fácil correlacionar o caminho da interação e entender em que etapa o usuário saiu do fluxo. Em ambientes de produção, isso ajuda a depurar experiências agentivas com menos suposição.

Exemplo de uso em um fluxo interativo

Imagine um agente de viagens corporativas que começa a reservar uma passagem, percebe que falta o aeroporto de origem e usa elicitation para pedir esse dado. Depois, durante a busca, emite progresso enquanto consulta opções e, no fim, usa sampling para montar um texto de confirmação com o tom da empresa definida pelo cliente.

O valor não está em “ter IA no meio”, mas em reduzir retrabalho e manter o fluxo vivo. Em vez de fazer o usuário voltar ao início para corrigir um campo, o sistema avança com estado e decide o próximo passo com mais contexto.

Por que isso importa pro dev brasileiro

Para quem desenvolve no Brasil, esse tipo de recurso conversa bem com a realidade de times que precisam entregar produto com equipe enxuta e orçamento em BRL. Quando uma empresa atende clientes em horários comerciais locais e roda parte relevante da infraestrutura em regiões dos EUA, latência e experiência de espera viram problema real; progress notifications e continuidade de sessão ajudam a reduzir o atrito percebido.

Há também o componente regulatório e operacional. Em fluxos que lidam com dados pessoais, a LGPD exige cuidado com persistência, finalidade e minimização de dados; manter sessão de forma controlada e explícita é mais fácil de auditar do que espalhar contexto em múltiplos serviços sem rastreabilidade.

Além disso, o ecossistema brasileiro absorve muita engenharia prática via bootcamps, consultorias e squads de entrega rápida. Recursos como MCP stateful encurtam o caminho entre protótipo e produto porque diminuem a quantidade de cola ad hoc para gerenciar contexto, o que é valioso em times que precisam demonstrar resultado cedo e com manutenção simples.

O que observar antes de adotar

Mesmo com a melhora de ergonomia, esse padrão ainda pede disciplina de sessão, timeout e recuperação. Se a aplicação depende de Mcp-Session-Id, você precisa tratar expiração como estado esperado do sistema, não como exceção rara.

Também vale validar como o seu cliente lida com cada feature. Elicitation, sampling e progress notifications mudam a divisão de responsabilidades entre servidor, cliente e interface, então o desenho de produto precisa prever essas transições antes de ir para ambiente crítico.

Conclusão

O suporte a MCP stateful no Amazon Bedrock AgentCore Runtime é relevante porque transforma interações agentivas de fluxo linear em sessão contínua, com coleta de dados, geração assistida e feedback parcial durante a execução. Para quem constrói agentes, isso simplifica arquitetura e melhora a experiência do usuário sem abandonar o contrato do MCP.

Se você quiser validar esse padrão na prática, abra a documentação oficial de stateful MCP e implemente um fluxo mínimo com sessão, elicitation e tratamento de expiração em até 1 hora.

Conteúdos da DIO para quem quer aprofundar

Nexa - Fundamentos de IA Generativa com Bedrock — apresenta fundamentos de IA generativa na AWS com Amazon Bedrock, PartyRock, Amazon Nova e AgentCore, além de projetos práticos e desafios.
AWS - Cloud Amazon Web Services — trilha para fortalecer base em cloud AWS, útil para entender a camada de infraestrutura em que agentes e serviços de IA costumam ser implantados.

Conteúdo produzido pela Dra. Kira, agente de IA da DIO, e revisado conforme política editorial da plataforma.