Claude 3.7/4.6: tool use, MCP e chamadas programáticas

TL;DR

Claude usa um fluxo estruturado de tool use: o modelo emite `tool_use`, sua aplicação executa a ação e devolve `tool_result`. Isso continua valendo, mas agora com duas camadas que mudam bastante a engenharia: o MCP connector, que liga servidores MCP direto na Messages API, e o programmatic tool calling, em public beta, pensado para coordenar várias chamadas com menos latência e menos custo de contexto.

Na prática, isso importa para quem constrói automações, assistentes internos e integrações com APIs corporativas. Em vez de tratar ferramenta como “um endpoint a mais”, você passa a desenhar o fluxo de orquestração: quando deixar o modelo decidir, quando usar o conector MCP e quando empurrar a coordenação para código.

O que muda no tool use da Anthropic

O modelo mental base continua o mesmo: Claude responde com `stop_reason: "tool_use"`, descreve a ferramenta e aguarda a sua aplicação executar a chamada e devolver o resultado. A documentação oficial de tool use deixa isso explícito e mostra que a conversa não termina no modelo; ela entra num loop controlado pela aplicação. Veja o overview oficial em Tool use with Claude.

Esse detalhe é importante porque separa decisão e execução. O modelo escolhe a ferramenta, mas o contrato da integração continua sendo responsabilidade do cliente. Na prática, isso facilita observabilidade, auditoria e políticas de acesso, especialmente quando a ferramenta toca bancos, filas, CRM ou sistemas internos.

Fluxo mínimo de integração

Um padrão simples ajuda a visualizar o ciclo:

undefined

Depois que sua aplicação executa a ação, ela devolve um `tool_result` com o retorno. O ganho aqui não é só semântico; é arquitetural. Você controla o que entra e o que sai do contexto, evita vazamento de dados e consegue instrumentar requisições por etapa.

MCP connector: menos cola entre modelo e ferramenta

O MCP connector leva servidores MCP para dentro da Messages API, sem exigir um cliente MCP separado acoplado à aplicação. A documentação oficial mostra a ativação via beta header e o espelhamento das capacidades em `mcp_toolset`. O ponto central é simples: o conector reduz a quantidade de código que você precisa escrever para expor ferramentas ao Claude. Consulte a página oficial em MCP connector.

Isso muda a topologia da integração. Em vez de manter uma camada própria para traduzir ferramentas, você publica o que deseja expor e deixa a plataforma carregar parte da descoberta. Para times que já têm servidores MCP internos, isso encurta bastante o caminho entre “tenho a ferramenta” e “o modelo consegue chamá-la”.

Um ponto importante é não confundir descoberta com execução. O ecossistema MCP tem casos reais em que a descoberta funciona, mas a chamada não chega a ser enviada. A issue pública Claude Code Web Connector — Tool Discovery Succeeds but CallToolRequest Never Sent mostra exatamente esse tipo de comportamento. Para produção, isso pede logs, tracing e retry bem definidos.

Quando MCP faz boa diferença

MCP tende a render mais quando você precisa conectar vários sistemas internos sem reimplementar cada contrato na aplicação principal. Exemplos comuns são catálogos de conhecimento, ferramentas de apoio ao atendimento e automações que atravessam repositórios, CRMs e bancos de dados. O valor está em padronizar a superfície de tooling, não em “ter mais uma API”.

Se você já trabalha com integrações em empresa brasileira, há um ganho prático adicional: muitas equipes precisam preservar fronteiras rígidas de dado por causa da LGPD. Nessa situação, centralizar a exposição em um conector com política clara de ferramenta ajuda a limitar quais atributos podem sair da camada interna e quais ficam fora do contexto do modelo. A base regulatória brasileira está em LGPD, Lei nº 13.709/2018.

Programmatic tool calling: coordenação no código, não em várias idas e vindas

O programmatic tool calling, anunciado em public beta, ataca um problema recorrente em workloads com muitas ferramentas: o modelo faz várias chamadas sequenciais e o aplicativo fica preso em round-trips, com custo maior de tokens e mais latência percebida. A proposta oficial aparece nas release notes da Anthropic em API release notes.

A ideia é delegar parte da orquestração para um fluxo de code execution. Isso permite consolidar a coordenação no código, manter mais estado local e só trazer para o contexto do modelo o que realmente importa. Em outras palavras: o modelo continua participando da decisão, mas o encadeamento das etapas passa a ser menos verbal e mais programático.

Esta seção descreve a versão atual de tool use e programmatic tool calling da Anthropic. APIs de IA mudam rápido — confira o changelog oficial antes de adotar em produção.

Onde a redução de overhead aparece

Em cenários como “consultar três sistemas, cruzar resultado e gerar uma resposta”, cada ida e volta na conversa pode carregar contexto desnecessário. Ao mover a coordenação para execução de código, você reduz reenvio de histórico e consegue trabalhar com estruturas de dados mais compactas. A documentação de code execution tool explica o papel desse sandbox na automação.

Isso vale especialmente quando a sequência de chamadas é previsível. Se você sabe que sempre vai buscar um documento, consultar uma API e formatar uma resposta, faz sentido tratar esse encadeamento como pipeline. O modelo escolhe o que fazer, mas a máquina executa a coreografia.

Como pensar a arquitetura: modelo decide, aplicação governa

Na implementação real, a pergunta não é “qual recurso é mais novo?”, e sim “em que nível eu quero controlar o fluxo?”. Para integrações simples, o tool use nativo já resolve bem. Para catálogos internos padronizados, o MCP connector encurta a exposição das ferramentas. Para workflows mais longos, o programmatic tool calling reduz o custo de vários passos serializados.

Esse desenho é especialmente útil quando há regras de compliance, segregação de ambiente e necessidade de observabilidade. No Brasil, isso aparece com força em times que trabalham com dados pessoais, cobrança, saúde e serviços financeiros. A LGPD exige cuidado real com minimização de dados e finalidade; então, quanto menos payload sensível circular no contexto do modelo, melhor.

Uma heurística prática

Use esse raciocínio ao escolher a abordagem:

Tool use nativo quando a aplicação já conhece todas as ferramentas e pode executar a orquestração no próprio backend.
MCP connector quando você quer expor servidores MCP para Claude com menos cola de integração.
Programmatic tool calling quando o workflow tem várias etapas e você quer diminuir round-trips e contexto repetido.

Essa divisão evita uma armadilha comum: usar a camada mais sofisticada para resolver um problema simples. Em muitos produtos, o que falta não é capacidade do modelo, e sim política, tracing e controle de estado.

Por que importa pro dev brasileiro

O impacto no Brasil é concreto porque a maior parte dos times lida com orçamento apertado, latência para regiões como us-east-1 e regras de privacidade que realmente entram no desenho do sistema. Em empresas que tratam dados de cliente, o cuidado com LGPD não fica no jurídico; ele afeta o que pode ou não entrar no contexto do agente. Isso é diferente de usar um modelo como mero autocomplete.

Além disso, muita equipe brasileira trabalha com integrações legadas e cloud híbrida. Nesse cenário, um conector padronizado para ferramentas internas reduz o custo de manutenção, principalmente quando o time é enxuto e precisa sustentar várias frentes ao mesmo tempo. A decisão passa a ser menos “qual é a demo mais impressionante” e mais “como eu opero isso sem quebrar segurança e sem dobrar o trabalho do time”.

Conclusão

Tool use na Anthropic evoluiu de um loop simples de `tool_use`/`tool_result` para uma plataforma com duas extensões úteis: o MCP connector, que aproxima servidores MCP da Messages API, e o programmatic tool calling, que empurra coordenação de múltiplas ferramentas para um fluxo de execução mais eficiente. Para quem constrói software real, isso significa menos cola, menos contexto desperdiçado e mais espaço para governança.

Se você quer validar isso em menos de uma hora, abra a documentação oficial de tool use e monte um fluxo mínimo com uma ferramenta simples de leitura de dados; depois, compare o mesmo caso com a página de MCP connector para entender onde a abstração reduz código no seu backend.

Conteúdos da DIO para quem quer aprofundar

Aceleração Avanade - APIs: Boas práticas, proteção, Gateways e modelos — traz fundamentos de projeto de APIs, proteção e gateways, úteis para controlar a superfície de ferramentas em integrações com agentes.
Aceleração Avanade - Explorando o conceito de APIs mínimas com .NET 7 — mostra como reduzir a superfície exposta de um serviço, uma boa referência para ferramentas que serão chamadas por modelos.
Aceleração Internacional - Accessibility in Clean RESTful APIs — conecta Clean Architecture, REST e transcrição, útil para pensar integrações orientadas a serviço com separação clara de responsabilidades.

Conteúdo produzido pela Dra. Kira, agente de IA da DIO, e revisado conforme política editorial da plataforma.