Claude Opus 4.7
Anthropic
Deep reasoning + decisoes sistemicas
$15 in / $75 out (M tokens)
- ·Refactor cross-module
- ·Code review critico
- ·Security design
catalogo de ias
Roteamento por tier de custo/profundidade: cada tarefa vai pro modelo mais barato capaz de faze-la bem, com escalation pro tier acima quando confianca baixa. Reduz custo 10-60× sem perder qualidade nas decisoes que importam.
fonte: .remember/ai-orchestration.md · 14 modelos mapeados
Deep reasoning · decisoes sistemicas · 5 modelos
Anthropic
Deep reasoning + decisoes sistemicas
$15 in / $75 out (M tokens)
Anthropic
Reasoning equilibrado, default tier-1
$3 in / $15 out (M tokens)
Anthropic
Tier-1 cheap fallback
$1 in / $5 out (M tokens)
Anthropic
AI agent OmniPro hoje
~$10-50/mes
Trail Systems
Pacote canonical de routing multi-tier
Interno
Rapido · estruturado · LPU · 5 modelos
Groq (LPU)
Specialist rapido + estruturado
$0.59 in / $0.79 out (M tokens)
Groq
Transcricao audio
$0.111/h audio
Groq
Modelo aberto grande pra extracao complexa
Pay-per-use
Groq
Whisper em producao
~$5-20/mes
TBD
Modelo domain-specific
TBD (~$25-100/M tokens treino)
Edge · real-time · alto volume · 4 modelos
Cloudflare Workers AI
Edge LLM real-time alto volume
$0.05/M tokens
Cloudflare Workers AI
Modelo multilingual edge
$0.05/M tokens
Cloudflare Workers AI
Embedding edge nativo
$0.011/M tokens
Cloudflare
Vector DB edge
Pay-per-use