Nvidia GB300 domina IA com salto de 20x sobre Hopper e Rubin a caminho
Nvidia GB300 NVL72 domina benchmark AA-AgentPerf com 20x mais desempenho que Hopper em IA agêntica. Rubin já está em produção e promete avanços maiores.

Imagem: Reprodução Nvidea
A Nvidia colocou no ar os primeiros resultados de benchmark da sua nova plataforma GB300 NVL72, e o número impressiona: a Blackwell Ultra entrega um salto de 20 vezes no desempenho por megawatt em cargas de trabalho de inteligência artificial agêntica em comparação com a geração Hopper (H200). O dado foi publicado pela própria empresa e validado pelo laboratório independente Artificial Analysis.
O benchmark usado é o AA-AgentPerf, uma métrica nova que mede quantos agentes de IA um sistema consegue sustentar simultaneamente em cenários reais de uso, como sessões de codificação com múltiplas chamadas de ferramentas, raciocínio encadeado e variação de contexto. Nada de prompts sintéticos: o teste simula o que acontece de verdade num data center que roda modelos como o DeepSeek V4 Pro.
O que o GB300 entrega de concreto
Nos testes publicados, o GB300 NVL72 sustentou 61,4 mil agentes concorrentes por megawatt, contra apenas 2,6 mil do H200. Por GPU individual, a conta é igualmente expressiva: 57,5 agentes contra 1,4 da geração anterior. A Nvidia afirma que a plataforma consegue manter as GPUs totalmente ocupadas mesmo com dezenas de milhares de sessões ativas ao mesmo tempo.
A métrica leva em conta três fatores principais: o tempo até o primeiro token (TTFT), a velocidade de saída por requisição e a taxa de transferência agregada do sistema. Tudo medido com otimizações realistas de produção, não em ambiente de laboratório.
O que significa para quem usa IA
Na prática, o ganho de eficiência energética significa que operar modelos agênticos em larga escala fica muito mais barato por tarefa executada. Para empresas que rodam assistentes de codificação, atendimento automatizado ou sistemas de raciocínio encadeado, o GB300 pode reduzir o custo por agente ativo em mais de 90% em relação ao Hopper.
Do ponto de vista do consumidor brasileiro, isso tende a se refletir em serviços de IA mais rápidos e com preços mais baixos nos próximos anos, desde que a infraestrutura chegue aos data centers da América Latina.
Rubin no horizonte
A Nvidia já confirmou que a arquitetura Rubin, sucessora da Blackwell, entrou em produção e deve ampliar ainda mais essa vantagem. A promessa é de 50 PFLOPs de computação com a nova precisão NVFP4, além de ganhos expressivos em chamadas de ferramentas de LLM com a CPU Vera. A expectativa é que Rubin chegue ao mercado ainda neste ano.
📲 Quer saber quando a Nvidia anunciar preços e disponibilidade da linha Rubin no Brasil? Segue o Canal do TS no WhatsApp para receber as novidades de hardware e IA em primeira mão.
Com a GB300 já em campo e a Rubin a caminho, a Nvidia reforça o pé que já tinha fincado no mercado de IA empresarial. A pergunta que fica é quanto tempo leva para essa potência chegar a preços que caibam no orçamento de empresas médias brasileiras.
Glossário para entender todos esses termos técnicos

Fonte: Wccftech
Escrito por


