GPT-5 não atingiu as expectativas de hype, mas trouxe ganhos em custo, velocidade e código
Sources: https://www.theverge.com/openai/759755/gpt-5-failed-the-hype-test-sam-altman-openai
TL;DR
- O GPT-5 foi lançado após meses de grande expectativa, mas muitos usuários e especialistas consideraram a estreia abaixo do prometido pela divulgação.
- O modelo trouxe melhorias práticas: menor custo, respostas mais rápidas, menos alucinações, um novo sistema de roteamento (switch) e avanços notáveis em tarefas de programação.
- Usuários criticaram o tom de escrita do GPT-5 como mais austero e menos eloquente; publicações em redes sociais também apontaram erros factuais e rotulagem incorreta em mapas.
- O OpenAI enfatizou utilidade e acessibilidade em vez de saltos sensoriais; diante de reclamações, um modelo anterior (GPT-4o) foi restaurado temporariamente.
Contexto e histórico
A expectativa pelo GPT-5 vinha se acumulando desde o lançamento do GPT-4 em 2023. O CEO da OpenAI, Sam Altman, alimentou as expectativas dizendo que GPT-5 era “something that I just don’t wanna ever have to go back from” (algo para o qual ele não queria voltar a partir), comparando-o a um marco de produto. Antes do anúncio, ele compartilhou imagens que aumentaram ainda mais a antecipação. Usuários em Reddit e X pressionaram por detalhes durante meses; em uma AMA no Reddit, Altman citou limitações de compute e o aumento da complexidade dos modelos como razões para a cadência de lançamento. Quando o GPT-5 apareceu no ChatGPT, a recepção pública foi mista: muitos esperavam um salto dramático, mas encontraram principalmente melhorias incrementais, com ganhos mais claros em custo, velocidade, programação e redução de alucinações.
O que há de novo
Principais mudanças e recursos relatados sobre o GPT-5:
- Redução no custo por consulta e tempos de resposta mais rápidos em comparação com modelos anteriores.
- Menos alucinações e melhor calibração: o modelo diz “não sei” com mais frequência quando apropriado, separa fatos de suposições e pode fornecer citações quando solicitado.
- Um sistema automático de “switch” que encaminha a consulta do usuário, nos bastidores, para o modelo mais apropriado, evitando que o usuário escolha manualmente.
- Ganhos notáveis em programação: uma versão do GPT-5 liderou uma leaderboard popular de modelos de IA na categoria de código, com o Claude da Anthropic em segundo lugar.
- Demonstrações promocionais que incluíram jogos simples gerados por IA (mini-jogo de bola rolante e corrida de velocidade de digitação), uma ferramenta de pixel art, um simulador de bateria e um visualizador lofi. A OpenAI também descreveu o GPT-5 como seu “melhor sistema de IA até agora” e um “avanço significativo em inteligência” em várias áreas.
Por que importa (impacto para desenvolvedores e empresas)
- Custo e velocidade: custos operacionais menores e menor latência afetam diretamente o retorno sobre investimento em implantações empresariais e em escala. Empresas que pagam por consulta ou que necessitam de baixa latência podem se beneficiar.
- Produtividade em programação: o desempenho em código é facilmente monetizável. Ferramentas de desenvolvimento, plataformas e equipes de engenharia podem ver ganhos de produtividade.
- Redução de alucinações e melhor calibração: maior transparência sobre incerteza e capacidade de fundamentar respostas com citações reduzem riscos em casos sensíveis (saúde, legal), embora a adoção real dependa de avaliações rigorosas.
- Sistema de switch: o roteamento automático simplifica a experiência e a integração técnica, reduzindo a necessidade de lógica complexa para escolher variantes de modelos. Ao mesmo tempo, mudanças na qualidade de escrita e no tom podem afetar produtos voltados a consumidores e contextos que dependem de nuance e empatia.
Detalhes técnicos ou de implementação
- Prioridades da OpenAI: em vez de perseguir apenas saltos espetaculares, a empresa enfatizou utilidade real e acessibilidade em massa.
- Limitações de compute: em uma AMA, Sam Altman explicou que a capacidade de compute e a complexidade dos modelos limitam quantas entregas podem ocorrer em paralelo, o que ajuda a entender escolhas incrementais de lançamento.
- Sistema de switch: o GPT-5 introduz um mecanismo de roteamento automático que atribui consultas ao modelo mais adequado, uma mudança de sistema pensada para melhorar a experiência final do usuário.
- Benchmarks: GPT-5 teve desempenho melhor que predecessores em muitos testes do setor, mas analistas consideraram as melhorias incrementais. O cenário de benchmarks é dinâmico e as empresas às vezes selecionam resultados a exibir.
- Posição em leaderboards de código: uma variante do GPT-5 chegou ao topo de uma leaderboard popular de modelos de IA para programação, indicando progresso mensurável em tarefas voltadas a desenvolvedores.
Principais conclusões
- GPT-5 entrega melhorias práticas importantes: custo menor, respostas mais rápidas, menos alucinações e avanço em programação.
- O lançamento não correspondeu ao exagero das expectativas criado pelo hype e pela divulgação.
- A OpenAI priorizou utilidade e acessibilidade, além de melhorias de sistema (como o switch), em vez de um salto único e transformador.
- Surgiram trade-offs na experiência do usuário: muitos acharam a escrita menos nuanceada, e exemplos virais mostraram erros factuais.
- Para empresas e desenvolvedores, avanços incrementais em velocidade, custo e confiabilidade podem valer mais que declarações de grande impacto.
FAQ
Referências
- Reportagem original e análise: https://www.theverge.com/openai/759755/gpt-5-failed-the-hype-test-sam-altman-openai
More news
Anthropic atualiza regras do Claude diante de um cenário de IA mais perigoso
Anthropic proibiu assistência a armas CBRN e explosivos de grande rendimento, adicionou restrições de cibersegurança, ajustou política política e clarificou requisitos de alto risco.
Build a scalable containerized web application on AWS using the MERN stack with Amazon Q Developer – Part 1
In a traditional SDLC, a lot of time is spent in the different phases researching approaches that can deliver on requirements: iterating over design changes, writing, testing and reviewing code, and configuring infrastructure. In this post, you learned about the experience and saw productivity gains
Building a RAG chat-based assistant on Amazon EKS Auto Mode and NVIDIA NIMs
In this post, we demonstrate the implementation of a practical RAG chat-based assistant using a comprehensive stack of modern technologies. The solution uses NVIDIA NIMs for both LLM inference and text embedding services, with the NIM Operator handling their deployment and management. The architectu
Introducing Amazon Bedrock AgentCore Identity: Securing agentic AI at scale
In this post, we explore Amazon Bedrock AgentCore Identity, a comprehensive identity and access management service purpose-built for AI agents that enables secure access to AWS resources and third-party tools. The service provides robust identity management features including agent identity director
Introducing Amazon Bedrock AgentCore Gateway: Transforming enterprise AI agent tool development
In this post, we discuss Amazon Bedrock AgentCore Gateway, a fully managed service that revolutionizes how enterprises connect AI agents with tools and services by providing a centralized tool server with unified interface for agent-tool communication. The service offers key capabilities including S
Sam Altman diz ‘sim’, há uma bolha em IA — o que ele falou à The Verge
O CEO da OpenAI, Sam Altman, disse à The Verge que acredita estar havendo uma bolha em IA, comparou ao estouro das empresas ponto.com e previu gastos massivos com data centers.