Ir para o conteúdo
Gustavo Bigardi
Voltar

IA: A Conta Real Está Chegando

Editar post

“Toda revolução tecnológica passa por dois momentos: o da mágica, e o da fatura.”

Salve galera! Esse artigo é a continuação direta de outro que escrevi há algumas semanas: “IA: Produtividade e o Preço Cognitivo que Ninguém Fala”. Naquele texto, falei do custo cognitivo que estamos pagando para entregar mais código com IA: revisão constante, redirecionamento de agentes, manutenção de modelos mentais duplos.

Agora chegou a hora de falar da outra conta. A financeira. A que estava escondida em planos fixos, em “growth at all costs”, em capital de risco bancando a festa.

Em poucos meses, GitHub Copilot, Anthropic e Cursor anunciaram mudanças significativas em seus modelos de cobrança. Não é coincidência. É o som da música começando a parar.

Vamos olhar pra isso com calma — porque, como vou tentar argumentar até o final, esse reajuste talvez seja a melhor coisa que poderia ter acontecido com a indústria.


1. Três reajustes em três meses (não é coincidência)

Vamos começar com os fatos.

GitHub Copilot — usage-based total em 1 de junho de 2026

Em 2025, o GitHub anunciou a transição do Copilot para um modelo de premium requests com multiplicadores por modelo. A lógica: cada modelo consome processamento de maneira diferente, então cada chamada “vale” um múltiplo de uma “unidade premium”. Modelos mais leves (GPT-4o, GPT-4.1, GPT-5 mini) ficaram como “incluídos” — multiplicador zero. Modelos pesados ganharam multiplicadores de 1x, 2x, 3x. Claude Opus 4.6 saiu com 3x. Quando o Opus 4.7 chegou, o multiplicador subiu para 7,5x — e o usuário Pro+, que já paga 4x mais que o Pro padrão, ainda assim “queima” requests muito mais rápido.

Em 2026, o GitHub deu o passo seguinte: anunciou que a partir de 1 de junho de 2026, todos os planos do Copilot migram para usage-based billing. O cálculo passa a ser feito por consumo de tokens (input, output, cached), usando as tarifas reais de API de cada modelo.

Tradução: acabou o “plano fixo, use à vontade”. A partir de junho, você paga o que consome, com a tabela de preços do provedor refletida na sua fatura.

Anthropic — confusão Pro vs Max em abril de 2026

Em 21 de abril de 2026, a Anthropic atualizou silenciosamente a página de preços e removeu o Claude Code do plano Pro de US$ 20/mês. Para acessar a ferramenta, o usuário precisava migrar para Max 5x (US$ 100/mês) ou Max 20x (US$ 200/mês).

A internet pegou fogo no mesmo dia. Reddit, Hacker News, X. Em menos de 24 horas, a Anthropic reverteu — o Claude Code voltou ao Pro. A explicação oficial: era um “teste de 2%” que vazou para a página pública por “engano” (aqui deixo as aspas como minha opnião).

Mas o sinal já tinha sido dado. E não é o primeiro: meses antes, a empresa já tinha introduzido rate limits semanais e janelas de 5 horas para conter “power users” do Claude Code. Os limites aproximados hoje são:

Todas as estimativas acima são consideradas em uso mediano e não possuem uma precisão real para serem consideradas benchmarks.

Quando o uso passa do limite, ou você espera, ou paga “extra usage”. O modelo de “use à vontade” virou modelo de “use até a janela fechar”.

Cursor — pedido de desculpas em julho de 2025

A Cursor foi a primeira a tomar o susto público. Em junho de 2025, trocou o sistema de “500 fast requests + ilimitado lento” por um pool de US$ 20 em créditos atrelado às tarifas reais de API.

O resultado foi imediato: usuários reportando aumentos efetivos de 20x ou mais em alguns padrões de uso. Quem usava Claude para refactor pesado torrava o crédito em poucos prompts. A comunicação foi ruim, a transição foi confusa, e em 4 de julho de 2025 a Cursor publicou um pedido de desculpas formal e ofereceu reembolsos.

Em agosto de 2025, a régua chegou aos planos Teams: também migraram para o modelo variável, atrelado a custo de API.

O padrão

Três produtos. Três players. Três trimestres consecutivos. Mesma direção: do plano fixo subsidiado para o usage-based atrelado ao custo real. Não é abuso. É a conta começando a fechar lá em cima — e o reflexo chegando aqui no chão de fábrica.


2. A matemática que ninguém mostrava nos slides

Aqui é onde a história fica desconfortável e gera polêmicas.

O que custa de verdade rodar um LLM

Tem uma frase que circula em discussões de unit economics que vale destacar:

OpenAI, Google, Anthropic e Meta estão precificando inferência abaixo do custo para capturar mercado.

Isso não é teoria de fofoca. É o que mostram os números reportados:

Em outras palavras: você nunca pagou o preço real do que estava consumindo. Quem pagou foi a Sequoia, a Andreessen Horowitz, a Microsoft, e o mercado público de dívida.

A montanha de CapEx por trás disso

E aqui o problema fica realmente grande.

Os quatro principais hyperscalers — Alphabet (a.k.a. Google), Microsoft, Meta e Amazon — devem gastar perto de US$ 700 bilhões em CapEx em 2026, predominantemente em data centers para IA. O CapEx desses quatro vem crescendo a uma média de 72% ao ano. Para bancar esse ritmo, os mesmos quatro vão emitir mais de US$ 400 bilhões em dívida nova em 2026 — mais do que o dobro dos US$ 165 bilhões emitidos em 2025.

Alguns analistas já projetam fluxo de caixa negativo para parte desses hyperscalers nos próximos anos, algo que era impensável há cinco anos.

Sala de servidores escura com luzes amarelas iluminando longas fileiras de racks, representando a escala da infraestrutura de IA bancada pelos hyperscalers

A fatura que está começando a chegar pra você é o eco mais distante de uma conta de centenas de bilhões que está sendo paga lá em cima.

O que vimos com Copilot, Claude e Cursor não é cobiça. É realismo financeiro. Em algum momento, a margem precisa fechar. E o caminho mais óbvio é repassar parte do custo real pra ponta — o usuário.

Os paralelos históricos

Não é a primeira vez que uma indústria inteira passa por isso:

Cada uma dessas fases terminou em ajuste de preço. Cada ajuste obrigou os usuários a desenvolverem um reflexo que não tinham antes.

A vez agora é da IA.

Custo ambiental — uma menção, não a discussão

Antes de seguir, uma nota: existe ainda um custo ambiental dessa expansão — energia, água para resfriamento, território, semicondutores. Não vou desenvolver aqui porque planejo um artigo dedicado a isso. Mas vale plantar a semente: o preço financeiro é só uma das contas. A ambiental é outra, igualmente real, e que ninguém está discutindo o suficiente.


3. O comportamento que o subsídio criou

Por anos, o token foi tratado como ar — invisível, ilimitado, gratuito do ponto de vista marginal. E o ar molda o comportamento de quem o respira.

3.1 — Vibe coding como sintoma, não causa

O vibe coding sem estrutura virou prática comum porque tentar de novo não custava nada. Por que pensar antes se o retry é grátis? Por que escrever um spec se a IA pode iterar 10 vezes em 5 minutos? A cultura do “deixa lá, depois eu vejo” foi possível porque a fatura era plana e o limite era subjetivo (“acabou meu fast request, mudo pro lento”).

Não estou dizendo que vibe coding em si seja errado — para protótipos descartáveis e exploração rápida, ele tem lugar. O ponto é: a popularidade dele é função direta do custo marginal próximo de zero. Com preço real, brute-force vira luxo, não default.

E aqui vale falar do combustível cultural que turbinou esse comportamento: a explosão de conteúdo de influenciadores em torno do tema. Lives de horas com gente “construindo um SaaS do zero ao ar”, vídeos curtos com thumbnails de caretas prometendo “criei um app em 4 horas com IA, sem saber programar”, threads infinitas de “build in public — dia 73”, e a narrativa onipresente de que “agora você não precisa mais de um dev”. O recado, repetido em loop, era que a IA tinha tornado a engenharia de software opcional.

Ilustração satírica de uma interface de livestream com desenvolvedor transmitindo "vibe coding" e thumbnail amarelo sensacionalista escrito "I BUILT A SAAS IN 4 HOURS WITHOUT KNOWING HOW TO CODE"

Esse discurso só se sustentou porque o custo de provar a tese era zero. Lançar um produto pra mostrar no vídeo da semana seguinte era, do ponto de vista financeiro, gratuito. Quem nunca tinha aberto uma IDE conseguia “entregar” alguma coisa que rodava — e isso virava conteúdo, que virava audiência, que virava monetização do influenciador. A IA não substituiu o dev nesses casos; ela substituiu a barreira que filtrava quem tinha algo real pra mostrar de quem só queria mostrar.

O ciclo se retroalimentava: influenciador faz vídeo “criei um SaaS sem programar” → audiência tenta replicar → tokens são queimados em massa → mais um SaaS abandonado entra no catálogo → influenciador faz vídeo seguinte com outro projeto. Tudo bancado pelo subsídio de quem rodava a inferência por trás.

Com a fatura real chegando, esse modelo de conteúdo entra em pressão dupla: o influenciador passa a ter custo direto para produzir cada “demo”, e o seguidor que tentava replicar começa a esbarrar em limites de plano que antes não enxergava. O discurso “não precisa mais de dev” não desaparece — mas vai ter que disputar atenção com a realidade prática de quem tentou e viu a fatura, ou tentou manter o produto além do primeiro lançamento e descobriu que gerar não é o mesmo que sustentar.

E estamos falando de custos de consumo até o moment, vou deixar para entrar no assunto segurança em outro artigo, pois será recheado de exemplos direto das redes sociais.

3.2 — Prompt engineering negligenciado

Prompt engineering virou tópico de blog post — raramente prática diária. Faz sentido: quando o retry é grátis, otimizar o prompt é um custo cognitivo sem retorno econômico. É mais fácil rodar de novo do que pensar antes.

Esse comportamento vai mudar. Não porque alguém escreveu um manifesto, mas porque a fatura vai ensinar. Prompt engineering deixa de ser hobby de quem gosta e vira disciplina econômica — saber estruturar contexto, escolher modelo, dar exemplos certos passa a ter ROI direto.

3.3 — Agentes em loop infinito

Quem nunca deixou um agente rodando madrugada adentro com instruções vagas, que atire a primeira pedra. “Deixa lá, amanhã eu vejo” só faz sentido enquanto o custo de “deixar lá” é zero.

Agentes autônomos — Claude Code, Cursor Composer, Copilot Workspace — são as ferramentas onde o subsídio mais aparece. Eles são caros de rodar, e o preço repassado nunca refletiu isso direito. Não por acaso, foram exatamente eles que sofreram os primeiros reajustes.

3.4 — A ausência de feedback econômico

O dev nunca via a fatura. Tudo vinha embutido num plano fixo. Sem feedback econômico, não tem otimização. É o mesmo padrão que vimos com cloud: a geração que cresceu com AWS Free Tier e crédito de cloud nunca aprendeu a pensar em custo de infraestrutura — precisou tomar susto na primeira fatura de produção pra desenvolver o reflexo.

Agora estamos no mesmo ciclo, só que com IA. E o reflexo que vai ter que nascer é o de pensar antes de delegar.

Minha experiência

Eu mesmo senti esse aumento de forma direta nos últimos meses. Os modelos novos — Opus 4.7, GPT-5.5 — entregam mais, mas consomem exponencialmente mais também. A combinação de melhor capacidade + maior custo por chamada + multiplicadores mais altos no Copilot transformou a equação econômica de quem usa IA pra trabalho pesado.

Quando você começa a olhar a fatura, o seu jeito de escrever os prompts muda.

E mudar o jeito de escrever prompts não é regressão — é maturidade. Aliás, é um passo para a maturidade, o caminho em si é longo…


4. A epidemia de shovelware SaaS

Aqui eu preciso falar de algo que tenho observado especialmente no X e no LinkedIn, com a maior empatia possível por quem tem boa intenção: o custo marginal próximo de zero gerou uma epidemia de produtos descartáveis.

Shovelware: é um jargão de computação pejorativo que refere-se a pacotes de software mais notáveis pela sua quantidade do que sua qualidade ou utilidade do que está incluído.

O X virou catálogo de produtos abandonados

Nos últimos dois anos, viraram comuns os posts do tipo “lancei meu SaaS em 1 fim de semana”, “10 SaaS em 30 dias”, “construindo em público — semana 47”. A maior parte desses produtos:

A baixa barreira de entrada criada pelo token barato fez muita gente confundir a capacidade de gerar código com a capacidade de criar produto. Não é a mesma coisa. Nunca foi.

Grade de mockups de landing pages de SaaS quase idênticos, com seções hero genéricas e rótulos "Launch Day 1, 2, 3...", representando produção em massa de produtos abandonados

O LinkedIn virou catálogo de boas práticas nunca aplicadas

Em paralelo, o LinkedIn se transformou num museu de boas práticas de gestão e produto que ninguém aplicou nos seus próprios projetos. Threads sobre PMF, discovery, lean canvas, jobs-to-be-done, OKRs — escritas por gente que está, no exato momento da postagem, lançando o quarto SaaS do mês sem ter feito nenhuma das coisas que está pregando.

Não é maldade da minha parte apontar isso. É que a desconexão entre o discurso e a prática ficou grande demais para ignorar. E o que sustentou essa desconexão? Em parte, a possibilidade técnica de “lançar” algo sem investir em discovery, validação, design ou planejamento — porque a IA gerava código por preço quase zero e o “lançamento” era praticamente de graça.

Por que o reajuste mata esse modelo

Quando o custo marginal de “tentar” deixa de ser zero, o cálculo muda. Cada SaaS lançado passa a custar dinheiro real em tokens. Cada feature adicionada por agente passa a ter conta. Cada experimento fracassado deixa de ser gratuito.

E aí o filtro natural aparece. Quem tem tese de produto, audiência ou modelo de receita continua. Quem fazia shovelware pelo dopamine do “lançamento” para. Não porque alguém impediu, mas porque o subsídio acabou.

A indústria não vai sentir falta dessa segunda categoria. Os usuários, muito menos.


5. O custo cognitivo + o custo financeiro = a soma cara

Voltando ao artigo anterior por um momento.

Eu argumentei lá que estamos pagando um custo cognitivo crescente pelo uso de IA: revisão constante de código gerado, redirecionamento de agentes que vão pelo caminho errado, manutenção de modelos mentais duplos (“o que eu faria” vs “o que a IA fez”), interrupções constantes do flow state.

Esse custo já era real. Já estava na conta — só não aparecia em fatura.

Agora, soma com o custo financeiro real chegando.

Para o dev individual

A equação muda: além de avaliar se vale a pena cognitivamente delegar uma tarefa para a IA, você passa a ter que avaliar se vale a pena economicamente. Aquela exploração casual de “deixa eu pedir pro agente refatorar isso só pra ver” deixa de ser de graça em dois sentidos: cansa a cabeça e consome crédito.

Para o time

Times que se acostumaram com “qualquer um pode rodar Cursor à vontade” vão precisar de governança. Quanto cada dev consome? Em quais modelos? Em quais tarefas? Hoje, na maioria das empresas, a resposta é “ninguém sabe”.

Para a empresa

E aqui é onde o susto vai ser maior. Empresas que distribuíram Cursor, Copilot e Claude para todo mundo na esperança de “produtividade IA” sem implementar observabilidade de uso, política de modelos, ou cap de gasto por dev vão receber faturas que não estavam no orçamento. E vão precisar tomar decisões rápidas sobre quem mantém acesso a quê.

A IA, que era plano fixo, vira linha variável de custo. E linhas variáveis de custo, em qualquer empresa séria, exigem governança.

Quem não tem observabilidade do uso de IA hoje, vai ter um susto financeiro nos próximos 6 meses.


6. O reajuste é saudável (a parte contraintuitiva)

Aqui é onde quero ir contra a corrente do choro generalizado que já começou.

Sim, o reajuste dói. Sim, alguns dos números são duros. Mas, olhando friamente, esse reajuste é o melhor que poderia ter acontecido com a indústria. Por algumas razões:

6.1 — Força planejamento upfront de novo

Quando o retry é grátis, planejamento é overhead. Quando o retry custa, planejamento volta a ser racional. Pensar antes de codar, escrever spec antes de delegar, fazer design antes de implementar — coisas que pareciam “lentas demais” na era do subsídio voltam a ser mais baratas que o brute-force.

6.2 — Filtra projetos sem unit economics

Projetos que não tinham receita, mas que continuavam vivos porque “rodar IA é barato”, deixam de fazer sentido. A pergunta “esse SaaS de fato vale a pena manter?” passa a ter resposta com número, não com sentimento.

Isso vai matar produtos. Mas vai matar principalmente os produtos que já estavam mortos — só ninguém tinha confirmado o óbito.

6.3 — Devolve protagonismo a arquitetura, code review, design

Em uma era de tokens caros, decisões erradas custam. Arquitetura ruim, que antes era “ah, refaz com a IA depois”, volta a ser custosa pra reverter. Code review volta a ser barreira de qualidade, não burocracia. Design upfront volta a ser investimento, não atraso.

Ironicamente, o reajuste de IA pode ser o que devolve relevância a práticas de engenharia que estavam sendo erodidas pela própria IA.

6.4 — Separa quem usa IA com critério de quem usa por inércia

Existem duas categorias de dev usando IA hoje:

A primeira categoria vai prosperar com o novo modelo. A segunda vai descobrir, na fatura, que IA sem critério é caro.

6.5 — O preço como mecanismo de seleção natural

Não é punição. É filtro. Toda indústria madura passa por esse filtro. A nuvem passou. O e-commerce passou. Mobilidade passou. Agora é a vez da IA.

E na outra ponta desse filtro tem uma indústria mais saudável, com produtos que se sustentam, com comportamentos mais maduros, com práticas que voltam a fazer sentido econômico.


7. O que muda na prática

Quero ser honesto: não tenho uma checklist mágica. O que tenho são direções de mentalidade, divididas por papel.

Para Devs

Para Tech Leads e Arquitetos

Para CTOs e Lideranças

A IA deixou de ser ferramenta plana de produtividade. Virou insumo estratégico variável. E precisa de governança equivalente.

Mas o ponto, no fim, não é a checklist. É a mentalidade: voltar a tratar IA como uma ferramenta cara, com a disciplina que isso pede.


8. Reflexão final

Eu comecei esse artigo dizendo que o reajuste, no fundo, talvez seja a melhor coisa que poderia ter acontecido com a indústria. Espero ter conseguido sustentar essa afirmação ao longo do texto.

Por anos, a IA foi vendida como mágica de plano fixo. Token barato, retry de graça, agente rodando à noite, SaaS lançado em fim de semana. E nada disso era real do ponto de vista econômico — era subsídio. Pago por VC, por dívida, por pressão de market share.

Quando o subsídio acaba, o que era hábito vira escolha. Vibe coding sem estrutura era hábito; com a fatura, vira escolha. Prompt mal feito era hábito; com a fatura, vira escolha. SaaS descartável era hábito; com a fatura, vira escolha.

E escolhas, ao contrário de hábitos, têm consequência clara. Você pode continuar fazendo as mesmas coisas — só que agora com a conta na mesa.

Estamos prontos para tratar IA como o que ela sempre foi — uma ferramenta cara, com a disciplina que isso pede?

Quem topar essa transição vai liderar a próxima fase. A fase em que IA deixa de ser hype subsidiado e vira insumo de engenharia adulto. Em que prompt engineering vira disciplina econômica. Em que o dev que sabe quando delegar (e quando não) vira o profissional mais valioso. Em que produto bem feito volta a importar mais do que produto rapidamente lançado.

A fatura está chegando. E talvez, no fundo, seja a melhor coisa que poderia ter chegado.

Pessoa segurando uma fatura impressa, sugerindo o momento de encarar a conta da IA

E você aí? Já sentiu o impacto na sua conta de IA? Como tem sido essa transição no seu time, na sua empresa, no seu produto pessoal? Comenta aqui no post — quero muito saber se essa percepção bate com a realidade que vocês estão vivendo, ou se eu estou chorando por uma situação que ainda é só minha.


Referências

  1. GitHub (2025) — “GitHub Copilot is moving to usage-based billing” — github.blog
  2. GitHub (2025) — “Changes to GitHub Copilot Individual plans” — github.blog
  3. GitHub Docs — “GitHub Copilot premium requests” — docs.github.com
  4. AI Tools WW (2026) — “Claude Code Pricing Changes: What It Means for UK Users” — aitoolsww.co.uk
  5. Willison, S. (2026) — “Is Claude Code going to cost $100/month? Probably not — it’s all very confusing” — simonwillison.net
  6. Where’s Your Ed At (2026) — “News: Anthropic (Briefly) Removes Claude Code From $20-A-Month Pro Subscription Plan” — wheresyoured.at
  7. TechCrunch (2025) — “Anthropic unveils new rate limits to curb Claude Code power users” — techcrunch.com
  8. Cursor (2025) — “Clarifying our pricing” — cursor.com
  9. TechCrunch (2025) — “Cursor apologizes for unclear pricing changes that upset users” — techcrunch.com
  10. AI Automation Global (2026) — “OpenAI Lost $5B on $3.7B Revenue: The AI Inference Cost Crisis” — aiautomationglobal.com
  11. Axios (2026) — “AI companies like OpenAI, Google cover costs. But not forever” — axios.com
  12. Warfel, A. (2025) — “The $670 Billion Question: Is AI Demand Real, or Are We Building on Subsidized Sand?” — alexwarfel.com
  13. Introl (2025) — “Inference Unit Economics: The True Cost Per Million Tokens” — introl.com
  14. Epoch AI — “Hyperscaler capex has quadrupled since GPT-4’s release” — epoch.ai
  15. CNBC (2026) — “Tech AI spending may approach $700 billion this year” — cnbc.com
  16. BlockNow (2026) — “Microsoft, Google, Amazon, Meta Issuing $400B Debt as Capex Surges 74%” — blocknow.com
  17. Introl (2026) — “Hyperscaler CapEx Hits $600B in 2026” — introl.com
  18. iFood Entregadores — “Entenda as mecânicas e como participar de cada tipo de promoção” — entregador.ifood.com.br
  19. Bigardi, G. B. (2026) — “IA: Produtividade e o Preço Cognitivo que Ninguém Fala” — /posts/ia-produtividade-carga-cognitiva

Editar post
Compartilhar em:

Próximo post
IA: Produtividade e o Preço Cognitivo que Ninguém Fala