Os gastos com agentes de codificação de IA excederão o que as organizações pagam ao desenvolvedor médio dentro de dois anos, de acordo com um novo relatório do Gartner. A empresa cita o crescente consumo de tokens e uma mudança em toda a indústria para o licenciamento baseado no consumo como forças por trás da mudança. Ele define o cruzamento de 2028. Sem um modelo operacional gerenciado, alerta o Gartner, os custos podem aumentar mais rapidamente do que o desempenho que essas ferramentas foram projetadas para oferecer.
A previsão deve dar uma pausa aos líderes tecnológicos dos sistemas de saúde, muitos dos quais estão agora a escalar agentes de codificação de IA para as suas equipas de engenharia. O Gartner tira suas conclusões da engenharia de software empresarial como um todo. No entanto, a mecânica de custos se aplica sempre que os desenvolvedores dependem de grandes modelos de linguagem. Tokens são as unidades de dados que esses modelos processam. Com preços baseados no uso, cada token gasto é gasto nos livros. À medida que a confiança cresce, a conta também aumenta.
Os preços ao consumidor obscurecem a previsão
A mudança do licenciamento baseado em assento para preços baseados no consumo introduziu estruturas de custos altamente variáveis para cargas de trabalho de engenharia. Nitish Tyagi, analista principal sênior do Gartner, disse que as organizações estão correndo da experimentação para a implantação em larga escala, enquanto subestimam o impacto financeiro do uso crescente de tokens. Os desenvolvedores otimizam a velocidade e a conveniência em detrimento da relação custo-benefício. Como resultado, a disciplina simbólica não surgirá apenas da escolha individual. Isso significa que os líderes devem ter mais firmeza na estruturação e gestão do trabalho.
A previsão sofre ainda mais porque muitos provedores oferecem pouca transparência sobre como o consumo de tokens é calculado e cobrado. Sem uma visibilidade clara da utilização, as organizações correm o risco de gastar mais do que o orçamento. Eles também perdem a capacidade de comparar o custo com o valor. A maioria ainda carece de maturidade e estruturas para medir os custos em relação ao impacto nos negócios, disse Tyagi. Os líderes da engenharia, em particular, estão cada vez mais preocupados à medida que os orçamentos se esgotam mais cedo do que o esperado. A disparidade entre as despesas planeadas e as reais continua a aumentar.
Hábitos de uso e lacunas de gerenciamento aumentam a pressão
A forma como as equipes utilizam esses agentes custa ainda mais. A Gartner associa os gastos excessivos à má governança, citando a autonomia não gerenciada em fluxos de trabalho orientados por agentes, janelas de contexto inchadas e falta de feedback estruturado para refinar o uso. Os fornecedores também ainda não forneceram otimização de custos integrada e madura em suas ferramentas. Portanto, a escalada se torna mais complicada. As organizações absorvem a diferença sem sempre saber de onde ela vem.
A pressão irá intensificar-se, espera a Gartner, à medida que o investimento em infra-estruturas e os desafios de rentabilidade continuarem a empurrar os preços dos modelos para cima. Enquanto isso, à medida que a adoção se expande, os usuários fracos rapidamente se tornarão usuários em massa, e essa familiaridade crescente aumentará ainda mais o consumo de tokens e os gastos gerais. Para organizações fornecedoras que já fazem orçamentos para IA nas frentes clínicas e operacionais, o item de engenharia torna-se mais um custo variável a ser gerenciado. A questão passa da adoção destas ferramentas para a forma de as gerir de forma acessível e em grande escala.
Um modelo operacional disciplinado para gastos com IA
Para conter custos, o Gartner incentiva os líderes de engenharia de software a instalarem um modelo operacional disciplinado para o uso de IA. A empresa recomenda determinar quando os agentes devem ser utilizados e em que nível de autonomia. Também sugere classificar o trabalho em execução liderada pelo desenvolvedor, liderada pelo agente e totalmente liderada pelo agente. A seleção do modelo deve corresponder à complexidade da tarefa, de modo que o trabalho mais simples e de alta frequência encaminhe para modelos menores, enquanto os modelos de fronteira são reservados para desenvolvimentos complexos e de alto valor. A escalada só acontece quando a dificuldade exige.
A engenharia de contexto é outra camada a ser considerada do lado técnico. Os desenvolvedores devem ser treinados para alimentar os sistemas de IA apenas com informações relevantes, agregar quando possível e remover dados desnecessários, o que reduz o uso de tokens sem sacrificar a qualidade da saída. O Gartner também aconselha a criação de controles de custos diretamente nos fluxos de trabalho de engenharia, incluindo limites de token, políticas de escalonamento e monitoramento automatizado. Por fim, os líderes devem revisar os fluxos de trabalho de alto consumo durante as retrospectivas do sprint para destacar ineficiências, refinar práticas e compartilhar o que está funcionando entre as equipes de engenharia. Incorporar controles no trabalho diário os mantém consistentes.
Leve embora
- Trate os custos de codificação de IA como um centro de custos gerenciado; o uso não regulamentado de tokens pode superar os ganhos de produtividade que financia.
- Promova aos provedores a transparência do token antes de escalar, pois o faturamento opaco bloqueia previsões precisas.
- Classifique as tarefas de desenvolvimento por nível de autonomia e direcione o trabalho simples para modelos menores, escalando para modelos de limite somente quando a complexidade assim o exigir.
- Treine desenvolvedores em engenharia de contexto para reduzir o uso de tokens sem degradar a produção.
- Crie limites de token, políticas de escalonamento e monitoramento automatizado em fluxos de trabalho e analise tarefas de alto consumo em retrospectivas de sprint.
Para os executivos habituados a orçamentos de software baseados no trabalho, este é um mundo novo. O consumo de tokens agora determina o preço, e alguém tem que decidir quanto vale cada agente antes que o gasto chegue. Esperar até que o orçamento se esgote deixa os líderes confrontados com um problema que o modelo de governação deveria evitar. A disciplina funciona melhor quando começa cedo, bem antes da escala.









