Preocupação do Google com gargalos mostra chegada de novo estágio da IA, diz analista

Shay Boloor, estrategista-chefe da Futurum Equities, afirma que a capacidade de atendimento vai importar mais do que a de computação

Marco Quiroz-Gutierrez Fortune

Sundar Pichai, CEO da Alphabet, dona do Google (Foto: David Paul Morris/Bloomberg/Getty Images/The New York Times Licensing Group)
Sundar Pichai, CEO da Alphabet, dona do Google (Foto: David Paul Morris/Bloomberg/Getty Images/The New York Times Licensing Group)

Publicidade

O chefe de infraestrutura de inteligência artificial do Google alertou que a empresa precisa expandir sua tecnologia para acomodar um enorme fluxo de usuários e solicitações complexas sendo tratadas por produtos de IA — e isso pode ser um sinal de que os temores de uma bolha estão exagerados.

Amin Vahdat, vice-presidente que lidera a equipe global de IA e infraestrutura do Google, disse durante uma apresentação em uma reunião geral em 6 de novembro que a empresa precisa dobrar sua capacidade de atendimento a cada seis meses, atingindo um aumento de mil vezes daqui a quatro ou cinco anos, informou a CNBC.

Leia também: Avanço da IA e demissões levantam a questão: chegou a era do desemprego por robôs?

Continua depois da publicidade

Isso se refere à capacidade do Google de garantir que o Gemini e outros produtos de IA que dependem do Google Cloud ainda funcionem bem quando consultados por um número crescente de usuários. Isso é diferente de computação, ou da infraestrutura física envolvida no treinamento da IA.

Um porta-voz do Google disse à Fortune que “a demanda por serviços de IA significa que estamos sendo solicitados a fornecer uma capacidade de computação significativamente maior, o que estamos impulsionando por meio de eficiência em hardware, software e otimizações de modelos, além de novos investimentos”, apontando os chips Ironwood da empresa como exemplo de hardware próprio proporcionando melhorias na capacidade de computação.

Nos anos anteriores, cada hiperescalador — serviços de grande capacidade, como Google Cloud, Amazon e Microsoft Azure — correu para aumentar a computação em antecipação a uma onda de usuários de IA.

Agora, os usuários chegaram, disse Shay Boloor, estrategista-chefe de mercado da Futurum Equities. Mas à medida que cada empresa intensifica suas ofertas de IA, a capacidade de atendimento está surgindo como o próximo grande desafio a ser enfrentado.

“Estamos entrando no segundo estágio da IA, onde a capacidade de atendimento importa ainda mais do que a capacidade de computação, porque a computação cria o modelo, mas a capacidade de atendimento determina quão amplamente e quão rapidamente esse modelo pode realmente alcançar os usuários”, disse ele à Fortune.

O Google, com seus vastos gastos de capital e movimentos estratégicos anteriores para desenvolver seus próprios chips de IA, provavelmente é capaz de dobrar sua capacidade de atendimento a cada seis meses, disse Boloor.

Continua depois da publicidade

Ainda assim, o Google e seus concorrentes enfrentam uma batalha difícil, acrescentou, especialmente à medida que os produtos de IA começam a lidar com solicitações mais complexas, incluindo consultas avançadas de pesquisa e vídeo.

“O gargalo não é causada por falta de planos, são realmente as limitações físicas, como energia, resfriamento, largura de banda de rede e o tempo necessário para construir data centers prontos para uso”, disse ele.

No entanto, o fato de o Google aparentemente estar enfrentando tanta demanda por sua infraestrutura de IA, com pressão para dobrar sua capacidade de atendimento tão rapidamente pode ser um sinal de que as previsões sombrias feitas por pessimistas da IA não estejam totalmente corretas, disse Boloor.

Continua depois da publicidade

Tais preocupações fizeram todos os três principais índices acionários da bolsa americana caírem 1,9% ou mais na semana passada — incluindo o Nasdaq, fortemente ligado ao setor de tecnologia.

“Isso não é entusiasmo especulativo, é apenas demanda não atendida aguardando na fila”, disse ele. “Se as coisas estão desacelerando um pouco mais do que muita gente esperava, é porque todos estão limitados na computação e na capacidade de atendimento.”

2025 Fortune Media IP Limited