Cada vez que un nuevo modelo de IA cae (actualizaciones de GPT, Deepseek, Gemini, la gente de las personas se mira al tamaño, la complejidad y cada vez más, el hambre de cómputo de estos mega modelos. La suposición es que estos modelos están definiendo las necesidades de recursos de la Revolución AI.
Esa suposición es incorrecta.
Sí, los modelos grandes tienen hambre de cómputo. Pero la mayor tensión en la infraestructura de IA no proviene de un puñado de mega modelos: proviene de la proliferación silenciosa de los modelos de IA en todas las industrias, cada uno ajustado para aplicaciones específicas, cada uno de los consumo a una escala sin precedentes.
A pesar de la posible competencia ganadora que se desarrolla entre los LLM, el panorama de IA en normal no es centralización, es fragmentación. Cada empresa no solo usa AI, están capacitando, personalizando e implementando modelos privados adaptados a sus necesidades. Es la última situación la que creará una curva de demanda de infraestructura para la que los proveedores de la nube, las empresas y los gobiernos no están listos.
Hemos visto este patrón antes. Cloud no consolidó las cargas de trabajo; Creó un ecosistema híbrido extenso. Primero, fue la expansión del servidor. Entonces VM se extiende. ¿Ahora? AI FIGA. Cada ola de computación condujo a la proliferación, no a la simplificación. AI no es diferente.
AI Sprawl: Por qué el futuro de la IA es un millón de modelos, no uno
Finanzas, logística, ciberseguridad, servicio al cliente, I + D: cada uno tiene su propio modelo de IA optimizado para su propia función. Las organizaciones no están capacitando un modelo de IA para gobernar toda su operación. Están entrenando miles. Eso significa más ciclos de entrenamiento, más cómputo, más demanda de almacenamiento y más expansión de infraestructura.
Esto no es teórico. Incluso en las industrias que son tradicionalmente cautelosas sobre la adopción tecnológica, la inversión de IA se está acelerando. Un informe de 2024 McKinsey encontró que las organizaciones ahora usan IA en un promedio de tres funciones comerciales, con el desarrollo de la fabricación, la cadena de suministro y los productos que lideran el cargo (McKinsey).
La atención médica es un excelente ejemplo. Navina, una startup que integra la IA en los registros de salud electrónicos para la superficie de las concepts clínicas, recaudó $ 55 millones en fondos de la Serie C de Goldman Sachs (Interno de negocios). La energía no es diferente: los líderes de la industria han lanzado el consorcio de IA de poder abierto para llevar la optimización de IA a las operaciones de la crimson y las plantas (Axios).
La tensión de cómputo de la que no está hablando nadie
AI ya está rompiendo modelos de infraestructura tradicionales. La suposición de que la nube puede escalar infinitamente para respaldar el crecimiento de la IA está mal. La IA no escala como cargas de trabajo tradicionales. La curva de demanda no es gradual: es exponencial, y los hiperscalers no se mantienen al día.
- Restricciones de poder: Los centros de datos específicos de la IA ahora se están construyendo en torno a la disponibilidad de energía, no solo las troncales de la crimson.
- Cuellos de botella de crimson: Los entornos híbridos de TI se están volviendo inmanejables sin automatización, lo que las cargas de trabajo de IA solo se exacerbarán.
- Presión económica: Las cargas de trabajo de IA pueden consumir millones en un solo mes, creando imprevisibilidad financiera.
Los centros de datos ya representan el 1% del consumo international de electricidad. En Irlanda, ahora consumen el 20% de la crimson nacional, se espera que una acción aumente significativamente para 2030 (IEA).
Agregue a eso la presión inminente sobre las GPU. Bain & Firm advirtió recientemente que el crecimiento de la IA está preparando el escenario para una escasez de semiconductores, impulsada por la demanda explosiva de chips de grado de centro de datos (Bain).
Mientras tanto, el problema de sostenibilidad de AI crece. Un análisis de 2024 en Ciudades y sociedad sostenibles Advierte que la adopción generalizada de IA en la atención médica podría aumentar sustancialmente el consumo de energía y las emisiones de carbono del sector, a menos que se compensan con la eficiencia dirigida (Con ciencias).
La expansión AI es más grande que el mercado, es una cuestión de poder estatal
Si crees que AI Sprawl es un problema corporativo, piense de nuevo. El impulsor más significativo de la fragmentación de IA no es el sector privado: los gobiernos y las agencias de defensa militar, desplegando IA a una escala que ningún hiperscaler o empresa puede igualar.
Solo el gobierno de los Estados Unidos ha implementado IA en más de 700 aplicaciones en 27 agencias, cubriendo el análisis de inteligencia, la logística y más (Revista Fedtech).
Canadá está invirtiendo hasta $ 700 millones para ampliar la capacidad de cálculo de IA nacional, lanzando un desafío nacional para reforzar la infraestructura del centro de datos soberanos (Innovación, ciencia y desarrollo económico Canadá).
Y hay llamadas crecientes para un “programa Apolo” para la infraestructura de IA, que ilumina la elevación de la IA de la ventaja comercial al imperativo nacional (Revisión de la tecnología del MIT).
La IA militar no será eficiente, coordinada u optimizada para el costo: será impulsado por mandatos de seguridad nacional, urgencia geopolítica y la necesidad de sistemas de IA soberanos cerrados. Incluso si las empresas controlan la expansión de AI, ¿quién le dirá a los gobiernos que disminuyan la velocidad?
Porque cuando la seguridad nacional está en juego, nadie se detiene para preguntar si la crimson eléctrica puede manejarla.