Hasta ahora, el debate sobre la inteligencia artificial se ha centrado en la inteligencia: la capacidad del modelo, la rapidez con la que se entrena y la precisión con la que responde. Sin embargo, de acuerdo con un análisis de Adam Tarbox, vicepresidente y director general para el norte y el este de Europa y CIS de Nutanix, en 2026 la pregunta más difícil será si la empresa puede permitirse mantenerlo en funcionamiento.
Según proyecciones de Deloitte, la inferencia —el trabajo cotidiano que realiza la IA una vez que el modelo está entrenado— representará aproximadamente dos tercios de toda la capacidad de cálculo de IA empresarial este año. Cada interacción con el cliente, cada comprobación de fraude, cada recomendación, cada respuesta de un chatbot y cada resumen de documentos se basa en ella.
El entrenamiento, explica Tarbox, se lleva a cabo en ráfagas puntuales que pueden presupuestarse en el marco de un proyecto. La inferencia, en cambio, es persistente, distribuida y cercana al usuario. Se convierte en parte de la carga de trabajo diaria de la empresa, con la correspondiente factura eléctrica. Esto desplaza el reto empresarial de la creación de modelos a su correcta ejecución.
La IA ya no es un experimento en manos de un equipo de innovación. Forma parte del funcionamiento diario de la empresa y requiere la misma resiliencia, gobernanza, seguridad y disciplina de costos que cualquier otro sistema crítico. La diferencia radica en la presión que ejerce sobre la infraestructura, especialmente en lo que respecta al consumo eléctrico.
Para los responsables tecnológicos, esto plantea preguntas incómodas: ¿cuánta capacidad está inactiva? ¿Se han desplegado las GPU donde realmente se necesitan? ¿Alguien puede ver la relación entre rendimiento, costo y consumo eléctrico? Son cuestiones que deben resolverse para que la IA sea sostenible a largo plazo.

