Es como una banda que de gira cada año durante una década. Al principio, las entradas se agotan en segundos porque la energía es alta y la novedad está fresca. Pero, con el tiempo, a los fans les da igual. La música sigue siendo técnicamente impecable: los solos de guitarra son limpios, la voz está afinada, pero la experiencia se ha convertido en una mercancía. La magia se ha ido, reemplazada por una rutina predecible.
La industria de la IA ha llegado a ese mismo estancamiento.
La novedad de un ordenador que habla se ha evaporado. Hemos pasado del shock de ver a un modelo escribir poesía a la molestia de ver el sello de «impulsado por IA» pegado en cada landing page de SaaS como si fuera una calcomanía barata. Esto es el «malestar de la IA» del que habla un reciente artículo de MIT Tech Review, y nace de una brecha enorme entre la ubiquidad y la utilidad real.
La tecnología está por todas partes, pero no está haciendo gran cosa que cambie realmente el flujo de trabajo diario de un desarrollador o un gestor. La mayoría de las «funcionalidades» lanzadas el último año son solo wrappers alrededor de una interfaz de chat. ¿A quién le gusta dedicar veinte minutos a darle prompts a un bot para que le escriba un correo que debería haberle llevado dos? (A mí, desde luego, no). La industria ha optimizado el factor «wow» de una demo, pero la experiencia de usuario real suele ser una versión más lenta y caprichosa de la forma antigua.
La luna de miel ha terminado oficialmente.
La única salida de este malestar es dejar de tratar al LLM como un destino y empezar a tratarlo como un componente. La obsesión actual con la caja de chat es un fracaso de diseño de producto. Un cuadro de texto no es un producto; es una línea de comandos para gente que no sabe programar. El verdadero cambio ocurre cuando el modelo deja de pedir un prompt y empieza a ejecutar una secuencia de tareas de forma autónoma.
Si un sistema puede realmente navegar por un sistema de archivos, llamar a una API y verificar su propia salida sin que un humano le esté agarrando la mano cada tres segundos, el aburrimiento desaparece. Pero aún no estamos ahí. La mayoría de los «agentes» en producción ahora mismo son solo bucles que alucinan en círculos hasta alcanzar un límite de tokens o un timeout. Hay una diferencia enorme entre un modelo que puede describir cómo arreglar un bug y un sistema que puede abrir el PR y pasar el pipeline de CI.
Para el Q4, el mercado se desvinculará de alabar los recuentos de parámetros y empezará a recompensar la fiabilidad agéntica.
Aquí es donde la fricción se vuelve real. Ejecutar un modelo de 70B es caro, y la latencia en las APIs de gama alta sigue siendo suficiente para poner los nervios de punta a un desarrollador. Si sumamos el coste de las GPUs y las facturas de luz, las cuentas de muchas de estas herramientas empresariales «mejoradas con IA» no salen redondas. Las empresas están pagando un premium por ganancias de productividad marginales que son casi imposibles de cuantificar, todo ello añadiendo una capa de imprevisibilidad a la salida.
Es como comprar un horno industrial de grado profesional para tostar una sola rebanada de pan. La capacidad está ahí, pero el caso de uso es trivial. El malestar existe porque el coste de despliegue sigue siendo mayor que el valor percibido de la salida. O quizás el valor esté ahí, pero está enterrado bajo una montaña de ingeniería de prompts que nadie quiere realmente hacer.
Hasta que el coste por token baje otro orden de magnitud o la autonomía aumente, la industria seguirá pareciendo que da vueltas en círculos en medio del barro. Estamos esperando el momento en que la tecnología deje de ser una curiosidad y empiece a ser un servicio. Hasta entonces, es solo más ruido en el feed.