Comprar una cafetera espresso dedicada de gama alta es una jugada extraña si ya tienes una multicocina que técnicamente puede vaporizar leche. Estás pagando por una herramienta que hace una sola cosa—extraer un espresso—con precisión obsesiva. Microsoft acaba de hacer exactamente lo mismo con la automatización de navegadores. En lugar de un modelo de propósito general capaz de escribir poesía y código, han soltado Fara1.5, una familia de agentes diseñada específicamente para hacer clic en botones y rellenar formularios.

La estrella del asunto es el modelo de 27B. Según MarkTechPost, el Fara1.5-27B está marcando el 72 % en el benchmark Online-Mind2Web. Para contextualizarlo, supuestamente está dejando atrás a OpenAI Operator y Gemini 2.5 en tareas de uso informático. Microsoft también ha soltado versiones de 4B y 9B para quienes no tengan un rack de servidores en el trastero, junto con FaraGen1.5, la tubería de datos sintéticos empleada para entrenarlos.

¿Quién quiere realmente confiar en un modelo de 4B con su navegador? (Probablemente nadie que tenga una cuenta bancaria). Pero para el aficionado, el de 27B es el único que importa. Si esto se publica bajo una licencia permisiva, cambia por completo el juego de los agentes locales. Hemos pasado meses intentando que Llama 3.3 o Qwen2.5 actúen como operadores de navegador fiables, pero esos son generalistas. Se distraen con facilidad. Fara es un especialista.

Hablemos de hardware, porque ahí es donde se juega el partido. Un modelo de 27B es un tamaño curioso. Es demasiado grande para una tarjeta de 16 GB a alta precisión, pero es el punto dulce absoluto para quien use una 3090 o 4090. Con una cuantización GGUF o EXL2 de 4 bits, te encontrarás con unos 15-18 GB de VRAM. Eso deja justo el margen necesario para una ventana de contexto decente y la sobrecarga del navegador. Si usas un Mac M3 o M4 Ultra, esto debería volar—probablemente alcanzando 30-50 tokens por segundo vía MLX o llama.cpp.

Si estos pesos están realmente abiertos y no están blindados tras algún formulario corporativo de «solicitar acceso», podemos esperar que lleguen a Ollama o LM Studio casi de inmediato. La verdadera pregunta es si el rendimiento se mantiene una vez que lo cuantizas. La mayoría de los modelos de «uso informático» son frágiles; un mínimo de pérdida de precisión y el modelo empieza a hacer clic en «Cancelar» en lugar de «Enviar».

Pero aquí está el truco: la licencia. Microsoft tiene el hábito de lanzar modelos con licencias «personalizadas» que parecen Apache 2.0 pero tienen suficiente letra pequeña para mantener ocupado a un equipo legal durante un mes. Si esto no es una licencia Apache 2.0 o MIT limpia, no es una herramienta—es una demo. Ya hemos visto esta coreografía. Te dan los pesos para demostrar que pueden vencer a OpenAI, pero mantienen la correa comercial bien apretada.

También está el problema de los datos sintéticos. FaraGen1.5 es el motor que hizo posible el modelo de 27B, pero si esa tubería sigue siendo propietaria, la comunidad solo recibe el pez, no la caña. Podemos ejecutar el modelo, pero no podemos mejorarlo fácilmente para nuevos diseños web o aplicaciones empresariales específicas sin esa lógica de generación de datos.

Es un grabador de macros con mucho barniz.

Dicho esto, el impulso se está desplazando hacia la agencia local. Hemos pasado de «¿puede chatear?» a «¿puede programar?» y ahora a «¿puede realmente hacer el trabajo?» En menos de 8 semanas, veremos un fine-tuning comunitario de Fara1.5-27B que supere al modelo base específicamente en Chrome, probablemente utilizando un adaptador QLoRA para afilar su interacción con las estructuras DOM modernas. Si los pesos están realmente disponibles, la carrera por construir un «Operator» local y privado se acaba de volver mucho más interesante.