La placa Coral de Google: ejecución loca…

¿Recuerdan cuándo la Raspberry Pi prometía reemplazar al PC de escritorio y nosotros básicamente solo los usábamos para ejecutar Pi-hole y automatización básica del hogar? Google está intentando una jugada similar con la nueva placa Coral.

El anuncio, detallado por The Decoder, presenta un ordenador de placa única compacto diseñado específicamente para ejecutar Gemma 3 de forma local. A primera vista, parece un triunfo para la comunidad «local-first». Obtenemos un silicio dedicado optimizado para el modelo, evitando la lucha habitual de intentar meter un modelo en un presupuesto limitado de VRAM. Pero hay una gran diferencia entre «funciona» y «es útil». Para el desarrollador que ya tiene una 4090 o un Mac M4 Ultra, una placa diminuta es una curiosidad, no una herramienta. Para el desarrollador de edge computing, es una apuesta sobre si la pila de software de Google será realmente accesible o si será un jardín amurallado con una valla muy pequeña.

Google está intentando una jugada de integración vertical al empaquetar el modelo con el silicio. No se trata solo de hardware; se trata de control. Al proporcionar la placa y el modelo, Google se asegura de que Gemma 3 tenga un «hogar» donde rinda exactamente como se pretende. (Y probablemente a un precio que favorezca los despliegues empresariales sobre los aficionados). El problema es que este enfoque ignora la realidad de cómo funciona realmente la comunidad de pesos abiertos. No queremos una experiencia curada; queremos acceso crudo.

La licencia de Gemma 3 sigue siendo un punto de fricción. No es Apache 2.0. Aunque es lo suficientemente permisiva para la mayoría de los usos comerciales, es una licencia personalizada que mantiene a los abogados de Google en el bucle. Al compararlo con la libertad de una licencia verdaderamente abierta, la placa Coral empieza a sentirse menos como un kit de desarrollo y más como una correa. Es como intentar montar una cocina profesional en una tostadora: técnicamente puede cocinar la comida, pero estás limitado por las dimensiones de la ranura.

La jerarquía de los pesos abiertos está dominada actualmente por Qwen y Llama. Para que la placa Coral importe, Gemma 3 necesita superar a Llama 3.3 o Qwen 2.5 en el rango de parámetros pequeños. Si las versiones de 4B u 8B de Gemma 3 no ofrecen un salto significativo en razonamiento o capacidad de codificación, la placa es solo una forma elegante de ejecutar un modelo mediocre. La mayoría de nosotros no buscamos una placa dedicada; buscamos una cuantización GGUF o EXL2 que podamos meter en Ollama o llama.cpp y obtener 50+ tokens por segundo.

Si estás ejecutando una 3090 o 4090, ya tienes la «placa Coral» definitiva. Tienes la VRAM para ejecutar las versiones cuantizadas de casi cualquier modelo pequeño o mediano con una latencia despreciable. La verdadera pregunta es si la placa Coral puede ofrecer algo que esas GPUs no puedan, como eficiencia energética en el extremo edge. Pero si la latencia es alta y los tokens por segundo son abismales, la eficiencia no importa. ¿Por qué alguien compraría esto en lugar de una Jetson de segunda mano o un NUC con una GPU de perfil bajo?

La fricción estará en el SDK. Las herramientas de hardware de Google tienen el historial de ser poco pulidas y estar mal documentadas para el desarrollador medio. Si la placa requiere un compilador propietario para obtener un rendimiento real de Gemma 3, la comunidad la ignorará. Queremos soporte para MLX en los Macs y soporte para vLLM o sglang en las máquinas Linux.

Gemma 3 será superada por una actualización de Qwen para el cuarto trimestre.

Es un elegante posavasos hasta que el SDK se ponga al día.

Cobertura relacionada

OpenAI Contrata a un Ejecutivo de Vision Pro de Apple para Crear su División de Hardware

La brecha de escalabilidad en la refrigeración de estado sólido y el descubrimiento de fármacos con IA

Ejecutar DeepSeek-V4-Flash en AMD MI300X: Desafíos de hardware y software

LetinAR y el cuello de botella de hardware de las gafas de IA