Hugging Face ha publicado un plan técnico dirigido a desarrolladores que buscan integrar inteligencia artificial local en extensiones de Chrome mediante la librería Transformers.js.
La guía, publicada por el desarrollador Nico Martin, detalla la arquitectura de una extensión de navegador lanzada recientemente y potenciada por el modelo Gemma 4 E2B. El proyecto funciona como una referencia para ejecutar funciones de IA de forma local, respetando las restricciones del entorno de ejecución Manifest V3 de Chrome.
Según la documentación, la arquitectura propuesta se basa en un sistema de tres partes: unservice workeren segundo plano para alojar los modelos, un panel lateral (side panel) para la interfaz de chat y uncontent scriptpara interactuar con las páginas web.
Optimización para Manifest V3
Implementar IA en un entorno de navegador exige una división estricta de tareas para mantener el rendimiento y la seguridad. La guía especifica que elservice workerde fondo actúa como el «plano de control», gestionando el ciclo de vida del agente, la inicialización del modelo y la ejecución de herramientas.
Esta decisión de diseño busca mantener la capacidad de respuesta de la interfaz de usuario, evitando el alto coste de recursos que supondría cargar modelos duplicados. El panel lateral actúa como la capa de interacción para la entrada y salida del chat, mientras que elcontent scriptfunciona como puente para la extracción de datos del DOM y el resaltado de elementos en la página.
«La decisión de diseño clave es mantener la orquestación pesada en segundo plano y dejar la lógica de la interfaz y de la página lo más ligera posible», escribió Martin en el informe técnico.
Debido a que los entornos de ejecución están separados, es necesario un contrato de mensajería robusto para facilitar la comunicación. En el proyecto presentado, elworkerde fondo mantiene el historial de la conversación. Cuando un usuario interactúa con la interfaz, el panel lateral envía eventos como «AGENT_GENERATE_TEXT» al proceso de fondo, el cual realiza la inferencia y envía las actualizaciones de vuelta a la interfaz.
Esta arquitectura aborda específicamente las limitaciones de Manifest V3, como las estrictas reglas sobre el ciclo de vida de losservice workersy la gestión de la memoria. Al centralizar el motor de Transformers.js en el script de fondo, la extensión puede mantener capacidades de IA persistentes incluso cuando el panel lateral está cerrado.