Hugging Face ha anunciado que Safetensors, el formato de almacenamiento de pesos de modelos desarrollado por la compañía, se ha unido oficialmente a la Fundación PyTorch. El proyecto pasará a ser gestionado por la fundación, situándose al mismo nivel que otras tecnologías de código abierto de renombre como PyTorch, DeepSpeed, Ray y vLLM.
Safetensors fue concebido originalmente por Hugging Face para abordar los riesgos de seguridad persistentes en el ámbito del aprendizaje automático. Los formatos de pesos tradicionales solían basarse en Pickle, lo que conllevaba el riesgo de ejecución de código malicioso. A medida que los modelos de código abierto se han convertido en la columna vertebral del ecosistema de inteligencia artificial, este tipo de vulnerabilidades se han vuelto inaceptables.
De proyecto corporativo a activo comunitario
«Queremos que Safetensors pertenezca realmente a la comunidad», afirmó Hugging Face en su comunicado oficial. Aunque el proyecto siempre ha sido de código abierto, su integración en la Fundación PyTorch implica que la marca, el repositorio de código y la gobernanza pasan a manos de la Fundación Linux, dejando de estar bajo el control exclusivo de una sola empresa.
Hugging Face ha señalado que esta medida busca garantizar que el desarrollo a largo plazo del proyecto refleje las necesidades de toda la comunidad. Si bien Luc Georges y Daniel, los principales mantenedores de Hugging Face, seguirán formando parte del comité técnico y gestionando el mantenimiento diario, la estructura de gobernanza del proyecto ha quedado formalizada a través de documentos públicos.
Para la gran mayoría de los desarrolladores, este cambio no tendrá impacto funcional alguno. La API, las integraciones y el estándar del formato Safetensors permanecen inalterados. Los miles de modelos que actualmente operan en Hugging Face Hub seguirán funcionando con total normalidad, sin problemas de compatibilidad.
La esencia de Safetensors reside en su sencillez y seguridad. El formato utiliza una cabecera JSON para describir los metadatos, seguida de los datos de los tensores en bruto. Gracias a su compatibilidad con la carga de «cero copia» (zero-copy) y la carga diferida (lazy loading), los desarrolladores pueden acceder a pesos individuales sin necesidad de deserializar todo el punto de control (checkpoint), lo que mejora significativamente la eficiencia.
Con la consolidación de Safetensors como el formato estándar de la industria para la distribución de modelos, esta transición hacia un modelo de gobernanza comunitaria se considera un hito clave en la madurez de la tecnología. De cara al futuro, Hugging Face planea profundizar su colaboración con el equipo de PyTorch para impulsar la adopción de este formato en una gama más amplia de escenarios.