33.6 C
Colombia
sábado, julio 5, 2025

Weblog de Posit AI: tensores de seguridad 0.1.0


safetensors es una herramienta nueva, sencilla, rápida y segura formato de archivo para almacenar tensores. El diseño del formato de archivo y su implementación authentic está a cargo de Hugging Face, y se está volviendo cada vez más adoptado en gran medida en su fashionable marco de ‘transformadores’. El paquete Safetensor R es una implementación pura de R, que permite leer y escribir archivos Safetensor.

La versión inicial (0.1.0) de los tensores de seguridad ahora está en CRAN.

Motivación

La principal motivación para los tensores de seguridad en la comunidad Python es la seguridad. Como se señala en el documentación oficial:

El motivo principal de esta caja es eliminar la necesidad de utilizar pickle en PyTorch, que se utiliza de forma predeterminada.

Pickle se considera un formato inseguro, ya que la acción de cargar un archivo Pickle puede desencadenar la ejecución de código arbitrario. Esto nunca ha sido una preocupación para los usuarios de R, ya que el analizador Pickle que se incluye en LibTorch solo admite un subconjunto del formato Pickle, que no incluye la ejecución de código.

Sin embargo, el formato de archivo tiene ventajas adicionales sobre otros formatos de uso común, que incluyen:

  • Soporte para carga diferida: puede optar por leer un subconjunto de los tensores almacenados en el archivo.

  • Copia cero: leer el archivo no requiere más memoria que el archivo mismo. (Técnicamente, la implementación precise de R hace una sola copia, pero se puede optimizar si realmente la necesitamos en algún momento).

  • Easy: implementar el formato de archivo es easy y no requiere dependencias complejas. Esto significa que es un buen formato para intercambiar tensores entre marcos de ML y entre diferentes lenguajes de programación. Por ejemplo, puede escribir un archivo de tensores de seguridad en R y cargarlo en Python, y viceversa.

Existen ventajas adicionales respecto a otros formatos de archivos habituales en este espacio, y puedes ver una tabla comparativa aquí.

Formato

El formato de los tensores de seguridad se describe en la siguiente figura. Básicamente es un archivo de encabezado que contiene algunos metadatos, seguidos de búferes tensoriales sin formato.

Diagrama que describe el formato de archivo de los tensores de seguridad.

Uso básico

Los tensores de seguridad se pueden instalar desde CRAN usando:

Nick Fewings en desempaquetar

Reutilizar

El texto y las figuras tienen licencia Artistic Commons Attribution. CC POR 4.0. Las figuras que han sido reutilizadas de otras fuentes no están cubiertas por esta licencia y pueden reconocerse por una nota en su pie de foto: “Figura de…”.

Citación

Para atribución, cite este trabajo como

Falbel (2023, June 15). Posit AI Weblog: safetensors 0.1.0. Retrieved from https://blogs.rstudio.com/tensorflow/posts/2023-06-15-safetensors/

Cita BibTeX

@misc{safetensors,
  creator = {Falbel, Daniel},
  title = {Posit AI Weblog: safetensors 0.1.0},
  url = {https://blogs.rstudio.com/tensorflow/posts/2023-06-15-safetensors/},
  12 months = {2023}
}

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles