30.9 C
Colombia
domingo, julio 6, 2025

Meta entrenó su IA en las bibliotecas de la sombra pirata


Meta entrenó su IA en las bibliotecas de la sombra pirataMeta entrenó su IA en las bibliotecas de la sombra pirata

Según los correos electrónicos Unsaled publicados el jueves, Meta capacitó su IA en libros electrónicos pirateados. El mes pasado, Meta admitió torrenciar un controvertido gran conjunto de datos de Libgen, que incluye decenas de millones de libros pirateados. Sin embargo, los detalles alrededor del torrenting fueron turbios hasta ayer, cuando los correos electrónicos no redactados de Meta se hicieron públicos por primera vez. La nueva evidencia mostró que meta torrentó “al menos 81.7 terabytes de datos en múltiples bibliotecas de sombras como Anna’s Archive, Z-Biblyry y Libgen”.

Los correos electrónicos que se revelaron se debieron al bufete de abogados de Joseph Saveri presentado Federal de EE. UU. demandas colectivas en nombre de Sarah Silverman y otros autores contra OpenAi y Meta, acusando a las empresas de usar ilegalmente materials con derechos de autor para capacitar a modelos de idiomas de IA como Chatgpt y Llama.

“The magnitude of Meta’s illegal torrenting scheme is astonishing,” the authors’ submitting alleged, insisting that “vastly smaller acts of information piracy—simply .008 p.c of the quantity of copyrighted works Meta pirated—have resulted in Judges referring the conduct to the Oficina de Fiscales de los Estados Unidos para la Investigación Penal “.

Aquí es básicamente lo que hizo Meta. El private piratearía libros con computadoras portátiles de trabajo que no estaban conectadas con los servidores de la empresa. Accederían a un gran tesoro de archivos BitTorrent y pensaron que si no sembraran los archivos, entonces no había nada malo.

Estos son algunos de los hallazgos clave de los correos electrónicos y documentos.

  • Este documento contiene admisiones de que Meta sabía que Libgen period pirateado (es decir, ilegal) y expresa preocupación por lo que sucederá si
    Los reguladores aprenden que Meta está capacitando LLAMA en datos con derechos de autor pirateados.
  • Este documento sugiere que el abogado interno de Meta aconsejó a Meta que detuviera sus esfuerzos para licenciar trabajos con derechos de autor y, en su lugar, utilizar trabajos pirateados exclusivamente.
  • En una cadena de mensajes, Erin Murray explica que el modelo de OpenAi probablemente esté entrenado en Smashwords y Libgen.
  • Este documento muestra que los meta empleados deciden no usar “FB [Facebook] infra[structure]”Para su” descarga de datos “de bases de datos pirateadas para” evitar el riesgo de correr el sembrador/descargador de los servidores FB “.

Envolver

Según Google, el libro electrónico de Kindle promedio es de 2.6 MB. en tamaño. Meta entrenó su IA en 35.7 terabytes de datos de estas 3 bibliotecas de sombras, por lo que llega a más de 31,423,076 libros que se descargaron de Torrents. Me parece reprensible que Meta ni siquiera le pareciera viable pagar por un Lisense ampliado para poseer los libros y capacitar a su IA en esos. En cambio, hicieron la ruta fácil e hicieron cosas ilegales.

Me parece muy possible que no obtengan nada más que una palmada en la muñeca y tal vez una pequeña multa. Todo depende de la acción de clase y si tienen que pagar mucho más. Lo que me parece interesante son las mismas compañías que usaron contenido pirateado para capacitar a su IA, también son las que intentan cerrar las bibliotecas de sombras, para que nadie más pueda usar los mismos datos.

Michael Kozlowski es el editor en jefe de Good E-Reader y ha escrito sobre audiolibros y lectores electrónicos durante los últimos quince años. Los periódicos y sitios net como CBC, CNET, Engadget, Huffington Submit y el New York Instances han recogido sus artículos. Vive en Vancouver, Columbia Británica, Canadá.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles