Meta piratkopierade 82 terabyte e-böcker för att träna sin AI

Meta anklagas för att ha laddat ner enorma mängder piratkopierade e-böcker via bittorrent för att träna modellerna till bolagets AI.

Det finns pågående stämningsansökningar mot Meta där författare påstår att just deras böcker använts i AI-träningen – och med nya uppgifter känns det allt mer sannolikt.

Mark Zuckerberg gav klartecken till piratkopiering

Redan för flera månader sedan kom de första uppgifterna att Metas VD, Mark Zuckerberg, gav klartecken till användning av piratkopierat material. Nu har vi ytterligare uppgifter som styrker de påståendena.

Enligt påstått läckta mejl som dateras tillbaka till oktober 2022 indikeras att anställda på Meta laddade ner extrema mängder piratkopierade böcker. Hela 82 terabyte vilket är en ofantlig mängd då en enda bok normalt sträcker sig mellan 500 kb och 3-4 MB beroende på bok och format.

Mejlen involverar både vanliga anställda och personer med chefsbefattningar inom bolaget. Här är några mejl och deras innehåll:

Oktober 2022: Melanie Kambadur skriver att hon vägrar delta i piratkopiering som form av datainsamling.

April 2023: Nikolay Bashlykov ansvarar för datainsamlingen och skriver att ”torrenting från en företagsdator inte känns bra” samt att bolaget måste vara försiktig med IP-adresser när de laddar ner innehållet.

September 2023: Nikolay Bashlykov varnar för så kallad ”seeding” med efterföljande diskussioner kring seeding som ett problem för legaliteten i vad de gör.

Meta förnekar alla anklagelser

Det finns även uppgifter från Meta-forskaren Frank Zhang som pekar på att Meta medvetet försökte dölja sina förhavanden genom att hindra de egna servrarna från att utföra seeding, dvs blockera dem från att skicka data ut till torrentnätverken.

Totalt ska 81,7 terabyte e-böcker ha laddats ner från sajter som Z-Library och LibGen. Båda är numera nedstängda.

Meta har svarat på stämningarna och föga förvånande säger bolaget att de bestämt avvisar samtliga anklagelser som riktas mot dem. Bolaget menar att det inte finns några som helst bevis på nedladdning eller distribuering av piratkopierat material.

Llama baseras på öppen källkod – eller?

Llama är AI-modellen som står i fokus hos Meta när bolaget tvingas till domstol av författarna.

Författarna som står i fokus är Sarah Silverman och Ta-Nehisi Coates. Båda säger att sig veta att Meta använt just deras böcker till att träna Llama-modellen.

Sarah Silverman är mest känd som skådespelare och komiker, men har även skrivit böcker som ”The Bedwetter”. Ta-Nehisi Coates är en journalist och författare som har skrivit böcker som ”The Message” och ”The Water Dancer”.

The Elder Scrolls V: Skyrim släppt till Switch 2

GTA VI försenas igen – släpps 19 november 2026

8 retrospel som fortfarande är otroligt roliga idag

Ett Xbox i kris – krav på 30 % vinstmarginal slår mot spelarna

Sony avslöjar ny grafikteknik för kommande PS6

Google åtgärdar inte allvarlig säkerhetslucka i Gemini

Nu kan du styra Spotify med ChatGPT

Meta tar ALLT du skriver i AI-chattar för hyperriktade annonser

Nu kan ChatGPT handla åt dig

Så mycket får du använda Google Gemini AI gratis varje månad

Meta piratkopierade 82 terabyte e-böcker för att träna sin AI

Mark Zuckerberg gav klartecken till piratkopiering

Meta förnekar alla anklagelser

Llama baseras på öppen källkod – eller?

The Boys får en femte och sista säsong – släpps april 2026

Lambo.com skulle säljas för 75 miljoner dollar – lämnades över gratis

Nu kan du använda Adobes program direkt i ChatGPT

Sellpy granskas av Konsumentverket i ett tillsynsärende

Så tar du bort alla AI-funktioner från Windows 11

The Elder Scrolls V: Skyrim släppt till Switch 2

GTA VI försenas igen – släpps 19 november 2026

8 retrospel som fortfarande är otroligt roliga idag

Ett Xbox i kris – krav på 30 % vinstmarginal slår mot spelarna

Sony avslöjar ny grafikteknik för kommande PS6

Så mycket kostar det att reparera iPhone Air och iPhone 17-serien

Så mycket kostar det att laga eller ersätta AirPods Pro 3

Insta360 Go Ultra är vattentät (IPX8) ned till 10 meter

Google Pixel 10 är vädertätad (IP68) med vattentålig design

Hoppa över åldersverifiering på webben med NextDNS