Meta använder piratkopierade böcker för att träna AI

Meta

Meta erkänner att bolaget använder piratkopierade böcker för att träna artificiell intelligens. Men några pengar kan författarna inte räkna med – Meta vill nämligen inte betala.

De piratkopierade böckerna som Meta använder finns i ett så kallat dataset som heter Books3. Det är en massiv samling på 195 000 böcker med en storlek på hela 37 GB.

Lästips: Facebook: Vi tänker inte berätta om din data har läckt ut

Används för att träna AI-modeller

Arkivet skapades av AI-forskaren Shawn Presser för att kunna användas som datakälla vid träning av algoritmer till maskininlärning. Och sedan skapandet 2020 har arkivet använts flitigt för att träna AI-modeller.

Och Meta är inte ensamma. Även andra kända bolag använder material som är upphovsrättsskyddet för att träna AI-modeller. OpenAI har sagt att det är omöjligt att träna AI-modeller utan skyddat material, och säger att alla former av kompensation ska nekas.

Meta vill inte kompensera författare

Även Meta har sagt att även om bolaget använder Books3 så har de inte gjort något fel. I ett uttalande menar bolaget att användandet av upphovsrättsskyddat material för att träna LLM:s inte kräver ”tillåtelse, erkännande eller kompensation”.

Lästips: Facebook och Instagram blir reklamfria – från 120 kr per månad

Meta säger också att all användning av Books3 ska anses som skäligt bruk, eller ”fair use” som det heter på engelska.

Vi gissar att Meta skulle se på de hela med helt andra ögon om någon försöker ta data från företaget istället. Forskare som har använt verktyg för att göra så kallad ”scraping” av data från Facebook har blivit bemötta med snabba nedstängingar. Och att kalla något ”fair use” verkar inte gå åt båda hållen.

Via Torrentfreak

Mikael Anderberg är en veteran inom teknikvärlden med stor kännedom kring tillverkare, nya tekniker och produkter. Har mångårig erfarenhet från blogg- och it-världen vilken bidrar till utvecklingen av Tekniksmart tillsammans med andra entusiaster. Mikael har i grunden expertis inom fotografering och kamerautrustning, copywriter och content editing, och SEO. Läs mer om mig här.