Schibsted delade känslig data med OpenAI i ett helt år

Frågan är – hur stor skada är skedd innan missen upptäcktes?

Schibsted har enligt flera uppgifter råkat dela intern information med OpenAI under en längre tid. Det handlar om material som normalt ska stanna i bolagets egna system, bland annat interna kommentarer, källuppgifter och annan känslig information kopplad till journalistiskt arbete. Felet upptäcktes efter en teknisk miss i kopplingen mellan Schibsteds system och OpenAI:s tjänster.

TL;DR

  • Schibsted ska ha delat intern information med OpenAI av misstag i mer än ett år.
  • Uppgifterna kan ha omfattat interna kommentarer, källors kontaktuppgifter och andra känsliga noteringar.
  • Felet kopplas till en teknisk koppling mellan Schibsteds system och OpenAI.
  • Schibsted och OpenAI har ett samarbete där AI-bolaget får träna på mediehusets material.
  • Schibsted uppger att felet nu är stoppat och att en intern genomgång pågår.
  • Bolaget säger att OpenAI har filtrerat bort den interna informationen och inte använt den.

Vad som hände

Enligt uppgifter som först rapporterats av bland andra Breakit, Dagens Media och norska medier ska Schibsted under mer än ett års tid ha delat data med OpenAI på ett sätt som inte var avsett. Det ska ha skett genom en teknisk koppling mellan systemen, där information från interna miljöer blev tillgänglig för AI-tjänster.

Det som väckt störst oro är att materialet inte bara kan ha bestått av publicerat innehåll, utan också av sådant som normalt hanteras internt. Exempel som nämnts är kommunikation mellan journalister och redaktörer, anteckningar i redigeringsverktyg, källors kontaktuppgifter och andra uppgifter som kan vara känsliga.

Hur samarbetet såg ut

Schibsted har sedan tidigare ett strategiskt samarbete med OpenAI kring AI-teknik och innehållsintegration. I praktiken innebär det att OpenAI får tillgång till Schibsteds journalistik för att träna sina modeller. Det var i samband med denna typ av integration som den felaktiga datadelningen ska ha uppstått.

Enligt uppgifterna handlade det om interna kommentarer i Schibsteds publiceringsverktyg. Sådana kommentarer används bland annat för återkoppling på artiklar, utkast, kladdar och transkribering av intervjuer. De kan också innehålla överlämningar med kontaktuppgifter till källor.

Schibsteds besked efter upptäckten

Schibsted uppger att delningen stoppades direkt när läckan upptäcktes. Kommunikationschef Petter Ovander säger att incidenten tas på största allvar och att bolaget nu går igenom sina rutiner för att undvika att något liknande händer igen.

Kommunikationsdirektör Bjørn-Martin Bache-Nordby uppger också att OpenAI har bekräftat att de interna kommentarerna inte varit relevanta för deras användning och därför filtrerats bort automatiskt. Enligt honom har informationen alltså inte exponerats för utomstående och inte heller använts av OpenAI.

Samtidigt säger Schibsted att man nu utreder omfattningen av incidenten internt. Bolaget har inte offentliggjort exakt vilka typer av uppgifter som kan ha omfattats, men beskriver dem som konfidentiella uppgifter som inte var avsedda att lämna den interna miljön.

Varför händelsen är känslig

Det som gör situationen allvarlig är att den rör journalistiskt arbete, där både interna processer och källskydd är centrala. Om interna anteckningar eller kontaktuppgifter till källor hade kommit ut på fel sätt hade det kunnat skapa problem för både redaktionerna och de personer som medverkar i deras arbete.

Även om Schibsted och OpenAI nu säger att uppgifterna filtrerats bort, visar händelsen hur känsligt det blir när interna redaktionella system kopplas ihop med externa AI-tjänster. Bolaget säger därför att man nu ser över sina tekniska och organisatoriska rutiner.

Via Breakit

Mikael Anderberg är en veteran inom teknikvärlden med stor kännedom kring tillverkare, nya tekniker och produkter. Har mångårig erfarenhet från blogg- och it-världen vilken bidrar till utvecklingen av Tekniksmart tillsammans med andra entusiaster. Mikael har i grunden expertis inom fotografering och kamerautrustning, copywriter och content editing, och SEO. Läs mer om mig här.