Arkiv

Lyssna på dina dokument i Google Docs med AI-skapade ljudsammanfattningar

Ljudsammanfattningar med AI fungerar bara för betalande Workspace-användare – just nu.

  • Google Docs lanserar AI‑skapade ljudsammanfattningar via Gemini
  • Sammanfattningarna är oftast kortare än tre minuter
  • Funktionen finns under Verktyg > Ljud > Lyssna på dokumentsammanfattning
  • Användare kan justera uppspelningshastighet och röststil
  • Tekniken bygger på Googles forskningsverktyg NotebookLM

Google började testa en Gemini‑driven dokumentläsare under förra året. Nu introduceras samma teknik direkt i Google Docs. Med den nya funktionen skapar systemet en kort, uppläst sammanfattning av dokumentets innehåll. Resultatet liknar en kort podcast snarare än ett traditionellt hjälpmedel i ett ordbehandlingsprogram.

Sammanfattningarna hämtar information från flera flikar i samma dokument och presenterar de viktigaste punkterna i ett koncentrerat format. Längden ligger vanligtvis under tre minuter.

Så fungerar tekniken bakom

Gemini analyserar dokumentets innehåll med hjälp av naturlig språkbehandling. Modellen identifierar centrala begrepp och huvudbudskap, skriver ett sammanhängande manus och skickar vidare texten till ett talsyntessystem som omvandlar den till tal.

Användaren kan välja mellan olika röstlägen, som berättare, övertygare eller coach. Det går även att justera uppspelningshastigheten mellan 0,5× och 2×, pausa, spola tillbaka och byta röst utan att lämna dokumentet.

Tekniken bygger på NotebookLM, ett experimentellt forskningsverktyg som redan använder Gemini för att skapa upplästa studienoteringar. Integrationen i Docs markerar första gången Google placerar samma sammanfattningsmotor direkt i sin ordinarie kontorsmiljö för företag och utbildning.

Del av en större AI‑satsning

Lanseringen passar in i Googles bredare strategi att integrera generativ AI i hela Workspace. Företaget utvecklar skrivverktygen från rena textredigerare till multimodala assistenter som kombinerar text, analys och ljud.

Google inledde utrullningen den 12 februari. Det kan ta upp till 15 dagar innan alla behöriga konton får tillgång.

Tillgänglighet och användningsområde

Funktionen är i nuläget begränsad till betalande användare. Den omfattar abonnemang som Google AI Pro och Ultra, Business Standard och Plus, Enterprise Standard och Plus samt tillägg för Google AI inom utbildning och företag.

Google framhåller att ljudsammanfattningarna inte ersätter noggrann genomläsning av viktiga dokument.

I stället fungerar verktyget som ett komplement för den som hanterar stora filer eller snabbt vill uppdatera sig om gemensamt arbete. På så sätt omvandlar Google Docs dokument till ett personligt ljudflöde som går att lyssna på vid behov.

Via PCMag

Mikael Anderberg är en veteran inom teknikvärlden med stor kännedom kring tillverkare, nya tekniker och produkter. Har mångårig erfarenhet från blogg- och it-världen vilken bidrar till utvecklingen av Tekniksmart tillsammans med andra entusiaster. Mikael har i grunden expertis inom fotografering och kamerautrustning, copywriter och content editing, och SEO. Läs mer om mig här.