Vall-E: Ny AI från Microsoft återskapar din röst med enkelhet

Light rods ai
Christopher Burns, Unsplash

Microsoft har skapat en artificiell intelligens som kan analysera din röst och återskapa den nästan perfekt. Allt som behövs är ett kort ljudklipp på tre sekunder med din röst.

Lästips: Skolor förbjuder ChatGPT – risk att elever fuskar

Den nya AI:n använder teknik kan analysera ljudfiler, skapa en ljudprofil för en specifik röst och sedan läsa upp text med nästan perfekt resultat.

Vall-E har tränats med 60 000 timmar tal

Tekniken baseras på Metas Encodec-teknik och AI:n har döpts till Vall-E (vilket osökt får oss att tänka på den söta roboten med nästan samma namn i filmen Wall-E).

Vall-E skapades inte på en dag. Eller ens två. Det krävdes 60 000 timmar av röstmaterial från 7 000 engelskpratande talare för att AI:n skulle tränas till vad den är idag. Det är inte en obetydlig mängd precis.

Wall-E
Vall-E är inte roboten Wall-E. Men nära nog tycker vi. Foto: Disney/Pixar

Lästips: AI-röster läser upp böcker från Apple Books

Vall-E är kapabel att återge röstens emotionella ton och klang. Den kan även simulera den akustiska miljön på ett naturtroget sett, samt få rösten att låta som i ett telefonsamtal. Vi kan bara tänka oss vilka användningsområden Vall-E får i framtiden för support och receptioner.

Om AI:n ska göra ett så bra jobb som möjligt så måste den användas på en röst som liknar någon av de 7 000 talarna som användes för att träna den. Vall-E är alltså inte perfekt på något vis – än.

Microsoft försöker skydda Vall-E från att missbrukas

Målsättningen är att kunna använda den artificiella intelligensen till transkribering, text-till-tal-program och för att skapa ljudmaterial i samarbete med andra tränade AI-modeller.

Vall-E är just nu ett internt projekt inom Microsoft och den kommer att hållas inom bolagets fyra väggar ett tag till. Det finns ingen möjlighet att testa AI:n i skrivande stund.

Det pågår ett aktivt arbete med att säkra Vall-E så att AI:n inte kan användas för att imitera andra personer. Eller på andra sätt missbruka tekniken för illdåd. Huruvida Microsoft lyckas på den punkten återstår att se, men vi vet att människor historiskt har en tendens att ta sig runt alla skyddsbarriärer som byggs upp, hur bra de än må vara.

Via Ars Technica

Mikael Anderberg är en veteran inom teknikvärlden med stor kännedom kring tillverkare, nya tekniker och produkter. Har mångårig erfarenhet från blogg- och it-världen vilken bidrar till utvecklingen av Tekniksmart tillsammans med andra entusiaster. Mikael har i grunden expertis inom fotografering och kamerautrustning, copywriter och content editing, och SEO. Läs mer om mig här.