Når stemmen er dit liv - TEKNOLOGI & HVERDAG

Det tog mig nogle dage at finde…modet…til at lytte den episode af DR-podcasten Prompt, hvor radiovært Jesper Dein var gæst hos Henrik og Marcel.

Det er ellers normalt en rigtig rar oplevelse at høre Prompt – og lytte til Jesper – men jeg havde hørt at Jesper skulle fortælle om sine erfaringer med at lave en klon af sin stemme, og det føltes på en eller anden måde lidt grænseoverskridende.

Jeg har ganske vist også selv et par gange eksperimenteret med stemmekloning selv, men det dér med stemmer og identitet er altså – hvis man vil tilgive mig at være lidt primadonna – noget som kræver et vist overskud at tackle, fordi det kommer så tæt på hverdagen.

Jespers historie

Anyway, det viste sig – på godt og ondt – at være meget hårdere end jeg troede…

Hvis man ikke har hørt episoden, og gerne vil begynde dér, så kan man stoppe med at læse her og lytte i stedet – selvom jeg naturligvis håber at man kommer tilbage og læser videre bagefter…

Men Jesper Dein kom altså på besøg i studiet cirka en halv time inde i episoden, og lød jo slet ikke som sig selv. Luftig, rusten, presset og…flad.

Jeg er muligvis en af de sidste i radiomiljøet som ikke havde hørt, at Jesper tidligere på året havde en hjerneblødning, som blandt andet har betydet at hans ene stemmelæbe ikke længere fungerer ordentligt.

Konsekvensen er, at hans stemme idag ikke længere lyder som den plejede – og næppe nogensinde kommer til det igen.

Allerede dér var jeg ved at komme til at græde, selvom jeg gik på åben gade, fordi det nok er en af de ting jeg er mest bange for – at miste min stemme.

(Jaja, selvfølgelig er der mange andre ting, som er højere på listen – min families ve og vel, KlimApokalypsen(tm), atomkrig, etc. etc – men sådan i forhold til mit eget liv og mit arbejde).

Jeg vil ikke spoile hele episoden af Prompt, men Jesper fortæller ekstremt åbent om sine tanker om ikke længere at lyde som sig selv og som den radio- og tv-person, som millioner af danskere kender så godt.

AI-stemmeklon

Men Jesper er selvfølgelig også i Prompt for at fortælle om sine forsøg med at lave en AI-genereret klon af sin stemme, som han afprøver sammen med Marcel og Henrik i studiet.

Nogle af dem lyder virkelig meget som “gamle” Jesper, andre er mere clunky, men overordnet er det virkelig imponerende – i en grad så de også diskuterer, om Jesper måske bare kan bruge sin stemmeklon til at lave de speaks han ellers selv har indtalt foran mikrofonen tidligere?

Nå, men hvis man ikke har hørt det endnu, er det afgjort værd at lytte.

Min stemme, mit liv

Som sagt blev jeg virkelig rørt af at lytte til Jespers oplevelser, ikke kun fordi jeg kender ham en smule fra DR og fordi han åbenlyst har haft en virkelig hård og traumatiserende tid, men også fordi det med at miste sin stemme er noget jeg selv har været bange for i mange år.

Det er naturligvis lidt selvcentreret at bruge Jesper Dein til at tale om mig selv, men hey, det er jo også det man har en blog til…så her kommer navlepilleriet.

Hvis man vil tilgive mig den primadonna-agtige selvfedhed et øjeblik, så har jeg jo ligesom Jesper levet af min stemme i over 25 år efterhånden.

Min stemme

Folk har gennem årene været ekstremt søde til at komplimentere mig for min stemme, jeg bliver stadig relativt ofte genkendt på stemmen, og jeg er hundrede procent sikker på at min stemme er en stor del af årsagen til at jeg har været så privilegeret i mit arbejdsliv.

Nu er det jo virkelig rart at blive rost og at kunne tjene penge på bare at åbne munden og sige ting (selvom jeg tillader mig også at tro at der er lidt mere på spil, både i forhold til at kunne bruge stemmen, og at tænke over hvad det er jeg siger).

Omvendt, så føles det også indimellem helt forkert, ufortjent og nogle gange næsten utilsigtet nedladende at få at vide at jeg har en god stemme.

For det er jo ikke min fortjeneste – det er bare noget jeg har været heldig at være født med. Eller rettere, at udvikle som voksen – da jeg var dreng var jeg sopran i et kor, men afgjort ikke særlig fantastisk at høre på.

Jeg forestiller mig, at det må være lidt som at være smuk og blive komplimenteret for sit udseende. Ja, det er jo dejligt at andre synes man ser godt ud, men igen – det er jo ikke noget man har særlig meget kontrol over eller kan tage æren for.

Og bagved den tanke lurer så også frygten for hvad der ville ske, hvis jeg en dag mistede stemmen, eller hvis min stemme – ligesom Jespers – ikke længere lød som den plejede.

Normalt bliver jeg forkølet 2-3 gange om året, og har derfor regelmæssigt nogle dage, hvor jeg snøvler og min stemme lyder nasal eller rusten, og hvor jeg af samme årsag føler mig lidt ved siden af mig selv.

Så hvordan må det ikke føles at få at vide, at ens stemme permanent har forandret sig?

Og her taler jeg ikke nødvendigvis kun om, at jeg måske ikke længere ville kunne lave podcasts, holde foredrag eller være moderator – selvom det naturligvis også er en stor bekymring, for det er trods alt det jeg lever af.

Det handler dog især og langt mere grundlæggende om identitet.

Hvem er jeg, hvis jeg ikke længere lyder som jeg plejer? Og hvad vil andre nu tænke om mig, hvis jeg ikke længere har en stemme de kan lide?

Det lyder garanteret overdrevet, men jeg sammenligner det lidt med ideen om en fotomodel, der måske brækker næsen eller får en hudsygdom, og som derfor ikke længere ser ud som den person, de har identificeret sig med og er blevet identificeret som.

AI to the rescue?

Som man fornemmer dukkede der mange tanker op i kølvandet på episoden med Jesper, selvom det altså også er noget jeg har spekuleret en del over før.

Jeg er dog slet ikke færdig med den selvoptagede udforskning af de mulige implikationer af den (forhåbentlig) hypotetiske situation at jeg en dag skulle miste stemmen.

Men nu laver jeg jo også selv podcast om AI, og man skal jo ikke lade en god undskyldning for dimseri smutte mellem fingrene.

Så efter at have lyttet Prompt-episoden og tørret kinderne, gik jeg straks tilbage på kontoret og tog et nyt abonnement hos AI-folkene i Elevenlabs.

Min AI-stemmeklon

Det er som antydet ikke første gang jeg prøver at lave en AI-genereret kopi af min stemme.

Første gang, for omkring halvandet år siden, var resultatet mildest talt mekanisk, og jeg kunne ikke engang få den til at tale dansk.

Anden gang, for ni måneder siden, kunne Klon-Anders dog allerede tale dansk, og det var helt åbenlyst noget der lød som min stemme, selvom det også ret tydeligt ikke var mig.

Men i denne uge prøvede jeg så igen, og uploadede mere end tre timers studie-optagelser af mig selv til Elevenlabs, som tyggede på lydfilerne i nogle timer, inden jeg så kunne prøve “Anders Klon 2024 NY”.

Og der er ingen tvivl om, at den klonede stemme ligger endnu tættere på min egen stemme end før, i en grad så jeg tror mange godt kunne lade sig narre, hvis de bare hørte mig speake i en podcast.

Jeg har ladet min AI-klon speake noget af denne blogpost, og du kan høre det fuldstændigt ubehandlede resultat lige her:

Det er mig, men ikke mig…

NB! Ironisk nok, så slås jeg lige med pitch – lydfilen her i bloggen lyder som en Anders And-udgave af mig selv, og sådan lyder den altså ikke i virkeligheden…så jeg anbefaler at højreklikke på play-knappen, downloade, og lytte dér, hvis det lyder mystisk i browseren… 🤔

Der er stadig masser af ujævnheder i de AI-skabte speaks, især med navne, betoninger i indskudte sætninger og den slags, men hvis man går ind og justerer lidt kan man faktisk komme ret langt.

Min AI-stemme?

På den ene side er det – jævnfør tankerne ovenfor – måske en beroligende tanke med sådan en AI-klon. Skulle jeg en dag miste stemmen eller opleve at den pludselig forandrede sig voldsomt, så har jeg en form for backup.

Og måske kan sådan en stemme-AI-klon også bruges til at lave mine podcasts og andre speaks, ikke mindst i takt med at teknologien også hele tiden bliver bedre?

På den anden side, så ville det jo lige præcis være en “klon” – altså ikke mig, og ikke min stemme.

Og jeg er ikke helt sikker på, hvordan jeg ville have det med at have en “kopi af mig selv” i verden, som stadig lød som mit gamle jeg.

Ville det føles uærligt? Schizofrent? Nedværdigende? Betryggende? Eller måske bare som at se på gamle billeder af sig selv fra da man var yngre og havde færre rynker og mere hår på hovedet?

Jeg ved det ikke, og håber helt ærligt at jeg aldrig bliver tvunget til at finde ud af det.

I mellemtiden har jeg dog afgjort tænkt mig at lege videre med min nye stemmeklon – både for at prøve teknologien, og (hvis den er af tilstrækkelig høj kvalitet) lade den oplæse udvalgte speaks i en snæver vending.

Vi får se (eller rettere, høre)…

PS. Der er selvfølgelig også mange andre aspekter af det med AI-stemmekloner – rettigheder, misbrug, deepfakes, etc – men det må vi vende en anden god gang.