Ny sprogteknologi: Få din egen personlige lomme-Søren Brostrøm

To sprogforskere på Aarhus Universitet, Christopher Cox og Johanne Nedergård, har skabt et banebrydende talesyntesesystem, der ved hjælp af kunstig intelligens gengiver direktør for Sundhedsstyrelsen Søren Brostrøms stemme. Med denne nyskabende teknologi kan danskere få fornuftens stemme til at sige lige præcis det, de har brug for at høre, i disse svære tider. en fantastisk aprilsnar til Lingoblog – tusind tak for det! Klik her, hvis du har lyst til mere 1. april fra Lingoblog!

Siden den globale COVID-19 pandemi for alvor gjorde sit indtog i Danmark, er tidligere overlæge Søren Brostrøm blevet modtaget som en naturlig autoritet, der har imponeret med et køligt overblik og oprigtig kommunikation. Brostrøm er tilpas myndig og behagelig på pressemøder, og han får de fleste danskere til at føle sig i trygge hænder. For mange danskere kan han beskrives som fornuftens stemme, og nylige spørgeskemaundersøgelser har vist, at 92 % af danskerne tilskriver Brostrøm mere autoritet og troværdighed end både den tidligere amerikanske præsident Barack Obama, Statsminister Mette Frederiksen og Dronning Margrethe II.

Figur 1. Såkaldt ‘meme’, der illustrerer resultaterne af spørgeskemaundersøgelsen (kilde: @dindagligememedosis, Instagram).

Med Brostrøms rolige udstråling og sobre synspunkter på pressemøder bliver hans stemme unægteligt associeret med en følelse af tryghed, lettelse og trøst. Med tanke på, hvor udfordret vores kollektive mentale sundhed er under pandemien, har sprogforskere på Aarhus Universitet netop prioriteret i al hast at gennemføre et projekt – Søren Synthesizer – der ved hjælp af nye landvindinger inden for kunstig intelligens, deep learning og talesyntese bygger en algoritme, der kan syntetisere Søren Brostrøms troværdige stemme.

For at skabe Søren Synthesizer benyttede forskerne et allerede eksisterende Deep Neural Network til talegenkendelse til at udvælge de akustiske egenskaber, der bedst karakteriserer netop Søren Brostrøms stemme. Hans udtalelser ved pressemøderne et blevet analyseret og danner en database som input til et selvlærende system, der kan omdanne tekst til tale i Brostrøms stemme. Teknologien integrerer kodestykker fra WaveNet, det indflydelsesrige tekst-til-tale-system, der bruges på platforme såsom Google Assistant, Google Search og Google Translate. Hør et eksempel på Søren Synthesizer i lydfilen nedenfor:

Neurale netværk kræver normalt en stor mængde data, men takket være open source-algoritmer og datasæt til machine learning har det allerede nu været muligt for forskerne at skabe en syntetisk Brostrøm, der kan programmeres til at sige hvad som helst. Foreløbige resultater fra pilotforsøg med Søren Synthesizer har vist, at hans stemme har de forventede fysiologiske effekter. Forsøgsdeltageres puls bliver øjeblikkeligt lavere, og deres hjerneaktivitet ændres også – det limbiske system, som er ansvarligt for den såkaldte ‘fight or flight’-respons, er signifikant mindre aktivt, mens forsøgsdeltagerne lytter til Brostrøms vederkvægende røst (se Figur 2).

Figur 2. Hjerneområder med signifikant sænket hæmodynamisk aktivitet under brug af Søren Synthesizer.

Talesyntesen forventes at blive rullet ud på nationalt plan via en app – Søren på Lommen – hen over de næste par dage (tilgængelig på både Android og iOS), så danskerne kan nyde godt af den nye talesyntese ved coronakrisens kulmination.

Nedergård og Cox udtaler desuden til Lingoblogs redaktion, at næste skridt for teknologien bliver at udvide den til også at omfatte Brostrøms viden om coronakrisen ved at bruge Natural Language Processing-software til at uddrage og kondensere alle Brostrøms sundhedsfaglige udtalelser i en database, der er drevet af kunstig intelligens. Således kan danskerne med ‘Søren på Lommen’ snart stille specifikke spørgsmål om de politiske og/eller sundhedsfaglige bevæggrunde for at lukke grænserne, for og imod at gå med ansigtsmaske og de økonomiske konsekvenser af pandemien – og få svar med Sørens barytonrøst.

Johanne Nedergård og Christopher Cox er begge ph.d.-studerende på Århus Universitet og har kombineret deres ekspertiser i psykologisk velvære, neurale netværk og talesyntese til at gennemføre projektet Søren Synthesizer.

3 kommentarer til “Ny sprogteknologi: Få din egen personlige lomme-Søren Brostrøm”

Skriv en kommentar