COVID rammer sproget

APRILSNAR

 

Ny forskning fra Aarhus Universitet viser, at også sproget påvirkes – selv måneder efter corona-smitte


Hukommelsesproblemer, koncentrationsbesvær, åndedrætsproblemer og problemer med lugtesansen. Det er bare nogle få af de længerevarende bivirkninger af COVID-19, som forskningen har påvist. Indtil nu – for nu viser ny forskning fra Aarhus Universitet, at corona også sætter sine spor på sproget.

Efterhånden som flere og flere fik corona, begyndte vi at lægge mærke til subtile ændringer i deres sprog. Det var svært at sætte fingeren præcis på, hvad der forårsagede det, så vi besluttede at starte et forskningsprojekt

Sprogforskere fra Aarhus Universitet, Johanne Nedergaard og Christopher Cox, satte sig for at undersøge, hvorvidt den indflydelsesrige virus også påvirkede sproget. Det har længe været almindeligt anerkendt, at sproget er grundlagt i den menneskelige biologi. Det er også en kendsgerning, at smitte med en virus såsom COVID kan forårsage små genetiske mutationer. Så hvad sker der egentlig, når vores DNA indkorporerer genetisk materiale fra en virus? Påvirker det også sproget?

renato marques EQUaOV 1DCM unsplash scaled

Folk i kø til coronatest, Macau, Kina (foto: Renato Marques)

I løbet af 2021 indsamlede forskerne data fra 500.000 forsøgsdeltagere, med og uden konstateret coronasmitte, rekrutteret fra et testcenter på Skejby Sygehus. Forsøgsdeltagerne indvilligede i at gå med mikrofon 24 timer i døgnet og få taget blodprøver hver uge, så forskerne kunne sammenholde præcise sproglige målinger samt konstateret coronasmitte. De allierede sig også med biokemiker Chris Per Andersen fra DTU, som har ekspertise inden for genetik og den nye teknologi til gensekventering, CRISP-R. Med denne unikke kombination af data science og gensekventering kunne forskerne få indblik i, hvordan virussen påvirker sprog.

Forskerne startede ud med at træne neurale netværk med deep learning-algoritmer for at teste, hvorvidt coronasmitte kunne forudsiges baseret på sproglige parametre. Resultaterne overraskede dem. Ikke nok med at de sproglige parametre kunne forudsige, om der var konstateret smitte hos deltageren, det var også muligt at forudsige, hvilken variant af corona deltageren havde haft med 92.3% præcision.

Er du tit forvirret over, om det hedder eller lagde? Så har du sandsynligvis haft corona

De sproglige parametre, som modellen bruger til at forudsige coronasmitten, omfatter både syntaktiske og lydmæssige forskelle. For eksempel viser modellen, at deltagere, der havde haft delta-varianten, havde sværere ved at separere syntaktiske roller, især possessive pronominer. Disse deltagere laver i gennemsnit 23.7% flere ukorrekte forvekslinger af hans og sin (fx “lægen tog altid hendes handsker omvendt på”, eksempel fra deltager KJA21) end folk, der ikke har været smittet med corona. På den anden side viste modellen, at deltagere, der havde været smittet med omikron-varianten, var mere tilbøjelige til at forveksle tempusbøjninger (fx “jeg lagde på hospitalet i 14 dage”, eksempel fra deltager LCH21).

Langtidseffekterne af COVID indbefatter ikke kun syntaks og morfologi – det sætter sig også i den lydmæssige del af sproget. Ved at bruge nyudviklede metoder til at analysere de mange tusind timers lydoptagelser er det lykkedes forskerne at syntetisere sproglyde og dermed at få indblik i, hvorvidt COVID-eftervirkninger påvirker deltagernes lydproduktion. For eksempel vises tre spektogrammer af syntetiserede [s]-lyde fra modellen; resultaterne indikerer, at deltagere med delta-varianten producerer [s]-lyde med akustisk energi i de højere frekvenser, hvorimod deltagere med omikron-varianten lader til at producere [s]-lyde med mere koncentreret akustisk energi i nogle lavere frekvenser, sammenlignet med de syntetiserede lyde for deltagerne uden corona. Du kan selv høre forskel på modellens syntetiserede lyde nedenfor:

omicron

 

without

 

delta

 

Samarbejdet mellem sprogforskerne på Aarhus Universitet og biokemikere på DTU har ligeledes vist sig meget frugtbart. Ud over at bruge blodprøverne fra deltagerne til at analysere sig frem til hvilken coronavariant de havde været smittet med, brugte forskerne nemlig også blodprøverne til at sekventere deltagernes DNA. Her fandt forskerne noget virkelig interessant: Det viste sig nemlig, at virussen havde forårsaget subtile mutationer på FOXP2-genet, som i tidligere forskning netop har vist sig at være tæt knyttet til netop sproget. At forskerne således kunne drage disse forbindelser mellem sprog, virus og genetik kan vise sig at få afgørende betydning for fremtidig forskning.

Kronprins Frederik og kineserne

For at få afprøvet robustheden af det neurale netværk testede forskerne nyhedsværter og offentlige personer, fra hvem der var tilstrækkeligt lydmateriale tilgængeligt. Det var her også muligt at klassificere coronasmitte med 89.2% nøjagtighed. Blandt andet testede de modellen på Kronprins Frederik, der i starten af marts var i søgelyset for at udtale ‘Det bekymrer også min familie og jeg’ (det = krigen i Ukraine, red.). Hans Kongelige Højhed har ikke ifølge kongehusets presseafdeling haft corona, men Nedergaard og Cox anslår alligevel på baggrund af deres forskning, at han sandsynligvis har været smittet med delta-varianten.

Dansk er naturligvis ikke det eneste sprog, der bliver ramt af langtidsfølger fra COVID-19. Forskerne er i gang med at udvide studiet til at inkludere andre sprog – for eksempel har de kinesiske myndigheder på baggrund af ovenstående studie af dansk bedt forskerne om at kigge på, hvordan det påvirker kinesernes perception af toner på deres sprog. Her ses der især tegn på en indflydelse fra omikron-varianten, som lader til at gøre det sværere at skelne især tone 2 (fx má) og tone 3 (fx mǎ) fra hinanden. Ligeledes har forskerne fundet spor af indflydelsen af omikron-varianten på engelsk, hvor tidligere smittede er mere tilbøjelige til at sige ‘drinked’ i stedet for datidsformen ‘drank’ og ‘bote’ i stedet for datidsformen ‘bit’ (jvf. ‘write’ – ‘wrote’).

Test dig selv!

Forskerne bag studiet opfordrer nysgerrige læsere af dette indlæg til at indsende et lydklip af sig selv til language.and.long.covid@gmail.com, hvis de gerne vil vide, om de har været smittet med corona (og i så fald hvilken variant). For at opnå størst mulig nøjagtighed skal du optage dig selv sige ‘mile, mele, mæle, male’, ‘bispens gipsgebis’ og ‘stativ, stakit, kasket’, så modtager du svar hurtigst muligt.

Johanne Nedergård og Christopher Cox er begge ph.d.-studerende på Aarhus Universitet og har kombineret deres ekspertiser i syntaks, morfologi, fonetik og neurale netværk til at gennemføre projektet Language & Long COVID.

5 kommentarer til “COVID rammer sproget”

  1. Hej
    Interesssant studie. Der er nye undersøgelser fra USA som peger på, at babyer født 9 måneder inde i Covid krisen vokaliserer mindre. Gad vide om de også har været ramt af covid, som påvirker deres gener og sprogudvikling?

    Svar

Skriv en kommentar