Sproglig analyse kan forudsige depression

En ny bacheloropgave har undersøgt om det er muligt at bruge automatisk taleanalyse til at forudsige depression og graden af sygdommen på danske patienter. Metoden kan blive en stor hjælp til at lave en mere nøjagtig og tidlig diagnosticering af depressionsramte.

Depression er en sindslidelse, der ofte er kendetegnet ved et lavt stemningsleje

Depression er en psykisk sygdom, som mere end 300 millioner mennesker verdenen over lider af. I dag foregår diagnosticeringen af depression gennem psykologens subjektive evaluering af patientens symptomer, hvilket ikke blot er dyrt, men også tidskrævende – og fejldiagnosticering er en risikofaktor. En ny undersøgelse i forbindelse med et bachelorprojekt har undersøgt om man med objektive målinger af depression kan mindske fejldiagnosticering, tid og økonomiske ressourcer. Undersøgelsen er inspireret af teorien om cognitive commitment som handler om, at man gennem sproget kan afsløre noget om menneskets kognition – i dette tilfælde om det deprimerede sind. Formålet med undersøgelsen var derfor at undersøge, om man objektivt kan måle depression gennem sprogbrug. Dette kan på længere sigt gavne psykologens muligheder for at diagnosticere depression mere nøjagtigt på kortere tid end tilfældet er i dag. Derudover blev det også undersøgt om man ved brug af en semantisk analyse af deprimeredes sprogbrug kunne få ny indsigt i depression.

 

Tidligere studier har vist, at der er forskelle i deprimeredes og ikke-deprimeredes sprogbrug, hvilket kan understøttes af forskellige kognitive teorier om depression. De kognitive teorier antager, at det deprimerede menneske har en tendens til at opfatte ting mere negativt end ikke-deprimerede. Eftersom sproget kan afdække menneskets kognition, virker det derfor sandsynligt, at deprimerede vil bruge flere negativladede ord end positive. Derudover påstår teorierne også, at deprimerede har et større fokus på sig selv, hvorfor ord som ’jeg’, ’mig’ og ’min’ kan udtrykke en sådan selvbevidst tilstand. Depression er også forbundet med svækkelse af kognitive funktioner, hvilket ifølge et nyere studie kan være forbundet med ordlængden. Studiet viser, at længere ord oftest er forbundet med mere komplicerede betydninger end korte ord. Hvis deprimerede således er ramt af svækkelse af kognitive funktioner, vil deres sprogkompleksitet – altså ordlængden – forringes i forhold til ikke-deprimerede. Med andre ord vil ikke-deprimerede i gennemsnit bruge længere (og dermed mere komplekse) ord end deprimerede.

Sproglige forskelle mellem deprimerede og ikke-deprimerede

Datasættet som er brugt til den nye undersøgelse er tidligere indsamlet i forbindelse med et studie om social kognition udført af Nikolai Ladegaard. Det omfattede i alt 85 lydfiler af 42 dansktalende første-episode deprimerede og 43 dansktalende ikke-deprimerede deltagere, som skulle fortælle deres livshistorie til en psykolog. Disse interviews blev i forbindelse med undersøgelsen transskriberet og efterfølgende analyseret i softwareprogrammet R Studio v.1.0.136.

Det viste sig, at de to grupper af forsøgspersoner varierede i deres brug af forskellige sproglige aspekter. Deprimerede brugte flere første-persons pronomener, flere negativladede ord og færre positivladede ord end ikke-deprimerede forsøgspersoner. Dette stemmer overens med de kognitive teorier nævnt ovenfor. Ordlængden var som forventet også påvirket af, om forsøgspersonen var deprimeret eller ej. Disse fund af sproglige forskelle mellem deprimerede og ikke-deprimerede kunne yderligere bruges til at forudsige diagnose (deprimeret / ikke-deprimeret), graden af depression (målt i Hamilton 17 depressionsskala) og prognose (hvorvidt deprimerede fik det bedre eller ej efter 6 måneder).

Kilde: https://www.sundhed.dk/sundhedsfaglig/laegehaandbogen/undersoegelser-og-proever/kalkulatorer/hamilton-17-depressionsskala/

Det er med metoden muligt at forudsige diagnose og prognose med henholdsvis 72% og 60% nøjagtighed. Forudsigelsen af graden af depression var også videnskabeligt informativ, dog målt i en anden, ikke-sammenlignelig, statistisk enhed. En semantisk analyse ved navn Latent Dirichlet Allocation (LDA) blev brugt til den automatiserede taleanalyse. Kort sagt tager LDA alle forsøgsdeltagernes interviews og deler dem automatisk op i ti semantisk-relaterede emner. Disse ti semantisk-relaterede emner blev efterfølgende brugt til at forudsige diagnose, graden af depression og prognose. Formålet med dette var at undersøge, om en sådan automatiseret taleanalyse bedre kunne måle diagnose, graden af depression og prognose, end brug af første-persons pronomener og negativt- og positivtladede ord. Resultaterne af denne analyse var ikke lige så nøjagtige som den forrige, dog bedre end en 50-50 chance.

Kort sagt fandt undersøgelsen betydelige beviser for, at depression kan måles gennem lingvistisk adfærd, og at disse sproglige formuleringer kan bruges til at forudsige diagnose, graden af depression, og om den deprimerede vil få det bedre eller ej. Desværre har den automatiserede taleanalyse ikke beriget projektet tilstrækkeligt, men med et større datasæt og videreudvikling af LDA-metoden, vil fremtidig forskning af depression også kunne drage nytte heraf.

Julie Sohn går på 6. semester i Cognitive Science på Aarhus Universitet og er i øjeblikket i gang med et virksomhedsprojekt som bliver hendes sidste eksamen på bacheloren.

Læs videreSproglig analyse kan forudsige depression

Anmeldelse: Rejsebog om en afdød lingvist og ballademager

J.B. Corstius – Asken i tasken. København: Forlag Don Max. www.donmax.dk 170 sider med dobbelt linjeafstand. Se video med Jelles egen beskrivelse af bogen, fra Politikens Forlag.  Jelle Brandt Corstius har skrevet en bog om sin far … Læs videre