Dansk sprogressource skal booste virksomheders og myndigheders brug af kunstig intelligens
En af nøglerne til at udbrede kunstig intelligens i Danmark er en stor samling af sprogdata på dansk, en såkaldt sprogressource. For skal kunstig intelligens genkende tale eller tekst, sådan som for eksempel chatbots eller digitale assistenter gør, så kræver det, at den er blevet fodret med data på dansk af høj kvalitet.
Men fordi dansk er et lille sprogområde, har det ikke været attraktivt nok for virksomheder at investere i at få udvikle en dansk sprogressource. Det laver regeringen nu om på, så Danmark ikke sakker bagud i brugen af kunstig intelligens i forhold til andre lande.
Med Danmarks første, nationale strategi for kunstig intelligens, som regeringen præsenterer i dag, sætter regeringen knap 30 millioner kroner af over de kommende fire år til at lave en fælles dansk sprogressource, som skal være frit tilgængelig for virksomheder, offentlige myndigheder og forskere.
- Nu får vi sat skub i udviklingen af kunstig intelligens på dansk. Der er helt nødvendigt, hvis kunstig intelligens for alvor skal udvikles og bruges i Danmark. Åbne og fælles sprogdata på dansk vil give nye forskningsmuligheder, og det vil blive en stor styrke for virksomheder og forskere, når de fremover kan udvikle løsninger og systemer, der kan anvendes i en dansk sammenhæng, siger uddannelses- og forskningsminister Tommy Ahlers.
- En åben sprogressource af høj kvalitet vil være til stor gavn for både offentlige myndigheder, private virksomheder og forskere. Både i den offentlige og private sektor er man så småt ved at tage kunstig intelligens til sig, og vi møder ofte sprogteknologi i hverdagen, for eksempel når stoppesteder læses op i bussen, eller når vi chatter med virtuelle medarbejdere hos kommunen eller forsikringsselskabet. Men det er nødvendigt at styrke kvaliteten af de dansksprogede data, så vi i endnu højere grad kan drage fordel af teknologien i vores hverdag. Med en fælles sprogressource vil man eksempelvis i kommunerne kunne bruge teknologien til at omsætte telefonopkald til tekst for at kunne give borgere hurtigere besvarelser, og forskere vil langt hurtigere kunne få overblik over store mængder af litteratur og data, fordi kunstig intelligens bl.a. kan hjælpe med at gennemsøge og kategorisere artikler. Og det er afgørende, at vi kommer med nu. Derfor sætter vi i regeringen nu gang i at få udviklet sådan en fælles sprogsamling, siger innovationsminister Sophie Løhde.
Sprogressourcen skal bygges op i samarbejde med offentlige og private aktører. Den skal bygge videre på initiativer, der allerede er i gang i dag, men den skal også være med til at udvikle mere avanceret sprogforståelse, forudsigelser og vurderinger for eksempel i offentlig sagsbehandling.
Fakta
- En sprogressource er en struktureret samling af digitale datasæt – lyd, tekst og ord.
- Sprogteknologi i form af talegenkendelse bruges for eksempel til at hjælpe borgere med synshandicap eller borgere, der har svært ved at læse og skrive, med at læse tekster op eller indtale beskeder. Det kan også bruges til at frigøre tid hos for eksempel læger og sagsbehandlere ved at overføre indtalte observationer til skrift automatisk.
- På skrift bruges det ligeledes til automatisk at oversætte mellem sprog og til at kommunikere med virtuelle assistenter som voice- og chatbots. Voicebots kender vi i dag fra vores smartphones, for eksempel Siri som personlig assistent i vores iPhone. I fremtiden vil vi se stemmestyring brugt mere og mere i vores forbrugsvarer og i kontakt med det offentlige.
Handlinger tilknyttet webside