Højnelse af datakvalitet og øget effektivitet i it-systemer
1. Resumé
Succesfuld udvikling af it-systemer og anvendelse af data forudsætter fælles forståelse af de begreber der ligger bag data. Semantisk modellering kan danne grundlaget for en fælles forståelse mellem rekvirenter, udviklere og brugere. En øget forskningsindsats inden for fællesoffentlig begrebs-, forretnings- og data-modellering vil kunne højne datakvalitet og effektivisere opgaveløsning i of-fentlige it-systemer.
2. Samfundsudfordringer og/eller muligheder
Mangel på fælles forståelse af centrale begreber giver anledning til dårlig data-kvalitet i it-systemer. Problemer med at kombinere information fra forskellige it-systemer til nyttig information skyldes, at kildesystemerne bygger på diver-gerende forståelser af både forretning og data. Der er en stigende erkendelse af, at forudsætningen for afskaffelse af manuel dataoverførsel (genindtastning) mellem it-systemer er en fælles forståelse af data (og relationer mellem data).
Avancerede it-løsninger til håndtering af store datamængder, evt. fra forskelli-ge kilder, kan ikke udelukkende baseres på avancerede teknologiske metoder, men forudsætter avancerede metoder til kategorisering og systematisering af data (semantisk modellering). Mange myndigheder udveksler data eller træk-ker på de samme registre. Hvis der ikke er en fælles forretningsforståelse og der heller ikke fastlægges en fællesoffentlig definition af data, kan der opstå fejl og misforståelser ved dataudveksling og genbrug af data. Der er med andre ord brug for et ’fælles sprog’, og en fællesoffentlig begrebsdatabase, som vil kunne fastholde og tilgængeliggøre fælles definitioner af data. Der er behov for res-sourcer til udvikling og oprettelse af en sådan base.
Det er et kendt problem, at store it-løsninger ikke fungerer efter hensigten, på trods af at der er investeret mange ressourcer i udviklingen. Udvikling af robu-ste it-løsninger forudsætter, at der er opnået en fælles forståelse mellem myn-digheder og it-udviklere. Dette kan realiseres vha. metoder til semantisk mo-dellering, dvs. begrebsmodellering, hvor begreber beskrives vha. deres indbyr-des relationer, karakteristiske træk og definitioner. Endvidere kan udarbejdelse af konceptuelle datamodeller på basis af begrebsmodeller og forretningsmodel-ler bidrage til et sikrere grundlag for udvikling af it-systemer. Offentlige selvbetjeningsløsninger er ofte vanskelige at anvende. Klar kommu-nikation mellem myndigheder og borgere i de offentlige selvbetjeningsløsnin-ger forudsætter, at der foreligger klare definitioner af centrale begreber samt at grænsefladerne er opbygget på basis af konsistent systematisering af data. En digitaliseret og individualiseret kommunikation mellem myndigheder og bor-gere kræver avanceret og intelligent databehandling baseret på begrebsmodel-lering.
Der blev allerede i FORSK2020, punkt 3 Et højteknologisk samfund (jf. FORSK2020-kataloget) fokuseret på den vigtige udfordring, der ligger i at udvikle avancerede it-løsninger til at styre og bearbejde de massive datamængder, som opsamles inden for mange samfundsområder, fx inden for sundhedsvæsenet, natur- og miljøovervågning, bygninger, trafik, finansielle transaktioner mv.
I samme punkt blev det anført, at det med den stadigt mere udbredte brug af it også er en væsentlig udfordring at udvikle robuste, pålidelige og driftssikre systemer, som tager højde for integration, design og brugerinteraktion. Det blev fremhævet, at det er afgørende at sikre interoperabilitet mellem de mange systemer samt gode brugerdesign, så også ældre eller syge borgere har let ved at tilgå og anvende nye kommunikations- og informationsformer samt hjælpemidler.
Den fælles digitaliseringsstrategi 2016-2020 opstiller under punktet: ’Det digitale skal være let, hurtigt og sikre god kvalitet’ (side 20-31), jf. http://www.digst.dk/Digitaliseringsstrategi/Strategi-2016-2020, tre fokusområder:
- en brugervenlig og overskuelig digital offentlig sektor
- bedre brug af data og hurtigere sagsbehandling
- bedre og mere sammenhængende velfærd
Under disse nævnes en lang række initiativer, hvor behovet for høj datakvalitet og gode grunddata (Grunddatamodellen, jf. http://www.digst.dk/loesningerog- infrastruktur/grunddata) er centralt.
Med en større, fællesoffentlig og forskningsmæssig indsats inden for området af nærværende indspil, vil der kunne gennemføres udvikling af avancerede itløsninger, som sikrer integration, interoperabilitet og brugervenlighed og bidrager til højnelse af datakvalitet.
3. Forskningsbehov
En række offentlige myndigheder arbejder allerede med et eller flere aspekter af semantisk modellering, men der er behov for forskning i avancerede metoder til fællesoffentlig begrebsmodellering, som kan sikre interoperabilitet mellem forskellige datasamlinger (registre) og it-systemer.
Et væsentligt område er forskning i metoder til automatisk udvinding og nyttiggørelse af den viden, som findes på nettet eller som ligger gemt i offentlige eller andre datasamlinger (data mining). I denne sammenhæng er der brug for forskning i metoder til mere intelligent, automatisk ekstraktion af viden samt automatisk begrebsmodellering og validering af begrebsmodellerne.
Derudover vil forskning i metoder til automatisk generering af konceptuelle datamodeller på basis af forretningsbeskrivelser og begrebsmodeller kunne bidrage til mere effektiv opbygning af it-systemer.
Endelig er der behov for metoder til at opnå interoperabilitet mellem danske (fælles)offentlige begrebs- og datamodeller og tilsvarende modeller i europæisk samarbejde, fx INSPIRE (http://inspire.ec.europa.eu/ og http://inspiredanmark.dk/).
En sådan forskning kan skabe generisk viden, som også kan anvendes af virksomheder med henblik på at opruste dem mht. digitalisering.
4. Forhold vedrørende udmøntning og implementering af forskningsindsatsen
Forskning inden for området forudsætter et stærkt samspil mellem it-forskere og -udviklere, eksperter inden for begrebsafklaring og semantisk modellering samt fageksperter inden for offentlige digitaliseringsområder.
5. Danske forudsætninger
I Danmark er der en stærk tradition for forskning i principper og metoder for begrebsmodellering, vidensekstraktion, opbygning af begrebsbaser samt udforskning af grænsefladen mellem begrebs- og datamodellering.
Myndighederne sidder inde med omfattende forretningsviden, og arbejder på at udvikle fælles formater til forretningsmodellering for at fremme fælles metoder og sprog. Arbejdet med begrebs- og datamodellering, som gennemføres i offentlige myndigheder, inddrager også europæiske de facto standarder, fx INSPIRE.
De forskningsinstitutioner og offentlige myndigheder, som deltager i FORVIRnetværket (Forum for Videnmodellering i Fællesoffentligt Regi, jf.www.forvir.dk), har opbygget en fælles viden om principper, metoder og implementering, som kan udnyttes i et innovativt forskningssamarbejde.
Deltagerne i FORVIR har bl.a. indhøstet vigtige erfaringer i samarbejdet om udvikling af en første start på en begrebsmodel for fællesoffentlige generelle begreber samt en begrebsmodel for et udsnit af de begreber, som er vigtige for bl.a. Grunddatamodellen.
Der er således gode forudsætninger for at forskere og myndigheder i fællesskab kan udvikle automatiske metoder til at komme fra forretningsbeskrivelser og begrebsmodeller til datamodeller.
6. Mål, effekt og perspektiver
Målet er, at forskningsindsatsen kan bidrage til mere effektiv opgaveløsning i de offentlige myndigheder og højere kvalitet i kommunikationen mellem borgere og myndigheder. Det kan bl.a. være en forbedring og effektivisering af myndighedernes muligheder for at udveksle data, for at udvikle velfungerende it-systemer, at trække på fælles registre inden for en lang række områder, fx sundhed, sociale ydelser, uddannelse og skat, eller det kan være at yde bedre borgerrettet service inden for disse og flere områder.
7. Kontaktperson
Formand for FORVIR-netværket Camilla Wiberg Danielsen, Specialkonsulent, terminolog Datakvalitet og –indhold, Sundhedsdatastyrelsen cwd@sundhedsdata.dk +45 2510 7541 | +45 3268 5342
Bodil Nistrup Madsen, Professor of Computational Linguistics DANTERM Research, Dept. of International Business Communication Copenhagen Business School bnm.ibc@cbs.dk +45 3815 3122 | +45 4051 21 50
8. Forslagets prioritering
Dette forslag indsendes på vegne af Forum for Videnmodellering i Offentligt Regi, FORVIR. Der indsendes ikke andre forslag fra FORVIR, og der er derfor ingen prioritering Forslaget vil kunne indgå i et mere overordnet punkt, fx Digitalisering (inden for offentlige myndigheder).