Digitale overheid: Praktijkverhalen

25-06-15 | Vanaf 18 mei staat SKOS (Simple Knowledge Organization System) op de ‘pas toe of leg uit’-lijst van Forum Standaardisatie. Dat betekent dat organisaties binnen de Nederlandse overheid en organisaties met een publieke taak deze standaard verplicht moeten toepassen, anders hebben ze wat uit te leggen. Wat gaan we als gebruiker/burger daarvan merken?

SKOS is een standaard die de principes van het web doortrekt naar systemen van kennisontsluiting. Die principes kennen we allemaal. Om te snappen wat SKOS precies toevoegt moeten we het vakgebied dat zich bezighoudt met kennisontsluiting, van dichtbij bekijken.

Filmliefhebbers zullen zich herinneren hoe Gandalf op zijn witte paard naar een bibliotheek rijdt. Hij spreekt geagiteerd met de bibliothecaris. Even later zien we hem lurkend aan een pijp een oud vergeeld boekwerk doorbladeren. Voor een rechtgeaard kennistechnoloog is die opeenvolging van scènes zeker zo spannend als de rest van het verhaal. Gandalf heeft cruciale informatie gevonden over de ring met mysterieuze krachten, dingen die hij nog niet wist. Zonder deze informatie had Sauron ongehinderd zijn gang kunnen gaan en was er geen verhaal geweest om een trilogie over te maken. Iets wat je niet weet vinden op basis van iets dat je wel weet: dat is het even centrale als paradoxale probleem van kennisontsluiting. Het is een vakgebied van alle tijden.

Gedurende de afgelopen paar honderd jaar zijn we hierin met ons allen steeds beter geworden. Sommige organisaties hebben gespecialiseerde afdelingen aan het werk om kennis gericht te ontsluiten, maar elke organisatie past deze vakkennis bewust of onbewust toe. Wat niet betekent dat elke organisatie hierin altijd de slimste keuzes maakt. Integendeel! De Commissie Elias had daar in haar rapport over falende ICT-projecten wel wat meer aandacht aan mogen geven.

Vindbaarheid en techniek

De behoefte aan kennisontsluiting begint vaak bij de bewustwording van de eigen taal. Elke organisatie hanteert begrippen in een specifieke betekenis. Zo is in het gevangeniswezen de ‘badmeester’ iemand die nieuwe ‘inkomsten’ behandelt: inname eigendommen, uitreiken beddengoed, et cetera. De Belastingdienst hanteert weer een geheel andere definitie van ‘inkomsten’. Kennis van dergelijke organisatie-specifieke begrippen is essentieel. Nieuwe medewerkers dienen zich de terminologie eigen te maken. De definities spelen een cruciale rol in het ontwerpen en bouwen van IT-systemen. Wanneer er informatie uitgewisseld wordt met andere organisaties, is het expliciet maken van termen en hun betekenis een belangrijke voorwaarde. Het is dan ook een goed idee om deze kennis structureel en systematisch vast te leggen en te ontsluiten.

Een organisatie die artikelen publiceert kan de aldus vastgelegde begrippen gebruiken als trefwoorden die aangeven waar een artikel over gaat. Hoogstwaarschijnlijk zijn het trefwoorden als ‘ring (sieraad)’ en ‘runetekens (elventaal)’ die Gandalf naar het juiste boek hebben geleid. Het is een wijdverbreid misverstand dat moderne zoekmachines dergelijke trefwoordsystemen overbodig maken. Zoeken op voorkomens van zoektermen in lopende tekst mag dan voor veel doeleinden prima werken, het gebruik van trefwoordsystemen levert veel meer precisie op. Google weet dat als geen ander en maakt, zonder dat de gebruiker dat merkt, gebruik van het befaamde MeSH-trefwoordsysteem (Medical Subject Headings) van de National Library of Medicine (NLM). Als je met Google zoekt op specialistische medische zoektermen, krijg je daardoor zeer precieze resultaten uit de NLM, en daarnaast minder precieze resultaten uit andere bronnen.

Begrippen moet je vastleggen

De simpelste manier om begrippen vast te leggen is de alfabetisch gesorteerde woordenlijst. Vanaf de 19de eeuw ontstaat er wereldwijd consensus dat een meer hiërarchische ordening beter werkt. Om de betekenis van ‘lente’ te doorgronden is het essentieel te weten dat het een nauwer begrip is van ‘seizoen’, naast ‘zomer’, ‘herfst’ en ‘winter’. Dat heeft in de jaren ’80 van de vorige eeuw geleid tot een wereldwijd toegepaste standaard voor het vastleggen van betekenisrelaties, zoals ‘narrower’, ‘gerelateerd begrip’ en nog een paar. Een woordenlijst die deze relaties expliciet beschrijft noemen we een thesaurus. De betekenis van de relaties is doelbewust vaag gehouden, waardoor een thesaurus een wat informeel karakter krijgt. Daarin schuilt veel van de kracht van deze standaard: de beschrijving is intuïtief, direct toegankelijk voor een breed publiek en biedt tegelijkertijd aantoonbaar meerwaarde.

SKOS maakt het mogelijk om begrippenlijsten die op deze manier gestructureerd zijn (thesauri) via het web toegankelijk te maken in een Wikipedia-achtige vorm. Zo kun je bij het artikel over ‘seizoen’ eenvoudig doorklikken naar de ‘narrowers’ (lente, zomer, herfst, winter). Eigenlijk zou elke organisatie zijn begrippenapparaat op deze manier moeten publiceren, al was het maar voor de eigen medewerkers en geïnteresseerde buitenstaander. De fundamentele kennis die daarmee beschikbaar komt, vormt immers de basis voor de informatiehuishouding in een organisatie. Een tamelijk elementair belang, dat helaas nog vaak onderschat wordt.

SKOS ontsluit kennis over begrippen niet alleen via de browser, het zorgt er tegelijkertijd voor dat machines de diverse relaties in de thesaurus slim kunnen gebruiken voor allerlei doeleinden. Dat komt doordat SKOS een lid is van de snel groeiende familie van Linked Data-standaarden, die het mogelijk maken naast documenten ook gegevens op het web te ontsluiten.

Begrippen op het web

Het basisidee van SKOS is dat elk begrip een eigen webadres krijgt. Een fictief voorbeeld is http://belastingdienst.nl/begrippen/Inkomsten. Het begrip ‘inkomsten’ zoals het gevangeniswezen dat hanteert krijgt weer een ander webadres. Aan het webadres is meteen te zien welke organisatie verantwoordelijk is voor de definitie van het begrip. Dat is niet alleen simpel en doeltreffend, het geeft ook eenduidigheid op een ongekende schaal. Dat leidt tot allerlei nieuwe toepassingen.

Doordat het medische trefwoordsysteem MeSH volgens SKOS beschikbaar is op het web, kan Google het automatisch inpassen in zijn zoekalgoritmes. Omgekeerd kan elke organisatie de MeSH-thesaurus gebruiken in het publicatiesysteem waarmee redacteuren trefwoorden toekennen aan artikelen. Een toepassing die sterk in opkomst is, is het automatisch toekennen van trefwoorden op basis van computeranalyse. Een veel simpelere maar niettemin handige toepassing is het tonen van thesaurusdefinities in lopende tekst in helptips of kader. Zoekmachines kunnen zoekresultaten handig groeperen op thema. Er is niet veel fantasie voor nodig om meer van zulke toepassingen te bedenken. Het feit dat we ze nog maar mondjesmaat tegenkomen heeft te maken met het simpele feit dat het aantal SKOS-thesauri op het web nog klein is.

Een ander toepassingsgebied waar SKOS grote voordelen biedt is het leggen van relaties tussen begrippen in verschillende thesauri. Dat gaat simpel en doeltreffend volgens een standaardrecept. Voor organisaties die met elkaar samenwerken is het handig om elkaars definities altijd bij de hand te hebben, ook over landsgrenzen heen. De Europese Unie (EU) heeft een aantal belangrijke thesauri laten maken met begrippen in 23 EU-talen. Overheidsorganisaties kunnen de begrippen in hun eigen thesaurus eenvoudig linken aan begrippen in deze EU-thesauri. Dat bevordert het delen van informatie op Europees niveau. SKOS maakt het zelfs mogelijk dat de ene organisatie de thesaurus van een andere organisatie als basis gebruikt en aanvult met eigen begrippen. Dat leidt tot optimaal hergebruik.

Veranderingen

SKOS zal veel veranderen op het gebied van publiceren. Het helpt kennisinstituten hun collecties open te stellen en beter bruikbaar te maken. Met het MeSH-trefwoordsysteem kun je niet alleen bij de National Library of Medicine terecht, maar bij alle kennisinstituten die MeSH toepassen op hun publicaties. Gebruikers hoeven daar zelf niets voor te doen: zoekmachines handelen dit automatisch af. Het kunnen ophalen van eenduidig gespecificeerde zoekresultaten bij een ongelimiteerde verzameling bronnen op het web, is een van de kernbeloftes van SKOS.

Ook in de administratieve wereld zal SKOS tot veel verandering leiden. Stel, een gemeenteambtenaar geeft een vergunning uit in de vorm van een elektronisch bestand. Dankzij SKOS kan hij het document, ook voor de buitenwereld, eenduidig kenmerken: dit document is uitgegeven (zoals gedefinieerd in begrippenapparaat X) door de gemeente Alkmaar (in de zin van begrippenapparaat Y). Daartoe is het nodig een aantal bestaande SKOS-begrippenapparaten aan te wijzen als verplichte kern, en andere meer specifieke begrippenapparaten nieuw op te zetten. Dat proces is binnen de Nederlandse overheid al een aantal jaren aan de gang.

Het op deze manier kenmerken van digitale documenten biedt grote mogelijkheden. Documenten uit het ene IT-systeem worden bruikbaar in het andere IT-systeem. Stromen van documenttypen over organisaties heen wordt daardoor inzichtelijker en transparanter en leveren minder ICT-kosten op voor de dienstverlener. De afnemer kan zijn papierwinkel eenvoudig ordenen, langs diverse assen. Een overzicht van alle vergunningen van een bepaald type is dan een kwestie van een druk op de knop. Voor de gemiddelde burger misschien slechts een aardigheid, voor bijvoorbeeld een aannemer in glasvezelprojecten die duizenden vergunningen per jaar binnenkrijgt is dat een ander verhaal. Het automatisch kunnen verwerken van omvangrijke digitale documentstromen levert flinke besparingen op.

Concrete stappen helpen zetten

Tegen de tijd dat SKOS breed geadopteerd is, zijn thesauri via het web verbonden met andere thesauri. Begrippenkaders zoals die binnen een organisatie gebruikt worden zijn eenvoudig met die van andere organisaties te vergelijken, ook internationaal. Thesauri worden gebruikt en hergebruikt voor kennisdeling, trefwoordtoekenning, metadatering, automatische tekstanalyse, en het verbinden van informatie. Administratieve processen lopen soepeler, de resultaten zijn eenduidiger en transparanter. Publicatiesystemen en zoekmachines ondersteunen SKOS en kunnen met elke willekeurige thesaurus overweg. IT-Systemen zowel als menselijke gebruikers gebruiken ze simpelweg via een hyperlink. Begrippen en definities zijn toegankelijk zonder drempels, informatie uit verschillende bronnen is beter vindbaar en vergelijkbaar.

Opname van SKOS op de ‘pas toe of leg uit’-lijst van Forum Standaardisatie brengt deze toekomstdroom een stapje dichterbij. De meer dan twintig partijen die zich actief hebben ingezet om dit mogelijk te maken hopen dat het verplicht stellen van SKOS organisaties stimuleert om hun begrippen vast te leggen en conform SKOS te ontsluiten. Een drempel die daarbij genomen moet worden is dat de echte baten daarvan pas blijken als veel organisaties dat doen. Het is dus verleidelijk om in de wachtstand te blijven hangen. Ook leidt SKOS tot meer transparantie, wat organisaties vaak onzeker maakt. Het valt te hopen dat een stok achter de deur de balans een duwtje in de goede richting geeft.