Workshop Nederlands profiel voor gegevenscatalogi - 7 december 2018


De afgelopen tijd is hard gewerkt aan een update van het BP4mc2 boekje dat in 2014 vanuit PLDN is gepubliceerd. Dit boekje beschrijft hoe je met Linked Data de informatie-uitwisseling tussen organisaties nauwkeurig kunt beschrijven. BP4mc2 beschrijft een aanpak en een profiel voor een Gegevenscatalogus.

Op het laatste PLDN congres van 7 november bij Beeld & Geluid is de openbare bespreking aangekondigd van de update van dit boekje.

Op 7 december is bij Geonovum in Amersfoort een workshop gehouden , waarbij deze best practices op hoofdlijnen zijn besproken.

Aanwezig
Danny Greefhorst (ArchiXL, informatiehuizen DSO), Hans Overbeek (KOOP), Aline Rous (Koop), Gerard Kuys (Ordina, DbPedia), Jan Campschroer (Ordina, werkgroep referentiegegevens PLDN), Pano Maria (Skemu, Kadaster), Ingrid Thurlings (Ordina, Kadaster), Leo Bouwsma (KvK), Marco Brattinga (Ordina), Arjen Santema (Kadaster).

Verslag

  • Het woord profiel (profile) behoeft uitleg. Wat wordt bedoeld is de wijze waarop in BP4mc2 een bestaande standaard wordt ingevuld. We gaan uit van wat er al is in de standaard en vullen dit waar nodig aan. De opzet is een open structuur: je kunt bijvoorbeeld gewoon SKOS toepassen voor het publiceren van je taxonomie. Dan ben je in ieder geval interoperabel met het web. Je kunt een stapje verder gaan en het SKOS toepassingsprofiel van BO4mc2 gebruiken. Dat maakt dat je taxonomie dezelfde structuur en opbouw heeft als andere met dit toepassingsprofiel gemaakte taxonomieën. Nog een stap verder is het voor je eigen domein verder nuanceren en/of uitbreiden van het toepassingsprofiel. In de bibliotheekwereld is een dergelijke werkwijze al jaren gebruikelijk.
  • Per profiel is ook nog wel wat meer uitleg nodig in de vorm van een 'abstract verhaal' wat de essentie is. Het is nu een erg technische beschrijving, daar hoort een 'business' verhaal bij.
  • Daar hoort ook een begrippenkader bij van wat we beschrijven, met uitleg, voorbeeld, definitie (practice what you preach).
  • Bij strakke definities hoort ook dat woorden die eerder zijn geïntroduceerd (gedefinieerd) worden hergebruikt in definities. Dezelfde dingen steeds hetzelfde benoemen.
  • De profielen zijn bedoeld als bouwstenen die je ook los van elkaar toe kunt passen. Zo kun je het toepassingsprofiel op SKOS gebruiken zonder de provenance informatie te implementeren en het begrippenkader in een stelselcatalogus te hangen.
  • Rond de uri-strategie zijn nog wel wat to-do's. KOOP kijkt voor wetten.nl naar de internationale standaard akoma ntoso. Deze standaard is niet helemaal compatible met de huidige uri-strategie en ook niet met de api-strategie.
  • Voor de api-strategie geldt dat deze is ontwikkeld voor data-api's en nog niet voor andersoortige api's, bijvoorbeeld voor metadata.
  • De nieuwe versie van BP4mc2 beschrijft de denkwijze, modelleringswijze, werkwijze en ondersteuningswijze op hoofdlijnen. De bedoeling is om deze hoofdlijnen opnieuw uit te geven in de vorm van een toegankelijk boekje. De profielen gaan een slag dieper. De bedoeling is dat hierin regelmatig verbeteringen worden doorgevoerd die zullen leiden tot nieuwe releases. Deze zullen worden gedeeld via Github. De opzet is dat hier omheen een communitiy ontstaat waarin practices worden gedeeld en een backlog voor issues wordt bijgehouden.
  • Dereferencing van uri's moet goed worden ingericht. Interne verwijzingen naar andere plekken binnen BP4mc2 moeten refereren aan de resource binnen BP4mc2, niet direct naar de bron zoals bijvoorbeeld de W3C publicatie van een vocabulair.
  • In het profiel voor begrippen wordt nog onderscheid gemaakt tussen dc:source en dct:source. Dublin Core zelf geeft aan dat het good practice is om overal dct:source te gebruiken. Dit is semantisch niet helemaal correct als het om een resource gaat die niet op het web is te vinden, maar in het profiel voor frbr om te verwijzen naar een bron is dit opgelost.
  • We zien de ontwikkeling van de profielen als een proces waarin we zoveel mogelijk mensen mee willen nemen. De opzet is om de profielen in een continu proces door te ontwikkelen. Vandaag is de eerste stap in de daarvoor benodigde Communitybuilding. Daarnaast willen we wel op korte termijn de nieuwe versie van het BP4mc2 boekje met de hoofdlijnen afronden.
  • Voor wat betreft waardelijsten zullen we aansluiten bij de werkgroep referentiedata van het PLDN
  • We nodigen iedereen uit via github issues commentaar te leveren op de beschrijving van de profielen en de definitie van de profielen. We hopen medio januari voldoende feedback te hebben om een nieuwe meeting te kunnen plannen.
  • Op de PLDN meeting op 31 januari bij Waternet geven we in het ochtendprogramma een workshop rond BP4mc2 en de profielen. Komt allen!

Arjen Santema en Marco Brattinga


Voor de volledigheid:

De nadruk in de workshop zal liggen op het profiel. Het profiel omvat de volgende 10 deelprofielen:

  • SKOS-AP-SC (voor begrippen)
  • FRBR-AP-SC (voor bronverwijzingen op basis van FRBR – zoals ook wetten.nl dit doet);
  • SKOS-LEX-AP-SC (voor het beschrijven van (juridische) handelingen, als extensie op SKOS)
  • DCAT-AP-SC (voor datasets, in lijn met DCAT-AP-NL)
  • DQV-AP-SC (voor het beschrijven van kwaliteitscriteria en de kwaliteitskenmerken van datasets);
  • ADMS-AP-SC (voor het beschrijven van assets in een catalogus zelf, zoals waardelijsten, datamodellen, begrippenkaders, datasetbeschrijvingen);
  • DM-AP-SC (voor het beschrijven van een datamodel);
  • CV-AP-SC (voor het beschrijven van waardelijsten);
  • PROV-AP-SC (voor het beschrijven van versieinformatie en herkomstinformatie over assets)