Conceptual Monday 2015-02-24

Verslag PLDN Conceptual Monday 2015-02-24[bewerken]

Dit is een verslag van een bijeenkomst die werd gehouden om te bespreken of er mogelijkheden zijn om het Rijksmonumentenregister als Linked Data te publiceren.

Plaats: VU Amsterdam, SPINlab

Datum: 2015-02-24

Deelnemers: Frans Knibbe (Geodan), Frans van der Zande (RCE), Joop Vanderheiden (RCE), Linda van den Brink (Geonovum), Mark Opmeer(VU), Victor de Boer(VU), Xander Wilcke(VU).

FransZ legt uit dat de vraag of en hoe het Rijksmonumentenregister als Linked Data gepubliceerd kan worden het best in de context van aanstaande veranderingen in het databeheer bij de RCE kunnen worden gezien. In de huidige situatie zijn er twee belangrijke datasilo’s, ODB en ARCHIS2.

ODB staat voor de objectendatabank. Daarin zitten onder andere gegevens over monumenten, een subset van die gegevens wordt als het Rijksmonumentenregister in msaccess-formaat ter beschikking gesteld via data.overheid.nl (zie hier). De gegevens in ODB veranderen dagelijks, maar het msaccess-extract wordt niet dagelijks ververst (de versie op data.overheid.nl is van 2012-11-08). De ODB bevat al koppelingen met de basisregistraties BRK en BAG.

ARCHIS2 is een database met archeologische gegevens. Die dataset is niet besproken.

Het is de bedoeling dat RCE-gegevens in de loop van 2015 worden ondergebracht volgens drie aparte modellen: CHOI, ZAAK en KENNIS. CHOI beschrijft cultuurhistorische objecten, ZAAK beschrijft werkprocessen en KENNIS omvat documentatie over cultuurhistorische objecten. Bij het vastleggen van gegevens wil het RCE uitgaan van het AAA-principe (Anyone can say Anything about Anything), wat tot gevolg heeft dat de data niet alleen uit zaken die door het RCE zijn goedgekeurd zullen bestaan; er wordt meer ruimte gemaakt voor verschillende perspectieven.

0B77BJ6RROWmjdTJKUXZrZFVfaTA.jpg
Datareorganisatie bij de RCE


Nadat de gegevens een nieuwe plek hebben gekregen (ergens in 2015 dus) is het plan om al de gegevens te ontstluiten als Linked Data (read only). Een schatting van wanneer dat is gerealiseerd is nog niet te maken. Ook is er nog onderzoek nodig over de beste manier om dat te doen. Op dat punt is het RCE gebaat bij samenwerking in het PLDN en met SPIDER.

Een belangrijke bouwsteen voor het ontsluiten van RCE-data op het web bestaat al: de Erfgoedthesaurus (zie deze PLDN-wikipagina voor een uitgebreide toelichting). De Erfgoedthesaurus is gemodelleerd op basis van SKOS en maar nog niet als Linked Data beschikbaar. Joop legt uit dat de thesaurus persistente identificatiecodes heeft, maar nog geen persistente URI’s.

Naast de Erfgoedthesaurus, een begrippenlijst, is er meer semantiek nodig in de vorm van objectdefinities. Ook is de RCE nog aan het nadenken over de beste manier om de benodigde URI’s samen te stellen. Zodoende is er interesse in het PLDN-project over URI-strategie.

Het ontwikkelen van semantiek is een onderwerp waar RCE en SPIDER elkaar kunnen helpen. Voor het publiceren van de kerkendataset als Linked Data is semantiek nodig, voor dezelfde begrippen die in CHOI voorkomen. Zaken als bouwstijl, architect, levensloop van objecten… Vanwege algemene best practice en toekomstige mogelijkheden om te koppelen aan externe, soms internationale datasets, zal een uitgangspunt het waar mogelijk inzetten van bestaande algemene semantiek zijn. We moeten dus goed kijken naar toepasbaarheid van dingen als CIDOC, het Europeana Data Model (EDM) en het INSPIRE-thema ‘Protected Sites’.

Werk van Victor uit 2012 met betrekking tot het omzetten van data van het Amsterdam Museum tot ‘five-star’ Linked Data, kan een nuttige referentie zijn. Het illustreert het toepassen van algemene semantiek bij het definiëren van meer specifieke concepten. Zo is het concept ‘architect’ afgeleid van het meer algemene dcterms:Creator.

Voor SPIDER is samenwerking met het RCE interessant omdat we de meerwaarde van publicatie van Linked Data willen aantonen. Door met het RCE na te denken over de beste semantiek kunnen de data wellicht eerder en beter met bijvoorbeeld de data uit het KENNIS-deelsysteem worden gekoppeld. Gedigitaliseerde documenten die iets met een bepaalde kerk te maken hebben bijvoorbeeld.

Voor zowel SPIDER als het RCE is het ook interessant om koppelingen te kunnen maken met data uit de BGT.

Mark meldt een andere mogelijk belanghebbende partij: Het Historisch Documentatiecentrum voor het Protestantisme van de VU (HDC).

Actiepunten[bewerken]

  1. Een GitHub-repository maken voor samenwerking aan een vocabularium voor cultureel erfgoed (Actie voor FransK/Mark/Xander)
  2. Een eerste versie van het vocabularium publiceren op het Almere-platform van het PLDN, voor 2 april 2015.
  3. Meer mensen benaderen om te betrekken bij het ontwikkelen van het vocabularium, of voor meedenken in het algemeen. Suggesties: Christophe Gueret, Rein van ‘t Veer. Gerard Kuys. (Actie voor FransK/Mark/Xander)