Dit project is een Proof of Concept in opdracht van het ministerie van Infrastructuur en Milieu (I&M). Hieronder volgt een korte beschrijving van de inhoud en aanpak van dit project.
Betrokkenen:
Doel van de PoC is te onderzoeken wat Linked Data kan betekenen voor de BGT. Meer specifiek:
Het BGT Linked Data project is gekoppeld aan het Platform Linked Data Nederland. Er wordt gebruik gemaakt van de hier aanwezige kennis en infrastructuur, zoals het beschikbare Data Platform LOD waar de tooling aanwezig is om linked data te publiceren en toegankelijk te maken. Over de PoC wordt gepresenteerd tijdens bijeenkomsten van het Platform Linked Data Nederland. Wellicht vinden er ook enkele conceptual fridays plaats over dit onderwerp.
Het project wordt vormgegeven door bronbestanden van verschillende basisregistraties te ontsluiten als linked data, verwijzingen aan te brengen tussen deze data, vragen te bedenken die aan deze combinaties van data gesteld kunnen worden, en een user interface te ontwikkelen die dit op een toegankelijke manier mogelijk maakt en demonstreert.
In het project wordt data uit verschillende basisregistraties aan elkaar gekoppeld. Daarom zijn er meerdere bronbestanden nodig. Naast data uit basisregistraties is het bovendien interessant om te experimenteren met verrijking van BGT data met meer gedetailleerde informatie, bijvoorbeeld met bronhouder-specifieke beheerinformatie (BOR data).
We denken aan:
Niet alleen data, maar ook een beschrijving van de semantiek kan helpen bij het verbinden van basisregistraties. Binnen het project willen we daarom gebruik maken van een aantal catalogi die de semantiek van registraties ontsluit. Dit zijn:
De BGT is nog niet als data voor heel Nederland beschikbaar. Er is dus een keuze voor een specifiek gebied gemaakt: Leiden. Voor dit gebied wordt ook data van de andere bronbestanden verzameld.
Binnen het project wordt een aantal (5 tot 10) leuke, interessante vragen bedacht die door gecombineerd te kunnen zoeken in de data uit de verschillende bronbestanden, te beantwoorden zijn.
De brondata voor het geselecteerde gebied zal veelal nog moeten worden omgezet naar RDF, het dataformaat voor Linked Data. Wellicht is er al het een en ander beschikbaar; de BAG is bijvoorbeeld al als RDF te verkrijgen.
De naar RDF geconverteerde data wordt opgeslagen in een RDF store met een SPARQL endpoint zodat hier vragen aan gesteld kunnen worden. De data van de verschillende bronnen wordt in twee of meer verschillende RDF stores opgeslagen zodat kan worden onderzocht of er gecombineerde vragen gesteld kunnen worden over de grenzen van basisregistraties heen.
De data wordt op een web-developer vriendelijke manier beschikbaar gesteld. Tussen de SPARQL endpoints en de developer zit liefst een API laag die het mogelijk maakt zonder SPARQL kennis vragen aan de data te stellen, en die JSON-LD als dataformaat aanbiedt.
Binnen het project wordt een aansprekende user interface gerealiseerd die toegang biedt tot alle data en het mogelijk maakt door deze data te browsen via een kaart en vragen te stellen over de verschillende basisregistraties heen.
Resource Description Framework (RDF) is een standaardmodel voor gegevensuitwisseling op het web. RDF heeft functies die het samenvoegen van gegevens vergemakkelijken, zelfs als de onderliggende schema's verschillen, en het ondersteunt specifiek de evolutie van schema's in de loop van de tijd zonder dat alle gegevensgebruikers moeten worden gewijzigd.
De activiteiten van Platform Linked Data Nederland (PLDN) worden mede mogelijk gemaakt dankzij het Kadaster, TNO, Big Data Value Center (BDVC), ECP, Forum Standaardisatie, Kennisnet, SLO, Waternet, Taxonic, MarkLogic, Triply, Franz Inc., SemmTech, Rijksdienst voor het Cultureel Erfgoed (RCE), Beeld en Geluid, EuroSDR, de KVK en ArchiXL
Wilt u op de hoogte gehouden worden van nieuws en ontwikkelingen binnen PLDN?
Schrijf u dan in voor de nieuwsbrief