BGT Linked Data

  1. Projectbeschrijving 2014 BGT-LD-PvA2014
  2. Werkdocument BGT-LD bronbestanden
  3. Werkend prototype BGT-LD-prototype

Proof of Concept

Dit project is een Proof of Concept in opdracht van het ministerie van Infrastructuur en Milieu (I&M). Hieronder volgt een korte beschrijving van de inhoud en aanpak van dit project.

Betrokkenen:

Uitgangspunten

Doel van de PoC is te onderzoeken wat Linked Data kan betekenen voor de BGTBasisregistratie Grootschalige Topografie (BGT).. Meer specifiek:

  • Is Linked Data een goede technologie om data in het stelsel van basisregistraties over de grenzen van registraties heen te gaan verbinden, op zo’n manier dat deze data kan worden gebruikt om allerlei vragen te beantwoorden?
  • Waar liggen de grenzen op het gebied van zaken als performance en opslag waar het grote hoeveelheden data betreft, zoals bijvoorbeeld in de Basisregistratie Grootschalige Topografie (BGTBasisregistratie Grootschalige Topografie (BGT).)?
  • Is het LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). concept geschikt om verrijking toe te passen?


Het BGTBasisregistratie Grootschalige Topografie (BGT). Linked Data project is gekoppeld aan het Platform Linked Data Nederland. Er wordt gebruik gemaakt van de hier aanwezige kennis en infrastructuur, zoals het beschikbare Data Platform LOD waar de tooling aanwezig is om linked data te publiceren en toegankelijk te maken. Over de PoC wordt gepresenteerd tijdens bijeenkomsten van het Platform Linked Data Nederland. Wellicht vinden er ook enkele conceptual fridays plaats over dit onderwerp.

Het project wordt vormgegeven door bronbestanden van verschillende basisregistraties te ontsluiten als linked dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat, verwijzingen aan te brengen tussen deze dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat, vragen te bedenken die aan deze combinaties van data gesteld kunnen worden, en een user interface te ontwikkelen die dit op een toegankelijke manier mogelijk maakt en demonstreert.

Bronbestanden

In het project wordt data uit verschillende basisregistraties aan elkaar gekoppeld. Daarom zijn er meerdere bronbestanden nodig. Naast data uit basisregistraties is het bovendien interessant om te experimenteren met verrijking van BGTBasisregistratie Grootschalige Topografie (BGT). data met meer gedetailleerde informatie, bijvoorbeeld met bronhouder-specifieke beheerinformatie (BOR dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat).


We denken aan:

  • BGTBasisregistratie Grootschalige Topografie (BGT).: grootschalige topografie
  • BAG: adressen en gebouwen
  • BRK kadaster: kadastrale percelen en rechten daarop; en gemeentegrenzen
  • WOZ: waarde van onroerende zaken
  • BRV: voertuigen; dit is het kentekenregister van het RDW
  • NHRBasisregistratie Handelsregister (NHR).: handelsregister / KvK
  • BOR: beheer openbare ruimte (verrijken van BGTBasisregistratie Grootschalige Topografie (BGT). met extra informatie)

Catalogi

Niet alleen dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat, maar ook een beschrijving van de semantiek kan helpen bij het verbinden van basisregistraties. Binnen het project willen we daarom gebruik maken van een aantal catalogi die de semantiek van registraties ontsluit. Dit zijn:

Gebied

De BGTBasisregistratie Grootschalige Topografie (BGT). is nog niet als data voor heel Nederland beschikbaar. Er is dus een keuze voor een specifiek gebied gemaakt: Leiden. Voor dit gebied wordt ook data van de andere bronbestanden verzameld.

Interessante vragen

Binnen het project wordt een aantal (5 tot 10) leuke, interessante vragen bedacht die door gecombineerd te kunnen zoeken in de data uit de verschillende bronbestanden, te beantwoorden zijn.

Publiceren Linked DataLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires).

De brondata voor het geselecteerde gebied zal veelal nog moeten worden omgezet naar RDFResource Description Framework (RDF) is een standaardmodel voor gegevensuitwisseling op het web. RDF heeft functies die het samenvoegen van gegevens vergemakkelijken, zelfs als de onderliggende schema's verschillen, en het ondersteunt specifiek de evolutie van schema's in de loop van de tijd zonder dat alle gegevensgebruikers moeten worden gewijzigd., het dataformaat voor Linked DataLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires).. Wellicht is er al het een en ander beschikbaar; de BAG is bijvoorbeeld al als RDF te verkrijgen.

De naar RDF geconverteerde data wordt opgeslagen in een RDF store met een SPARQL endpoint zodat hier vragen aan gesteld kunnen worden. De data van de verschillende bronnen wordt in twee of meer verschillende RDF stores opgeslagen zodat kan worden onderzocht of er gecombineerde vragen gesteld kunnen worden over de grenzen van basisregistraties heen.

De data wordt op een web-developer vriendelijke manier beschikbaar gesteld. Tussen de SPARQL endpoints en de developer zit liefst een API laag die het mogelijk maakt zonder SPARQL kennis vragen aan de data te stellen, en die JSON-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). als dataformaat aanbiedt.

Aansprekende user interface

Binnen het project wordt een aansprekende user interface gerealiseerd die toegang biedt tot alle data en het mogelijk maakt door deze data te browsen via een kaart en vragen te stellen over de verschillende basisregistraties heen.