Conceptual Friday 27 maart 2015

Van 9:00 tot 12:00 bij Geonovum: Sessie NGR als linked dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.

Deze sessie gaat over het omzetten van het Nationaal Georegister naar Linked DataLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen op het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires).. Het is een praktische, technisch ingestoken sessie onder leiding van Paul van Genuchten van GeoCat B.V.

Onderwerpen:

  • De conversie van iso19139 naar DCAT (geonovum-nl-profiel naar DCAT-nl en INSPIRE naar DCAT-AP)
  • Mogelijke verbeteringen aan het Nationaal georegister RDF endpooint, zodat deze beter door bv Virtuoso gesponged kan worden
  • Het spongen van spatial formatenAls in Data formaten, Opslagformaten en Uitwisselingsformaten. als shapefile, gml, geojson-ld, wfs en de mogelijke rol van iso19110 feature catalogue metadata hierbij
  • het visualiseren van dcat queries (ckan?/sparql)


Ter voorbereiding:


Verslag

Op de Conceptual vrijdag van 27 maart is veel besproken over mogelijkheden om zowel de metadata als de data van ruimtelijke informatie te publiceren als Linked Geospatial DataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.Een verslag van deze bijeenkomst is te vinden op de blog van Paul van Genuchten.

In de bijeenkomst zijn een aantal actiepunten besproken die mogelijk ook kunnen leiden tot een nieuwe actie lijn: Linked Geospatial DataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.

  1. Het laden van alle metadata uit het NGR als linked data op de Almere server met de huidige DCAT conversie van GeoNetwork. Actie: Paul van Genuchten en Richard Nagelmaeker.
  2. Huidige NGR als test deployen met de Geonetwork 3.0 software. Actie: Jeroen Bloemscheer
  3. BAG Geocodeer service upgraden naar SOLR archtiectuur. Actie: Jeroen Baltussen
  4. Mapping ISO metadata naar DCAT verbeteren. Actie: Ine de Visser
  5. Demo Laan van de Leefomgeving verbreden met NGR in linked data format. Actie: Erwin Folmer
  6. Geodata inclusief metadata als linked data laden via WFS en INSPIRE harmonized data model (XML schema) en via feature-catalog metadata (iso19110). Denk hierbij ook aan RCEDe Rijksdienst voor het Cultureel Erfgoed (RCE) is een onderdeel van het ministerie van Onderwijs, Cultuur en Wetenschap. We werken onder de rechtstreekse verantwoordelijkheid van de minister en voeren wet- en regelgeving en erfgoedbeleid uit dat het ministerie en de dienst samen maken. Ook ontwikkelen we praktisch toepasbare kennis en geven we advies over rijksmonumenten, landschap & leefomgeving, archeologie en roerend erfgoed., SKOSSimple Knowledge Organization System (SKOS) is een internationale standaard voor het maken van taxonomieen en thesauri, CB, JSON-LDJSON-LD is a lightweight Linked Data format. It is easy for humans to read and write. It is based on the already successful JSON format and provides a way to help JSON data interoperate at Web-scale. JSON-LD is an ideal data format for programming environments, REST Web services, and unstructured databases such as CouchDB and MongoDB.. Als testdata kan bijvoorbeeld BGTBasisregistratie Grootschalige Topografie (BGT). of NWB worden gebruikt. Actie: Paul van Genuchten en Thijs Brentjes.
  7. Scannen internationale relevante programma’s van oa ISAInteroperability solutions for public administrations, businesses and citizens (ISA2). This is a follow-up of the original ISA program (see: http://ec.europa.eu/archives/isa/ for the ISA archive).. Actie: Erwin Folmer


By the way werden er nog kort vier scenario geschetst om op basis van bestaande architecturen (bv NGR en PDOKPublieke Dienstverlening Op de Kaart (PDOK)) Linked Geospatial Data te maken:

  1. Eigen vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. van Geodataset maken en in combinatie met NGR metadata converteren naar linked data set in bv Virtuoso. Aan de voorkant ontsluiten via SPARQL endpoint, SOLR, api en/of laten crawlen door zoek machines of een combinatie hiervan.
  2. Bestaande koppelvlakken van WFS en CSW via een slimme api ontsluiten als een linked data set die live bevraag is via SPARQLSimple Protocol And RDF Query Language (SPARQL) is een RDF zoektaal (Query Language) - die gebruikt wordt om RDF-gebaseerde data te bevragen middels zoekopdrachten (Query)..
  3. Stukjes ‘goed’ gedefinieerde datasets zoals BGTBasisregistratie Grootschalige Topografie (BGT). die gekoppeld zijn aan de Concepten bibliotheek converteren naar triples stores in Virtuoso. Ontsluiten zoals in scenario 1.
  4. Geodataset met ETLExtraction, Transformation and Load (ETL) converteren naar nieuwe (linked) dataset en deze via SOLR publiceren. De ETLExtraction, Transformation and Load (ETL) is nodig voor datasets zoals NWB waarbij een object (straat of waterloop) uit vele kleine lijntjes of vlakjes bestaa.


Jeroen Baltussen, Adviseur PDOKPublieke Dienstverlening Op de Kaart (PDOK) (Geonovum)