Werkgroepbijeenkomst 4 maart 2014

Verslag van de werksessie van case 3 en case 7 op 4 maart 2014

Aanwezig:

  • Matthijs Vonder (TNO)
  • Arnoud de Jong (TNO)
  • Rein van 't Veer (Stichting DENDEN is het nationale instituut ter bevordering van netwerken, samenwerking en

onderlinge kennisuitwisseling op het gebied van digitalisering in de brede cultuursector. DEN ondersteunt cultuurmakers en erfgoedbeherende instellingen om in gezamenlijkheid een actieve bijdrage te leveren aan de informatiemaatschappij op basis van digitale collectievorming, archivering en dienstverlening. DEN draagt in samenwerkingsverbanden tevens bij aan kennisdeling buiten Nederland.)

  • Linda van den Brink (Geonovum)
  • Han Geurtes (CGI)
  • Roel Stap (Data4Use)
  • Ann Loogman (WaterNet)
  • Ed Visser (GemeenteEen gemeente is een groep van woonkernen (dorpen, steden) met het bijbehorende gebied die samen worden bestuurd door een politiek apparaat Den Haag)
  • Thijs Brentjens (Brentjens Geo-ICT)


Organisatorisch: Tussen eind januari en deze bijeenkomst zijn veel praktische stappen gezet. Roel Stap geeft aan veel gemist te hebben omdat de communcatie tussen een paar personen via mail verliep. Verzoek om of een mailing lijst op te zetten of in het vervolg de hele werkgroep op de cc te zetten. Wie niet geïnteresseerd is in alle mailwisseling kan zich laten uitschrijven. We opteren voor dat laatste, omdat een mailinglijst opzetten bij navragen niet heel eenvoudig te regelen blijkt te zijn.

Link naar de slides op Dropbox: https://www.dropbox.com/s/caygofg7lcl78s3/20140304%20PiLOD%20-%20Case%203En7Werksessiev8.pptx

Prototype 1: Scenario archeologische monumenten en grondwaterstanden

Het prototype waarin archeologische monumentendata van Rijksdienst Cultureel Erfgoed wordt gecombineerd met grondwaterstanden verkregen uit peilbuizen van WaterNet, is in gevorderde staat van ontwikkeling. Rein van 't Veer laat een demo zien die te benaderen is op http://erfgoed.nl/geosparql/peilbuizen.html. Dit draait op Sesame met UseekM. Wens is om dit op VirtuosoVirtuoso (Universal server) draaiend te krijgen, maar dat is nog niet gelukt. Rein is bezig aan een SPARQL query die alleen die peilbuizen oplevert die binnen de contour van een monument liggen. Deze levert echter nog niet het verwachte resultaat op.

Thijs heeft op basis van de GeoJSON output van een andere demo van Rein geexperimenteerd met het verrijken van GeoJSON met een JSON-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). @context. Dit is een interessante ontwikkeling volgens de aanwezigen en zelfs mogelijk een mijlpaal in het overbruggen van de kloof tussen geodata en het semantisch web. GeoJSON is een eenvoudig te gebruiken formaat voor ontwikkelaars maar een heel plat formaat; door middel van een JSON-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). @context kun je de semantiek van de datavelden bekend maken. Bestaande applicaties die (Geo)JSON begrijpen, hebben hier geen last van, terwijl linked data toepassingen daardoor de JSON data als linked data kunnen gaan gebruiken. Het toevoegen van een @context is bovendien eenvoudig te doen door middel van een door Thijs ontwikkeld webformulier. Het is interessant om dit bijvoorbeeld op PDOKPublieke Dienstverlening Op de Kaart (PDOK) toe te passsen of de ontwikkelaars van GeoServer te tippen om hier iets mee te gaan doen.

Voor dit scenario betekent dit dat we extern aan de peilbuisdata een @context met de betekenis kunnen toevoegen. En dat we ook aan de peilbuisdata een JSON output moeten geven zodat dit kan. Dit is interessant voor sensordata omdat het wat efficiënter is dan triples. Er moet dan wel getest worden of je niet tegen JSON-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). beperkingen aan loopt.

Prototype 2

Dit prototype beoogt om seismische data (grondtrillingen) te koppelen met de ligging van monumentale panden en met behulp van een voorspellend model de panden te kunnen aanwijzen die risico lopen om in te storten bij meer aardbevingen. Han Geurts is bezig om voor dit prototype de benodigde data bij elkaar te krijgen. Dit betreft data van meetstations die voortdurend aardschokken meten, bouwkundige variabelen over gebouwen die je kunt monitoren, en mogelijk in gebouwen te plaatsen sensoren (rekstrookjes). Han's vraag aan de groep is: zodra hij de data bij elkaar heeft, kunnen wij dan helpen met het linked maken daarvan? Advies van de groep is om eerst met een eigen datastore, geoptimaliseerd op wat er nodig is, te werken en de modellen te ontwikkelen tot het werkt, en er dan pas linked open data van te maken.

Vervolgstappen

  • Afstemmen wat de volgorde van deze vervolgstappen moet zijn! De rest van de stappen in deze lijst staan nu dus nog niet op volgorde.
  • Rippen website: ophalen peilbuislocaties (voltooid)
  • Rippen website: ophalen sensordata (voltooid)
  • Coördinaten hieruit converteren van RD naar lon, lat (voltooid)
  • Waterstandsverschillen berekenen
  • "proto-LODInformatie gepubliceerd als Open Data en dat aan andere data linkt, wordt Linked Open Data (LOD) genoemd. Data wordt nog beter ontsloten, omdat men zoveel mogelijk verwijzingen aanbrengt naar andere kennisbronnen en anderen gemakkelijk naar informatie kunnen verwijzen." maken: data omzetten in n-triples, lon/lat naar GeoSPARQLGeoSPARQL is zowel een beknopte ontologie voor geo-informatie als een uitbreiding op SPARQL met functionaliteit voor ruimtelijke vragen (in de buurt van, overlapt met, etc). GeoSPARQL is gestandaardiseerd bij het Open Geospatial Consortium. conforme POINTS converteren, in triple store zetten (voltooid)
  • Hoe moeten we de dynamische sensor data ontsluiten?
  • Een sensor vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. gebruiken (bijvoorbeeld SSN). (Roel, Linda) Twee redenen om een bekende sensor vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. te gebruiken: omdat dan anderen het ook kunnen snappen, maar ook omdat je er dan mogelijk een reasoner over kan gebruiken. Zijn er ook domeinspecifieke reasoners voor?
  • Een URI domein kiezen: peilbuizen.pilod.nl. (voltooid)
  • Overzetten op PiLOD platform (VirtuosoVirtuoso (Universal server), of Sesame + USeeKM)
  • Metadata voor de datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder.: kijken wat er nog voor vervolgstap kan zijn na het door Ed verrichte basiswerk. (Ed, Rein, Han)
  • Keuze maken uit geo vocabulaires (Linda, Rein, Thijs)
  • Experimenteren met gecombineerde (federated) queries. Nu lage prio, geen persoon aan gekoppeld.
  • Combinatie met nog meer datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder., bv RCEDe Rijksdienst voor het Cultureel Erfgoed (RCE) is een onderdeel van het ministerie van Onderwijs, Cultuur en Wetenschap. We werken onder de rechtstreekse verantwoordelijkheid van de minister en voeren wet- en regelgeving en erfgoedbeleid uit dat het ministerie en de dienst samen maken. Ook ontwikkelen we praktisch toepasbare kennis en geven we advies over rijksmonumenten, landschap & leefomgeving, archeologie en roerend erfgoed. beeldbank, DINO grondwaterstanden


Acties:

  • Rein: Demo 12 maart geven. Hij laat dan zien hoe ver we zijn met prototype 1.
  • Linda: Presentatieslot op april bijeenkomst van PiLOD vragen voor Thijs zodat hij over GeoJSON-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). kan vertellen.
  • Thijs: URI resolver tool opzoeken. Hij kwam er laatst 1 tegen.