Case Linked Data en Locatie

Welkom bij case 3: Linked data en locatie. Trekker: Linda van den Brink [1]

Case 3 werkt nauw samen met case 7, Sensoren (trekker: Matthijs Vonder [2])

Het plan van aanpak staat in Dropbox: https://www.dropbox.com/s/e911lirzxsuoa9u/Plan_LODenLocatie.docx

De tekst op deze wiki is meer gefocust dan het PvA. In het PvA staan de onderwerpen beschreven die vooraf als mogelijke inhoud van deze case werden beschouwd, terwijl de wiki zich toespitst op die onderwerpen en activiteiten die de werkgroep gekozen heeft.

Als hoofdactiviteit in case 3 gaan we een prototype opzetten met verschillende datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder. die iets te maken hebben met erfgoed en / of met locatie. We kiezen voor datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder. die al als linked data beschikbaar zijn of die door de eigenaar van de data / als activiteit in een andere case al wordt omgezet naar linked dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat. We besteden aandacht aan het opnemen van metadata voor deze datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder. (DCAT, VoIDDe Vocabulary of Interlinked Datasets (VoID) is een Vocabulaire om relaties tussen datasets uit verschillende data catalogi mee te beschrijven.). Gaandeweg doen we ervaring op met het publiceren van linked geodata en met LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). vocabulaires voor locatie, in het bijzonder GeoSPARQLGeoSPARQL is zowel een beknopte ontologie voor geo-informatie als een uitbreiding op SPARQL met functionaliteit voor ruimtelijke vragen (in de buurt van, overlapt met, etc). GeoSPARQL is gestandaardiseerd bij het Open Geospatial Consortium. (inhoudelijk, technisch, en ondersteuning door tools).

Het prototype dat wordt gerealiseerd combineert archeologische monumentendata van de Rijksdienst Cultureel Erfgoed (RCEDe Rijksdienst voor het Cultureel Erfgoed (RCE) is een onderdeel van het ministerie van Onderwijs, Cultuur en Wetenschap. We werken onder de rechtstreekse verantwoordelijkheid van de minister en voeren wet- en regelgeving en erfgoedbeleid uit dat het ministerie en de dienst samen maken. Ook ontwikkelen we praktisch toepasbare kennis en geven we advies over rijksmonumenten, landschap & leefomgeving, archeologie en roerend erfgoed.) met peilbuis-sensordata verkregen via Waternet. Wellicht wordt ook RCEDe Rijksdienst voor het Cultureel Erfgoed (RCE) is een onderdeel van het ministerie van Onderwijs, Cultuur en Wetenschap. We werken onder de rechtstreekse verantwoordelijkheid van de minister en voeren wet- en regelgeving en erfgoedbeleid uit dat het ministerie en de dienst samen maken. Ook ontwikkelen we praktisch toepasbare kennis en geven we advies over rijksmonumenten, landschap & leefomgeving, archeologie en roerend erfgoed. beeldbank data gegeorefereerd (via BAG geocodeerservice) en meegenomen in dit prototype. We gaan kijken of we met federated queries de data uit verschillende endpoints kunnen combineren en ontsluiten via een website. Door het combineren kun je dan de vraag beantwoorden welke archeologische monumenten bedreigd worden door wisselende grondwaterstanden.

De relatie tussen de vooraf bedachte onderwerpen en of/hoe deze aan bod komen in de PiLOD:

Ik (Linda) ben overigens vrijdagochtend doorgaans bij Geonovum op kantoor dus wie de conceptual Friday sessies bezoekt kan mij daar ontmoeten. Vrije inloop!

Er is ook een lijst van geïnteresseerden in case 3 en case 7.

Use caseEen usecase in software engineering en systems engineering is een beschrijving van een gedrag van een systeem, dat reageert op een verzoek dat stamt van buiten het systeem. Met andere woorden, de use case beschrijft "wie" met het betreffende systeem "wat" kan doen (bron: Wikipedia). voor de case 3/7 applicatie

Use caseEen usecase in software engineering en systems engineering is een beschrijving van een gedrag van een systeem, dat reageert op een verzoek dat stamt van buiten het systeem. Met andere woorden, de use case beschrijft "wie" met het betreffende systeem "wat" kan doen (bron: Wikipedia).: Archeologisch beheerder gebruikt "archeologische degradatie-webpagina"

Primaire actor: archeologisch monumentbeheerder

Doel: inzicht krijgen in welke archeologische monumenten het ernstigst worden blootgesteld aan grondwaterstandswisselingen, zodat hierop actie (buiten scope van de use caseEen usecase in software engineering en systems engineering is een beschrijving van een gedrag van een systeem, dat reageert op een verzoek dat stamt van buiten het systeem. Met andere woorden, de use case beschrijft "wie" met het betreffende systeem "wat" kan doen (bron: Wikipedia).) ondernomen kan worden.

Auteur: Rein van 't Veer, 26-3-2014

Main success scenario

  • De applicatie toont op een kaart archeologische monumenten en peilbuislocaties.
  • De applicatie interpoleert zelf voor iedere archeologisch monument ontbrekende meetperiodes indien er binnen een straal van 1 kilometer rondom het monument geen peilbuizen met ononderbroken meetperiodes zijn.
  • De degradatie is gebaseerd op de hevigheid van de grondwaterstandswisseling die het dichtst in de buurt van het het monument is gemeten:
  • De maat voor de degradatie is gebaseerd op de jaarlijkse som van de differentiatie van de grondwaterstand over de periode van een maand (dit is een aanname voor een zinvolle maat voor het moment).
  • Bij openen van de applicatie zoomt de applicatie automatisch naar de vindplaats die het afgelopen jaar aan de grootste grondwaterstandswisselingen onderhevig is geweest.
  • De applicatie toont in kleurschakeringen (1 kleur per archeologisch monument) van groen (veilig) tot rood (zware wisselingen) de degradatie waaraan het monument onderhevig is geweest.
  • De beheerder kan op een monument klikken en hiermee aanvullende informatie over het monument tonen, waaronder een grafiekje van de grondwaterstanden in de peilbuis.
  • De beheerder kan zien op welke peilbuisdata de degradatie-berekening is gebaseerd doordat er lijnen zijn getrokken van het middelpunten van de monumentcontouren naar de peilbuis-puntlocaties waar de metingen zijn verricht.
  • De beheerder kan in een tekstvak een plaats intypen zodat de kaart naar deze locatie zoomt.
  • De beheerder kan de kaart verschuiven en schalen (in en uitzoomen, standaard web mapping functionaliteit)

Aannames

1. De maat van degradatie op basis van het bovenstaande model is qua relevantie een volledige gok. 2. Extrapolatie van missende peilbuisdata kan door tussenliggende periodes lineair te interpoleren. Complexere modellen zijn later altijd nog mogelijk.

Werkzaamheden

1a. Metadata beschrijvingen over de gehele sets maken (Rein, Han)

  • o.a. wie is eigenaar van de set, waar staat de set etc
  • archeologische monumenten
  • peilbuizen


1b. VocabulairesEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. onderzoeken

Beschrijving peilbuisdata waar een vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. voor nodig is.

  • Twee redenen om een bekende sensor vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. te gebruiken: omdat dan anderen het ook kunnen snappen, maar ook omdat je er dan mogelijk een reasoner over kan gebruiken. Zijn er ook domeinspecifieke reasoners voor?
  • zie demo “context-tooltje” van Thijs Brentjes
  • kijken naar vocabulaires die er al zijn mbt sensordata SNN, ...(Roel, Linda, Ann)
  • geo vocabulaires (Linda, Rein, Thijs) (edit door Rein van 't Veer: 28-5-2014)
    • keuze maken (Geosparql, basicGeo, GeoJson, neogeo, ...) Keuze is gevallen op GeoSPARQLGeoSPARQL is zowel een beknopte ontologie voor geo-informatie als een uitbreiding op SPARQL met functionaliteit voor ruimtelijke vragen (in de buurt van, overlapt met, etc). GeoSPARQL is gestandaardiseerd bij het Open Geospatial Consortium.-well known text


1c. Strategie(n) onderzoeken tav (dynamische) grootschalige sensor data ontsluiting (Arnoud, Matthijs)

  • denk aan situatie waarbij alle peilbuizen in NL elk uur een stand doorgeven. Ergo: een immer groeiende set dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat
  • enkele mogelijkheden
    • alleen soort metadata (gemiddelden, laatste waarde) als LOD (en geen raw dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat)
    • volledige dataset (meta + sensor) als LOD -> alles “vertrippelen”
    • sensordata in “normale” database en achter een URI-proxy zetten
    • Json / Json-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). (zie demo Thijs Brentjes)
  • Alles kan, maar wat is handig (en in welke situatie)


2.a Onderzoek naar mogelijkheden/beperkingen bij keuze voor Pilod platform

  • VirtuosoVirtuoso (Universal server) 7.1 (is al geïnstalleerd, maar geeft nog wat issues)
  • of combi van Sesame en USeekM installeren (zoals ook door DENDEN is het nationale instituut ter bevordering van netwerken, samenwerking en

onderlinge kennisuitwisseling op het gebied van digitalisering in de brede cultuursector. DEN ondersteunt cultuurmakers en erfgoedbeherende instellingen om in gezamenlijkheid een actieve bijdrage te leveren aan de informatiemaatschappij op basis van digitale collectievorming, archivering en dienstverlening. DEN draagt in samenwerkingsverbanden tevens bij aan kennisdeling buiten Nederland. is gebruikt) Rein zal kijken of de huidige PiLOD VirtuosoVirtuoso (Universal server) installatie de use caseEen usecase in software engineering en systems engineering is een beschrijving van een gedrag van een systeem, dat reageert op een verzoek dat stamt van buiten het systeem. Met andere woorden, de use case beschrijft "wie" met het betreffende systeem "wat" kan doen (bron: Wikipedia). ondersteunt. (edit door Rein van 't Veer: 28-5-2014)


2b. n-triples maken voor alle peilbuizen in alle lagen (Arnoud iom Rein)

  • juiste formaat voor de coördinaten (edit door Rein van 't Veer: 28-5-2014)
  • hoe doen we de sensor dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat? Rob van Dort maakt een SSN-geannoteerd voorbeeld (edit door Rein van 't Veer: 28-5-2014)
  • eerst even: laatste meting (tijdstip + waarde)
  • wat doen we met afgesloten buizen? Afgesloten peilbuizen worden niet geextrapoleerd (edit door Rein van 't Veer: 28-5-2014)
    • expliciet toevoegen van start en eind tijdstip aan de dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat
  • Berekenen van “differentiatie van de grondwaterstand” als soort maat voor potentiele aantasting (Arnoud en Matthijs)
    • hoe uitrekenen (ipv de random dummy)
    • welke eenheid (cm/jaar?)
    • alleen laatste waarde en/of ook per jaar
  • URI strategie: wijzigen in: peilbuizen.pilod.nl (ipv peilbuizen.nl) is gedaan, nog zorgen voor content negotiation (edit door Rein van 't Veer: 28-5-2014)
  • Originele Sensordata als LOD opslaan (Arnoud en Matthijs)
  • http://peilbuizen.pilod.nl subdomein verwijst door naar een linked data viewer (SNORQL) die data als webpagina's kan serveren (toegevoegd door Rein van 't Veer: 28-5-2014)

3. Gecombineerde queries/federated queries (case 3)

  • Eerst: Kunnen uitvoeren van de Queries op de data setsZie ook Data streams. (Rein)
  • Indien mogelijk: in 1 keer 1 query over verschillende end-points (federated)
  • dezelfde query achterelkaar/parallel over verschillende end-points en combineer resultaat
  • NB: moet SPARQL1.1 compliant zijn


4. Tonen sensordata

  • Gebruik GeoJson, Json-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). in de eind applicatie tbv visualisatie van de resultaten (Thijs, Rein, Arnoud)
  • Ook tonen van de sensordata mbv grafiek component , bv D3 (Arnoud, Thijs en Rein)


5. Combinaties met andere datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder. (indien makkelijk en tijd toestaat)

  • Beeldbank (bv. archeologische opgravingen / voorwerpen)
  • Zijn andere grondwaterstanden beschikbaar? Bijv. via DINO
  • Info over grondsamenstellingen


6. Visualisatie als screencast voor slotbijeenkomst (toegevoegd door Rein van 't Veer: 28-5-2014)

  • Video toont kaart met contouren van archeologische monumenten in verschillende kleurschakeringen. Kleurschakeringen geven aan in welke mate de monumenten zijn blootgesteld aan grondwaterstandswisselingen. De gebruiker verschuift het kaartbeeld en zoomt in om te tonen dat het geen statische afbeelding is maar een web-framework.
  • De gebruiker klikt een contour aan. De contour toont nu een popup box die informatie toont over de vindplaats. De eigenschap-labels (predicates) zijn weergegeven als hyperlinks.
  • De gebruiker klikt een hyperlink van een eigenschap aan, die de gebruiker naar een andere pagina brengt met wat informatie over de eigenschap, als demonstratie van semantisch-web principes in webpagina's
  • De gebruiker gaat terug naar de toepassing en klikt een verbindingslijn aan tussen een vindplaats en een peilbuis. De verbindingslijn geeft een popup box met de afstand. De gebruiker sluit de box.
  • De gebruiker klikt op de peilbuis waarmee de contour verbonden is. De toepassing toont een popup box met eigenschappen van de peilbuis. Ook hier zijn de eigenschap-labels (predicates) weergegeven als hyperlinks.
  • Aanklikken van een van de peilbuis eigenschap-hyperlinks opent een pagina die uitleg geeft over deze eigenschap. De gebruiker sluit de box.
  • De video eindigt.

Verslagen