Werksessie 2 december 2015

(Doorverwezen vanaf Werksessie 2 december 2015)

Locatie: TNO Soesterberg

Programma op hoofdlijnen:

09:30 - 15:00 Unconference sessie onder leiding van Bart van Leeuwen
15:00 - 17:00 Linked Data bij het Kadaster (blok met meerdere presentaties)

Onderwerpen[bewerken]


20151202 101949 LD Topics.jpg

Sessies[bewerken]

Sessie - URI strategie en informatiemodellen (Hans Overbeek, Nic Roest en Peter Lentjes)[bewerken]


  • Centrale vraag: als een object andere kenmerken krijgt, bijvoorbeeld een andere functie, krijgt het dan een nieuwe URI? Voorbeeld: als een kerk een skatehal wordt, en je kijkt vanuit functie, is het dan een nieuw object? Voor een topograaf niet, de kerk heeft nog steeds de functie van orientatie-object op de kaart. Maar voor een kerken- of skateparkenregister wel.
  • Uitgangspunt: we identificeren resources in systemen, geen dingen in de werkelijkheid.
  • Men is het eens over deze aanbevelingen:
    • streef naar stabiele URIs die je zo min mogelijk hoeft te veranderen.
    • Als je objecten laat vervallen en nieuwe maakt, zorg dan dat de oude URI ook nog werkt en de gebruiker helpt te vinden wat hij zoekt.
    • Nog een vraag: als we geen dingen in de werkelijkheid identificeren, maar resources in systemen, hoe kun je dan kenbaar maken dat die resources allemaal over hetzelfde ding in de werkelijkheid gaan?
    • De groep ziet dit niet als groot probleem. Zodra iemand behoefte heeft aan die kennis moet die de koppeling maken.
  • Idee: objectvormingsprotocol als metadata opnemen. De houder van een registratie bepaald naar aanleiding van welke wijzigingen nieuwe objecten en dus nieuwe URIs worden gevormd; maar de gebruiker moet wel weten hoe de registratie is ingericht en wanneer nieuwe URIs worden gemunt. Dus het protocol moet gepubliceerd worden.
  • Tenslotte de vraag: is het een probleem dat er al een jaar niet geschreven is aan de URI strategie? Dit vindt niemand; wel is er behoefte om het woord ‘concept’ er af te halen.


Sessie - W3C, Geo op het web en linksets (Bart v Leeuwen en Linda vd Brink)[bewerken]

W3C[bewerken]

  • Er is weinig deelname vanuit Nederland (wel op Europees niveau) aan het W3C standaardenproces. Bart legt uit hoe dit proces werkt:
    • Elk lid, of dit nou een grote of kleine organisatie is, heeft één stem.
    • Leden van de W3C vormen op basis van behoefte werkgroepen en maken in deze groepen standaarden.
    • Working drafts zijn voor iedereen die geinteresseerd is om commentaar op te leveren.
    • Voordat een working draft een Recommendation (standaard) wordt, moet alle commentaar beantwoord zijn en de commentaargever aangeven tevreden te zijn.
    • Standaarden zijn zowel tijdens het ontwikkelproces als daarna open en gratis verkrijgbaar.
    • Er is geen echt beheerproces. Na publicatie van een standaard wordt de werkgroep opgeheven. Als er commentaar komt op een gepubliceerde standaard kijken de W3C leden of er noodzaak is een nieuwe versie te ontwikkelen en zonodig (en als de leden hier animo voor hebben) wordt er een nieuwe werkgroep opgericht.
  • Bart zal een nieuwsstroom opzetten voor geinteresseerden in ontwikkelingen in W3C gerelateerd aan de Data activity. Daar zitten de aan linked data gerelateerde zaken. Hier was interesse voor vanuit PLDN.

Geo op het web[bewerken]

  • Bart, Linda en Frans zitten in de Spatial Data on the Web werkgroep. Dus goede vertegenwoordiging vanuit PLDN.
  • Use cases en requirements voor dit onderwerp zijn verzameld in een working draft: http://www.w3.org/TR/sdw-ucr/ Hier wordt commentaar op gevraagd. Zijn de requirements compleet?
  • Nu is de werkgroep bezig met een Best Practices document http://w3c.github.io/sdw/bp/. De eerste working draft wordt binnenkort verwacht.
  • Linda is editor van dit document.
  • Het doel van dit document is om op een leesbare manier aan zowel geo-ict experts als web developers uit te leggen hoe je het beste geodata op het web kan publiceren, in lijn met de algemene webstandaarden.
  • Ook op dit document is commentaar altijd welkom. Op 10 februari zal de werkgroep in Nederland bijeen komen parallel met een PLDN sessie en een open werkgroep sessie houden. PLDN leden worden uitgenodigd hierbij te zijn om hun feedback op de best practice te geven en toe te lichten.
  • Nic Roest geeft aan behoefte te hebben aan een nieuwe property die aangeeft dat twee resources over dezelfde plaats gaan (samePlaceAs) of dat een resource een (kaart)representatie is van een ding in de werkelijkheid.

Linksets[bewerken]

  • Is een mechanisme om de verbinding te leggen tussen twee datasets op objectniveau. Het kan mogelijk de vraag beantwoorden: wie zegt iets over mijn object?. En het maakt ook mogelijk dat een derde partij de links tussen 2 sets legt.


Sessie - Inference Engines en Linked Data (Erwin Folmer)[bewerken]


Uitgangssituatie en ambitie:

  • Bij het Kadaster is er een grote bak met Linked Data beschikbaar, maar hoe kunnen we het maximale uit deze bak met Linked Data halen?


Mogelijke volgende stap:

  • Kennistechnologie (inference engines) toepassen met Linked Data om zo vragen beantwoord te kunnen krijgen, Ja/Nee vragen en vragen die antwoorden geven met een bepaalde waarschijnlijkheid, maar ook om nieuwe feiten af te kunnen leiden die je voorheen nog niet wist door (redeneer)regels toe te passen op een bak met feiten (verrast worden met nieuwe inzichten).


Vragen als:

  • Waar mogen windmolens geplaatst worden in Nederland? gegeven:
    • de wet en regelgeving die van toepassing is op deze vraag;
    • gegeven de geografische locatie van (groepen van) kadastrale objecten en hun ‘functie’ (zoals woonwijken, etc.)
  • Mogen er zonnecollectoren geplaatst worden op een gebouw met een bijzonder functie (zoals een monument) en zo ja, waar mogen deze zonnecollectoren dan geplaatst worden? (aan de voorkant niet, maar aan de achterkant mogelijk wel), gegeven:
    • de wet en regelgeving die van toepassing is op deze vraag;
    • de kenmerken van een gebouw en zijn directe omgeving die relevant zijn voor het beantwoorden van deze vraag (vorm, afmetingen, functie, voorkant, achterkant, etc.)


Uitdagingen:

  • Wetgeving (omgevingswet en andere wetten die op hetzelfde object betrekking hebben, maar dan vanuit een andere invalshoek) heeft een aantal eigenschappen die het moeilijk maken om wetgeving te vertalen naar goede regelsets:
    • Complexiteit
    • Afhankelijkheden
    • Fouten (onjuistheden)
    • Inconsistenties (tegenstrijdigheden)
    • Behapbare voorbeelden niet/moeilijk te vinden
    • Wetgeving kan niet zo maar aangepast worden om zo makkelijker goede regelsets te kunnen definieren
  • Redeneren met onzekerheid (en/of met onvolledige informatie)
    • De meeste voorbeelden gaan uit van een closed world assumption en van vragen waar je een Ja/Nee antwoord op kan krijgen, zoals
      • Krijg ik een vergunning voor het plaatsen van een dakkapel gegeven de relevante kenmerken van de situatie van mijn huis voor het beantwoorden van deze vraag
    • De vragen die binnen een open world assumption gesteld worden zijn (nog) complexer om op te lossen, vragen:
      • Waar je geen Ja/Nee antwoord op krijgt, maar waar je het antwoord Misschien op kan krijgen
      • Waar je met een bepaalde waarschijnlijkheid aangeeft welke antwoordoptie met meest waarschijnlijk is en hoe de verdeling is ten opzichte van de andere opties


Oplossingsrichtingen, standaarden en mogelijke tooling

  • Standaarden, reccommendations en onderzoek binnen communities:
    • OWL (basic reasoning with OWL)
    • SPIN (SPARQL Inferencing Notation)
    • Data shapes en Shacl (Shapes Constraints Language)


  • Bevindingen en inzichten tot nu toe:
    • OWL is te beperkt om goed te kunnen redeneren en kan niet redeneren over meerdere vocabulaires heen. Dan zou je een overkoepelende vocabulaire moeten maken die de combinatie van die vocabulaires omvat.
    • SPIN en Shacl lijken kansrijker als oplossingsrichting in combinatie met tools als TopBraid Composer en Allegrograph.
    • Daarnaast is het redeneren met data vaak makkelijker op het niveau van beleids-vraagstukken dan bij vragen die rekening moeten houden met de regels zoals die in diverse wetten zijn beschreven.


  • Tooling
    • TopBraid Composer (met SPIN en Shacl)
    • Allegrograph (met een inference engine en SPIN)
    • Rules engines? DROOLS, JRules, …
    • Maatwerk? Bijv. JAVA applicatie


Opvallend is, dat men in een aantal situaties toch kiest voor een maatwerk-applicatie, omdat rules engines de complexiteit en afhankelijkheden die er in de wetgeving zitten niet goed aankunnen. En als men dan toch met een rules engine zou willen werken dan zou deze uitgebreid moeten worden met maatwerk om toch met die complexiteit en afhankelijkheden om te kunnen gaan. In dat geval kiest men dan toch voor een volledige maatwerkoplossing.

Architectuurplaatje

Er zijn al eerder een aantal architectuurplaatjes gemaakt om dit vraagstuk in kaart te brengen. Tijdens deze werksessie is de volgende plaat getekend.

20151202 124029 LD Sessie IE.jpg

Links met interessante informatie:


Vervolgstappen:

  • Goede use case definieren (actie: Erwin)
  • Tenminste 1 Conceptual Friday in januari 2016 organiseren om dit verder te bespreken (actie: Erwin)


Sessie - DEMO en Linked Data interface / GUI (Richard Nagelmaker en Jeroen van Beele)[bewerken]


Hoe kun je een goede user interface maken om gebruikers informatie te laten ontdekken, waarbij de onderliggende data linked is? Richard heeft dit gedaan met de Knowledge Diviner, en vraagt zich af hoe je gebruikers nog meer met linked data kunt laten interacteren. Feedback:

  • De gebruiker denkt niet in triples dus die moet je niet in je UI laten terugkomen.
  • De verbanden tussen de begrippen laten zien, zodat de gebruiker hints heeft welke begrippen hij kan combineren.
  • Visualiseren op een kaart geeft veel inzichten.


DEMO is ontwikkeld aan de TU Delft en is een manier op organisaties te modelleren. Als je dit naar semantic web vertaalt kun je daarmee dus processen in Linked Data beschrijven. Resources, kennis, arbeid delen we wel al op het web, planningen en doelen nog niet. Dit gat wil de DEMO op het Semantisch Web werkgroep invullen.

Er is een nieuwe werkgroep opgericht die zich erop richt DEMO naar het semantisch web te brengen. Deelnemers: Jeroen van Beele, Nic Roest, Pano Maria. Tijdens de sessie sluit Thies Mesdag zich aan. Wellicht Richard ook.

Sessie - ODINE project van Netage (Bart van Leeuwen)[bewerken]


Bart legt uit hoe het proces werkt om voor deze EU funding in aanmerking te komen.

  • Voor kleine en middelgrote bedrijven. ZZPer kan ook.
  • Het idee moet nieuw zijn, open data gebruiken of maken, en er moet een business idee achter zitten hoe je er geld mee gaat verdienen.
  • Je mag er een commercieel product mee maken.


Voorbeelden:


Sessie - Living Lab voor open innovatie met Linked Data bij Bibliotheken (Koen Baaij)[bewerken]


De bibliotheken gaan digitaal en gaan zich minder op uitleenfaciliteit focussen, meer op informatiemakelaarschap. In een living lab willen ze de weg hiernaar ontdekken. In het living lab kunnen gebruikers, ontwikkelaars, etc idee creatie gaan doen. Het doel is: op een aantrekkelijke en bruikbare manier informatie naar burgers brengen.

Koen vraagt tips over het tot een succes maken van een living lab. Uit de groep kwam o.a.:

  • Zorg voor een goede samenstelling van de community, bv vertegenwoordiging uit bedrijfsleven, wetenschap, overheid, gebruikers, ontwikkelaars.
  • Zorg ervoor dat je ontwikkelaars ook mee krijgt, daarvoor moet je wellicht weer een andere taal spreken.
  • Zorg voor aansprekende databronnen
  • Zorg dat je vertegenwoordigers van je doelgroepen in je community krijgt.
  • Run de community op een open manier: bijeenkomsten open voor iedereen, resultaten open publiceren, zorg voor wiki of andere digitale samenwerkingsvormen, enz.
  • Denk ook na over wat de band met PLDN kan zijn. PLDN is ook een soort living lab; misschien kan het een subcommunity van PLDN worden?


Begin komend jaar gaat het living lab van start.

Presentatie - Linked data bij het Kadaster (Peter Lentjes, Erwin Folmer, Marco Brattinga, Dimitri van Hees en Rein van 't Veer)[bewerken]


Presentatie: Kadaster Data Platform, GRID Experiment 1: (Linked) Data Platform voor Proeftuin Omgevingswet

Er wordt geexperimenteerd met het beschikbaar stellen van data uit PDOK als linked data.

Er is een developerslijn waarbij vanuit PDOK WFS services (web services voor geodata) APIs worden gegenereerd.

En er is een semantische lijn waarbij vanuit de semantiek van de brondata linked data wordt gegenereerd. Er is een ‘linked data theatre’ opgezet waar je de linked data op verschillende manieren kan benaderen, o.a. kan de gebruiker door de data heen browsen.

Ook is de BRT voor een deel van Nederland, rondom Leiden, als linked data gepubliceerd. http://brt.kadaster.nl.

Conclusie[bewerken]


Feedback op de unconference vorm was positief. Het is voor herhaling vatbaar!

Aankondiging[bewerken]


2 December is een Platform Linked Data bijeenkomst die jullie maken! Onder begeleiding van Bart van Leeuwen houden we die dag een Unconference sessie. Het grootste deel van de dag is er geen programma want dat gaan we samen maken. Is er iets dat je altijd al had willen bespreken maar je nog nooit als een sessie durfde in te dienen? Meld het in een 2 minuten pitch aan het begin van de dag! Heb je niets bedacht, maar word je getriggerd door een pitch? Sta op en geef er zelf ook één. Op basis van de pitches vullen we de dag, tot 3 uur ’s middags, in met breakout sessies. Heb je 10 dingen bedacht, dan sluit je 10 maal achter in de rij aan om 10 maal een pitch te gegeven.

Aan het einde van de pitch ronde gaan we samen een planning maken:

  • welke zaken lijken op elkaar en kunnen samen in een sessie?
  • welke onderwerpen krijgen toch niet de ondersteuning van het grote publiek ?
  • welke onderwerpen mogen absoluut niet gelijktijdig behandeld worden ?


We pakken een bak koffie en gaan aan de slag. Tot 3 uur wordt de dag gevuld met breakout sessies. Van 3 tot 5 sluiten we af met een informatief blok over de vorderingen rondom Linked Data bij het Kadaster.

De inhoud van de breakout sessies mag van alles zijn als het maar over Linked Data gaat, echter het is niet de bedoeling dat je zelf voor de volle duur van de sessie gaat praten! Als je wilt mag je snel wat presenteren, slides, filmpje, tekening alles mag, maar het hoeft niet, zitten en je verhaal doen is ook goed! Er zijn wat simpele regels:

  • De pitcher praat maximaal 10 minuten
  • Er is iemand die e.a. vast legt
  • Interesseert het onderwerp je toch niet, dan sta je op en loop je naar een andere sessie.
  • De opstelling moet uitnodigen tot interactie
  • Interactie is een must, samen maken we de inhoud!


Kan je nu niets bedenken waar je het over wilt hebben? kom langs en laat je inspireren door de zaken die op dat moment voorbij komen, en draag bij met je vragen, ideeën en ervaring!

Tot 2 December!

Nuttige links[bewerken]