Werksessie 2 december 2015

Locatie: TNO Soesterberg

Programma op hoofdlijnen:

09:30 - 15:00 Unconference sessie onder leiding van Bart van Leeuwen
15:00 - 17:00 Linked Data bij het Kadaster (blok met meerdere presentaties)

Onderwerpen


20151202 101949 LD Topics.jpg


Sessies

Sessie - URI strategie en informatiemodellen (Hans Overbeek, Nic Roest en Peter Lentjes)


  • Centrale vraag: als een object andere kenmerken krijgt, bijvoorbeeld een andere functie, krijgt het dan een nieuwe URI? Voorbeeld: als een kerk een skatehal wordt, en je kijkt vanuit functie, is het dan een nieuw object? Voor een topograaf niet, de kerk heeft nog steeds de functie van orientatie-object op de kaart. Maar voor een kerken- of skateparkenregister wel.
  • Uitgangspunt: we identificeren resources in systemen, geen dingen in de werkelijkheid.
  • Men is het eens over deze aanbevelingen:
    • streef naar stabiele URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke. die je zo min mogelijk hoeft te veranderen.
    • Als je objecten laat vervallen en nieuwe maakt, zorg dan dat de oude URI ook nog werkt en de gebruiker helpt te vinden wat hij zoekt.
    • Nog een vraag: als we geen dingen in de werkelijkheid identificeren, maar resources in systemen, hoe kun je dan kenbaar maken dat die resources allemaal over hetzelfde ding in de werkelijkheid gaan?
    • De groep ziet dit niet als groot probleem. Zodra iemand behoefte heeft aan die kennis moet die de koppeling maken.
  • Idee: objectvormingsprotocol als metadata opnemen. De houder van een registratie bepaald naar aanleiding van welke wijzigingen nieuwe objecten en dus nieuwe URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke. worden gevormd; maar de gebruiker moet wel weten hoe de registratie is ingericht en wanneer nieuwe URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke. worden gemunt. Dus het protocol moet gepubliceerd worden.
  • Tenslotte de vraag: is het een probleem dat er al een jaar niet geschreven is aan de URI strategie? Dit vindt niemand; wel is er behoefte om het woord ‘concept’ er af te halen.

Sessie - W3CHet World Wide Web Consortium is een organisatie die de webstandaarden voor het wereldwijde web ontwerpt, zoals HTML, XHTML, XML, CSS en de Web Content Accessibility Guidelines. Het wordt geleid door Tim Berners-Lee, de originele bedenker van het HTTP-protocol en HTML, waar het web oorspronkelijk en nog steeds grotendeels op gebaseerd is., Geo op het web en linksetsEen linkset is een verzameling links tussen twee datasets. (Bart v Leeuwen en Linda vd Brink)

W3CHet World Wide Web Consortium is een organisatie die de webstandaarden voor het wereldwijde web ontwerpt, zoals HTML, XHTML, XML, CSS en de Web Content Accessibility Guidelines. Het wordt geleid door Tim Berners-Lee, de originele bedenker van het HTTP-protocol en HTML, waar het web oorspronkelijk en nog steeds grotendeels op gebaseerd is.

  • Er is weinig deelname vanuit Nederland (wel op Europees niveau) aan het W3C standaardenproces. Bart legt uit hoe dit proces werkt:
    • Elk lid, of dit nou een grote of kleine organisatie is, heeft één stem.
    • Leden van de W3C vormen op basis van behoefte werkgroepen en maken in deze groepen standaarden.
    • Working drafts zijn voor iedereen die geinteresseerd is om commentaar op te leveren.
    • Voordat een working draft een Recommendation (standaard) wordt, moet alle commentaar beantwoord zijn en de commentaargever aangeven tevreden te zijn.
    • Standaarden zijn zowel tijdens het ontwikkelproces als daarna open en gratis verkrijgbaar.
    • Er is geen echt beheerproces. Na publicatie van een standaard wordt de werkgroep opgeheven. Als er commentaar komt op een gepubliceerde standaard kijken de W3C leden of er noodzaak is een nieuwe versie te ontwikkelen en zonodig (en als de leden hier animo voor hebben) wordt er een nieuwe werkgroep opgericht.
  • Bart zal een nieuwsstroom opzetten voor geinteresseerden in ontwikkelingen in W3C gerelateerd aan de Data activity. Daar zitten de aan linked data gerelateerde zaken. Hier was interesse voor vanuit PLDNPlatform Linked Data Nederland (PLDN).

Geo op het web

  • Bart, Linda en Frans zitten in de Spatial Data on the Web werkgroep. Dus goede vertegenwoordiging vanuit PLDNPlatform Linked Data Nederland (PLDN).
  • Use cases en requirements voor dit onderwerp zijn verzameld in een working draft: http://www.w3.org/TR/sdw-ucr/ Hier wordt commentaar op gevraagd. Zijn de requirements compleet?
  • Nu is de werkgroep bezig met een Best Practices document http://w3c.github.io/sdw/bp/. De eerste working draft wordt binnenkort verwacht.
  • Linda is editor van dit document.
  • Het doel van dit document is om op een leesbare manier aan zowel geo-ict experts als web developers uit te leggen hoe je het beste geodata op het web kan publiceren, in lijn met de algemene webstandaarden.
  • Ook op dit document is commentaar altijd welkom. Op 10 februari zal de werkgroep in Nederland bijeen komen parallel met een PLDN sessie en een open werkgroep sessie houden. PLDN leden worden uitgenodigd hierbij te zijn om hun feedback op de best practice te geven en toe te lichten.
  • Nic Roest geeft aan behoefte te hebben aan een nieuwe property die aangeeft dat twee resources over dezelfde plaats gaan (samePlaceAs) of dat een resource een (kaart)representatie is van een ding in de werkelijkheid.

Linksets

  • Is een mechanisme om de verbinding te leggen tussen twee datasets op objectniveau. Het kan mogelijk de vraag beantwoorden: wie zegt iets over mijn object?. En het maakt ook mogelijk dat een derde partij de links tussen 2 sets legt.


Sessie - Inference Engines en Linked Data (Erwin Folmer)


Uitgangssituatie en ambitie:

  • Bij het Kadaster is er een grote bak met Linked Data beschikbaar, maar hoe kunnen we het maximale uit deze bak met Linked Data halen?


Mogelijke volgende stap:

  • Kennistechnologie (inference engines) toepassen met Linked Data om zo vragen beantwoord te kunnen krijgen, Ja/Nee vragen en vragen die antwoorden geven met een bepaalde waarschijnlijkheid, maar ook om nieuwe feiten af te kunnen leiden die je voorheen nog niet wist door (redeneer)regels toe te passen op een bak met feiten (verrast worden met nieuwe inzichten).


Vragen als:

  • Waar mogen windmolens geplaatst worden in Nederland? gegeven:
    • de wet en regelgeving die van toepassing is op deze vraag;
    • gegeven de geografische locatieZie ook Geo locatie. van (groepen van) kadastrale objecten en hun ‘functie’ (zoals woonwijken, etc.)
  • Mogen er zonnecollectoren geplaatst worden op een gebouw met een bijzonder functie (zoals een monument) en zo ja, waar mogen deze zonnecollectoren dan geplaatst worden? (aan de voorkant niet, maar aan de achterkant mogelijk wel), gegeven:
    • de wet en regelgeving die van toepassing is op deze vraag;
    • de kenmerken van een gebouw en zijn directe omgeving die relevant zijn voor het beantwoorden van deze vraag (vorm, afmetingen, functie, voorkant, achterkant, etc.)


Uitdagingen:

  • Wetgeving (omgevingswet en andere wetten die op hetzelfde object betrekking hebben, maar dan vanuit een andere invalshoek) heeft een aantal eigenschappen die het moeilijk maken om wetgeving te vertalen naar goede regelsets:
    • Complexiteit
    • Afhankelijkheden
    • Fouten (onjuistheden)
    • Inconsistenties (tegenstrijdigheden)
    • Behapbare voorbeelden niet/moeilijk te vinden
    • Wetgeving kan niet zo maar aangepast worden om zo makkelijker goede regelsets te kunnen definieren
  • RedenerenDoor middel van reasoning, redeneren met data (feiten) en regels, probeer je nieuwe feiten te achterhalen met de verzameling feiten en regels die je op een bepaald moment hebt. Met OWL en RDF Schema kun je redeneren, maar dat heeft zijn beperkingen. Binnen de PLDN community is er interesse in SHACL en SPIN om te bekijken in hoeverre deze de beperkingen van OWL en RDFS kunnen oplossen. met onzekerheid (en/of met onvolledige informatie)
    • De meeste voorbeelden gaan uit van een closed world assumption en van vragen waar je een Ja/Nee antwoord op kan krijgen, zoals
      • Krijg ik een vergunning voor het plaatsen van een dakkapel gegeven de relevante kenmerken van de situatie van mijn huis voor het beantwoorden van deze vraag
    • De vragen die binnen een open world assumption gesteld worden zijn (nog) complexer om op te lossen, vragen:
      • Waar je geen Ja/Nee antwoord op krijgt, maar waar je het antwoord Misschien op kan krijgen
      • Waar je met een bepaalde waarschijnlijkheid aangeeft welke antwoordoptie met meest waarschijnlijk is en hoe de verdeling is ten opzichte van de andere opties


Oplossingsrichtingen, standaarden en mogelijke tooling

  • Standaarden, reccommendations en onderzoek binnen communities:
    • OWLDe Web Ontology Language (OWL) is de standaard van W3C voor het definiëren van ontologieën voor het wereldwijd web. Deze ontologieën worden door de formele semantiek gekenmerkt, gebaseerd op de standaard RDF voor objecten van W3C. (basic reasoningDoor middel van reasoning, redeneren met data (feiten) en regels, probeer je nieuwe feiten te achterhalen met de verzameling feiten en regels die je op een bepaald moment hebt. Met OWL en RDF Schema kun je redeneren, maar dat heeft zijn beperkingen. Binnen de PLDN community is er interesse in SHACL en SPIN om te bekijken in hoeverre deze de beperkingen van OWL en RDFS kunnen oplossen. with OWLDe Web Ontology Language (OWL) is de standaard van W3C voor het definiëren van ontologieën voor het wereldwijd web. Deze ontologieën worden door de formele semantiek gekenmerkt, gebaseerd op de standaard RDF voor objecten van W3C.)
    • SPIN (SPARQL Inferencing Notation)
    • Data shapes en Shacl (Shapes Constraints Language)


  • Bevindingen en inzichten tot nu toe:
    • OWLDe Web Ontology Language (OWL) is de standaard van W3C voor het definiëren van ontologieën voor het wereldwijd web. Deze ontologieën worden door de formele semantiek gekenmerkt, gebaseerd op de standaard RDF voor objecten van W3C. is te beperkt om goed te kunnen redeneren en kan niet redeneren over meerdere vocabulaires heen. Dan zou je een overkoepelende vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. moeten maken die de combinatie van die vocabulaires omvat.
    • SPIN en Shacl lijken kansrijker als oplossingsrichting in combinatie met tools als TopBraid Composer en Allegrograph.
    • Daarnaast is het redeneren met data vaak makkelijker op het niveau van beleids-vraagstukken dan bij vragen die rekening moeten houden met de regels zoals die in diverse wetten zijn beschreven.


  • Tooling
    • TopBraid Composer (met SPIN en Shacl)
    • Allegrograph (met een inference engine en SPIN)
    • Rules engines? DROOLS, JRules, …
    • Maatwerk? Bijv. JAVA applicatie


Opvallend is, dat men in een aantal situaties toch kiest voor een maatwerk-applicatie, omdat rules engines de complexiteit en afhankelijkheden die er in de wetgeving zitten niet goed aankunnen. En als men dan toch met een rules engine zou willen werken dan zou deze uitgebreid moeten worden met maatwerk om toch met die complexiteit en afhankelijkheden om te kunnen gaan. In dat geval kiest men dan toch voor een volledige maatwerkoplossing.

Architectuurplaatje

Er zijn al eerder een aantal architectuurplaatjes gemaakt om dit vraagstuk in kaart te brengen. Tijdens deze werksessie is de volgende plaat getekend.

20151202 124029 LD Sessie IE.jpg

Links met interessante informatie:


Vervolgstappen:

  • Goede use case definieren (actie: Erwin)
  • Tenminste 1 Conceptual Friday in januari 2016 organiseren om dit verder te bespreken (actie: Erwin)

Sessie - DEMO en Linked Data interface / GUI (Richard Nagelmaker en Jeroen van Beele)


Hoe kun je een goede user interface maken om gebruikers informatie te laten ontdekken, waarbij de onderliggende data linked is? Richard heeft dit gedaan met de Knowledge DivinerA new view on data interaction as a reference point for data-driven architecture. Developed by Richard Nagelmaeker., en vraagt zich af hoe je gebruikers nog meer met linked data kunt laten interacteren. Feedback:

  • De gebruiker denkt niet in triples dus die moet je niet in je UI laten terugkomen.
  • De verbanden tussen de begrippen laten zien, zodat de gebruiker hints heeft welke begrippen hij kan combineren.
  • Visualiseren op een kaart geeft veel inzichten.


DEMO is ontwikkeld aan de TU Delft en is een manier op organisaties te modelleren. Als je dit naar semantic web vertaalt kun je daarmee dus processen in Linked Data beschrijven. Resources, kennis, arbeid delen we wel al op het web, planningen en doelen nog niet. Dit gat wil de DEMO op het Semantisch Web werkgroep invullen.

Er is een nieuwe werkgroep opgericht die zich erop richt DEMO naar het semantisch web te brengen. Deelnemers: Jeroen van Beele, Nic Roest, Pano Maria. Tijdens de sessie sluit Thies Mesdag zich aan. Wellicht Richard ook.


Sessie - ODINE project van Netage (Bart van Leeuwen)


Bart legt uit hoe het proces werkt om voor deze EU funding in aanmerking te komen.

  • Voor kleine en middelgrote bedrijven. ZZPer kan ook.
  • Het idee moet nieuw zijn, open data gebruiken of maken, en er moet een business idee achter zitten hoe je er geld mee gaat verdienen.
  • Je mag er een commercieel product mee maken.


Voorbeelden:


Sessie - Living Lab voor open innovatiePlatform Linked Data Nederland (PLDN) is een open innovatie platform wat betekent dat iedereen aan dit innovatie platform mee mag doen en dat deelnemers vanuit de overheid, het bedrijfsleven en het onderwijs met eindgebruikers samenwerken om innovatievraagstukken rondom Linked Data samen met elkaar op de lossen. Vaak wordt daarbij begonnen met een thema en werkt men naar een toepassing om de opgedane nieuwe inzichten in de praktijk te gebruiken en te toetsen. met Linked Data bij Bibliotheken (Koen Baaij)


De bibliotheken gaan digitaal en gaan zich minder op uitleenfaciliteit focussen, meer op informatiemakelaarschap. In een living lab willen ze de weg hiernaar ontdekken. In het living lab kunnen gebruikers, ontwikkelaars, etc idee creatie gaan doen. Het doel is: op een aantrekkelijke en bruikbare manier informatie naar burgers brengen.

Koen vraagt tips over het tot een succes maken van een living lab. Uit de groep kwam o.a.:

  • Zorg voor een goede samenstelling van de community, bv vertegenwoordiging uit bedrijfsleven, wetenschap, overheid, gebruikers, ontwikkelaars.
  • Zorg ervoor dat je ontwikkelaars ook mee krijgt, daarvoor moet je wellicht weer een andere taal spreken.
  • Zorg voor aansprekende databronnen
  • Zorg dat je vertegenwoordigers van je doelgroepen in je community krijgt.
  • Run de community op een open manier: bijeenkomsten open voor iedereen, resultaten open publiceren, zorg voor wiki of andere digitale samenwerkingsvormen, enz.
  • Denk ook na over wat de band met PLDN kan zijn. PLDN is ook een soort living lab; misschien kan het een subcommunity van PLDN worden?


Begin komend jaar gaat het living lab van start.

Presentatie - Linked data bij het Kadaster (Peter Lentjes, Erwin Folmer, Marco Brattinga, Dimitri van Hees en Rein van 't Veer)


Presentatie: Kadaster Data Platform, GRID Experiment 1: (Linked) Data Platform voor Proeftuin Omgevingswet

Er wordt geexperimenteerd met het beschikbaar stellen van data uit PDOKPublieke Dienstverlening Op de Kaart (PDOK) als linked dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat..

Er is een developerslijn waarbij vanuit PDOKPublieke Dienstverlening Op de Kaart (PDOK) WFS services (web services voor geodata) APIs worden gegenereerd.

En er is een semantische lijn waarbij vanuit de semantiek van de brondata linked data wordt gegenereerd. Er is een ‘linked data theatre’ opgezet waar je de linked data op verschillende manieren kan benaderen, o.a. kan de gebruiker door de data heen browsen.

Ook is de BRT voor een deel van Nederland, rondom Leiden, als linked data gepubliceerd. http://brt.kadaster.nl.

Conclusie


Feedback op de unconference vorm was positief. Het is voor herhaling vatbaar!

Aankondiging


2 December is een Platform Linked Data bijeenkomst die jullie maken! Onder begeleiding van Bart van Leeuwen houden we die dag een Unconference sessie. Het grootste deel van de dag is er geen programma want dat gaan we samen maken. Is er iets dat je altijd al had willen bespreken maar je nog nooit als een sessie durfde in te dienen? Meld het in een 2 minuten pitch aan het begin van de dag! Heb je niets bedacht, maar word je getriggerd door een pitch? Sta op en geef er zelf ook één. Op basis van de pitches vullen we de dag, tot 3 uur ’s middags, in met breakout sessies. Heb je 10 dingen bedacht, dan sluit je 10 maal achter in de rij aan om 10 maal een pitch te gegeven.

Aan het einde van de pitch ronde gaan we samen een planning maken:

  • welke zaken lijken op elkaar en kunnen samen in een sessie?
  • welke onderwerpen krijgen toch niet de ondersteuning van het grote publiek ?
  • welke onderwerpen mogen absoluut niet gelijktijdig behandeld worden ?


We pakken een bak koffie en gaan aan de slag. Tot 3 uur wordt de dag gevuld met breakout sessies. Van 3 tot 5 sluiten we af met een informatief blok over de vorderingen rondom Linked Data bij het Kadaster.

De inhoud van de breakout sessies mag van alles zijn als het maar over Linked Data gaat, echter het is niet de bedoeling dat je zelf voor de volle duur van de sessie gaat praten! Als je wilt mag je snel wat presenteren, slides, filmpje, tekening alles mag, maar het hoeft niet, zitten en je verhaal doen is ook goed! Er zijn wat simpele regels:

  • De pitcher praat maximaal 10 minuten
  • Er is iemand die e.a. vast legt
  • Interesseert het onderwerp je toch niet, dan sta je op en loop je naar een andere sessie.
  • De opstelling moet uitnodigen tot interactie
  • Interactie is een must, samen maken we de inhoud!


Kan je nu niets bedenken waar je het over wilt hebben? kom langs en laat je inspireren door de zaken die op dat moment voorbij komen, en draag bij met je vragen, ideeën en ervaring!

Tot 2 December!

Nuttige links