Verslag Linking Geospatial Data

De standaardenorganisaties W3C en OGC hielden op 5 en 6 maart een gezamenlijke workshop in Londen getiteld “Linking geospatial dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat”. De goedbezochte workshop werd gehost door Google. Nederland was met vijf bezoekers, waarvan er drie presentaties gaven en ikzelf als voorzitter optrad van een sessie, goed vertegenwoordigd in dit diverse veld van geo-wetenschappers en geo-veteranen uit de publieke sectorEen sector is een deel van de economie. Het is een benaming voor alle bedrijven samen die actief zijn in een bepaalde categorie producten of diensten., tot web specialisten en mensen die zich al 15 jaar met linked data bezig houden.

Met ruim 100 deelnemers die stuk voor stuk interessante dingen te melden hadden, was het onmogelijk om iedereen uitgebreid te laten vertellen. De presentaties werden dan ook streng getimed op 10 danwel 5 minuten.Vooral de 5 minuten durende ‘lightning talks’ waren soms zo gecomprimeerd dat ze weinig informatief waren, hoewel anderen toch wel hun boodschap wisten over te dragen. Er was wel ruim tijd voor vragen zodat op interessante aspecten kon worden doorgevraagd. En heel belangrijk waren de koffie, lunch en theepauzes waarin iedereen uitgebreid aan de praat kon raken met elkaar.

Terwijl de eerste dag nog vooral overweldigend was, begon zich op de tweede dag een richting te manifesteren. De tendens was dat men niet veel nieuwe standaarden wil, maar wel dat een keuze voor één geovocabulaire en die te standaardiseren, zeer wenselijk is. Er zijn wat aspecten van bestaande standaarden die geadresseerd zouden moeten worden. Veel genoemd werd bijvoorbeeld de geometrie encoding van GeoSPARQLGeoSPARQL is zowel een beknopte ontologie voor geo-informatie als een uitbreiding op SPARQL met functionaliteit voor ruimtelijke vragen (in de buurt van, overlapt met, etc). GeoSPARQL is gestandaardiseerd bij het Open Geospatial Consortium. waar de verwijzing naar het gebruikte CRS verweven zit met de coordinaten zelf in één veld en niet gemakkelijk op te halen is. Een opvallend probleem was dat het voor gebruikers, gegevenWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat geo-data in een bepaald coordinatensysteem, heel moeilijk te achterhalen is wat eerst komt: de lon of de lat. En als je dat niet weet is de data niet te gebruiken. GeoJSON kwam, onder andere door de bevlogen pitch van PiLOD-er Rein van ’t Veer, naar voren als een interessante mogelijkheid om geo-data naar het web te brengen. W3C ziet mogelijkheden om dit community formaat te gaan standaardiseren. Wellicht worden andere vocabulaires, zoals SSN voor sensordata en de Time ontology, ook gestandaardiseerd. Verder is het volgens veel aanwezigen vooral een kwestie van de standaarden beter ondersteunen met cookbooks en best practices en voldoende goede implementaties. Andere zaken die genoemd werden waren een manier om de complexe aspecten van een dataset, zoals metadata per coordinatenpaar (denk aan de beruchte plaatsbepalingspunten van de BGTBasisregistratie Grootschalige Topografie (BGT).), weg te houden bij de meeste gebruikers en alleen uit te leveren aan de expertgebruikers die dat wel willen. Ook kan er gekeken worden naar standaardisatie van een compressietechniek voor geometrieën, die immers behoorlijk groot kunnen zijn.

Onze mannen van de PiLOD hielden mooie presentaties. Rein was de enige met een live demo, en die gedroeg zich voorbeeldig. Hij liet een prototype website zien met archeologische dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat, die we in de PiLOD gaan combineren met grondwaterstanden (peilbuisdata). Frans Knibbe kreeg de hele zaal aan het lachen met zijn prachtige slides over ‘miss Globe’ en ‘mister Cube’, hun wederzijdse aantrekkingskracht, en de hobbels die zij tegenkomen op weg naar een lang en gelukkig leven. Bert Spaan had zeer mooie slides die zijn verhaal over de CitySDKThe CitySDK Linked Data API is a linked data distribution platform. Developed by Waag Society, the distribution API is a component of the CitySDK toolkit. This toolkit supports the development of open and interoperable interfaces for open data and city services in eight European cities (Amsterdam, Helsinki, Manchester, Lisbon, Istanbul, Lamia, Rome and Barcelona). The CitySDK Linked Open Data Distribution API enables the distribution and linking of open data sets and city services. This website explains the distribution API. For a comprehensive overview of the complete CitySDK toolkit have a look at the CitySDK project homepage. illustreerden.

De tweedaagse eindigde met een serie ‘bar camp talks’. Een leuk format waarbij wie dat maar wil in één minuut een idee kan pitchen. Na alle pitches kon iedereen diegene opzoeken waar hij/zij graag mee verder zou willen praten. Zo vormden zich groepjes van maximaal 10 personen waar men wat meer de diepte in kon gaan.

Phil Archer van W3C sloot de dag af met een aantal conclusies. De W3C en OGC gaan een gezamenlijke werkgroep oprichten die die zich in ieder geval zal buigen over de standaardisatie van een geovocabulaire, en mogelijk ook over standaardisatie van GeoJSON en andere zaken die naar voren kwamen. Het resultaat zal een zowel door W3C als OGC gesteunde standaard zijn.

Meer opgemerkte punten:

  • Kerry Taylor (van CSIRO, uit Australië, collega van Simon Cox) waarschuwde dat automatisch genereren van OWLDe Web Ontology Language (OWL) is de standaard van W3C voor het definiëren van ontologieën voor het wereldwijd web. Deze ontologieën worden door de formele semantiek gekenmerkt, gebaseerd op de standaard RDF voor objecten van W3C. uit UML geen goed idee is. Ze hebben het gedaan met water standaarden maar het resultaat was een overgecompliceerde, niet door reasoners bruikbare, en slecht te onderhouden ontologie (en onderhoudbaarheid is juist het doel van MDA). Te veel handmatig werk nodig, begreep ik er uit.
  • Er waren vrij veel presentaties uit de hoek van sensoren. Bijvoorbeeld een interessante presentatie uit de oceanografie, waar ze onderwaterrobots hebben met sensoren die hun data meteen in OGC standaarden teruggeven inclusief semantiek. Was een leuke spreker. Slideshare.net/adamleadbetter
  • Ook een hele leuke over sensoren op fietsen die de nabijheid van andere voertuigen meten en zo informatie opleveren over waar het gevaarlijk is voor fietsers.
  • SSN is een veel genoemde bestaande vocabulaireEen vocabulaire is een verzameling herbruikbare modeleerconstructies in RDF, generiek of specifiek voor een bepaald domein, die gebruikt kunnen worden om Linked Data mee te beschrijven, modeleren en op te slaan en om Linked Data via het internet met elkaar te kunnen linken. voor linked sensor dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.
  • Er was vooral de eerste dag veel te horen over dat het moeilijk is om goede persistente URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke. te verzinnen vooral als je met versies te maken hebt. Maar Phil Archer merkte op dat de manier die W3C zelf hanteert goed werkt. Dus de vraag is of dat wel echt een probleem is. JRC ziet wel issues.
  • Een interessante vraag was: gaat Google GeoJSON indexeren? JSON schijnt moeilijk te indexeren te zijn, omdat er geen semantiek in zit, maar JSON-LDLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires). zou dit op kunnen lossen. Het zou erg mooi zijn als geo-data op het web door Google geïndexeerd wordt!
  • Er werd een samen met IGN ontwikkeld CRS transformatie service gedemonstreerd. En een CRS register.
  • Leukste quote: If you are a web developer, ajax is not a cleaning product; if you are a geospatial developer a polygon is not a dead parrot.