Boek 5/Thema: Semantic Data in de agrisector

< Boek 5

In de afgelopen jaren heeft TNO diepgaande kennis opgebouwd op het gebied van Linked (Open) Data en standaardisatie van datauitwisseling. Zo heeft het bijvoorbeeld, in het kader van het Smart Dairy Farming-project, bijgedragen aan het koppelen van verschillende databronnen binnen de melkveesector die nu als Linked Data bevraagd kunnen worden.

De Nederlandse melkveesector bestaat uit meer dan vijftienduizend bedrijven, waar in totaal meer dan anderhalf miljoen melkkoeien gehouden worden. Binnen de melkveesector wordt veel data verzameld. Deze data bevat een grote hoeveelheid informatie, waarmee het mogelijk is om de kwaliteit van leven van de koeien te verhogen. Zo kunnen, wanneer er op een juiste manier naar de data gekeken wordt, ziektebeelden eerder ontdekt en behandeld worden. Ook is het mogelijk om factoren te identificeren die invloed hebben op de kwaliteit en de kwantiteit van de melkgift van de koeien.

In de huidige situatie wordt al deze data niet voldoen­de benut. Het is voor de individuele veehouder niet rendabel om de data op het niveau van het individuele dier te analyseren. Toch bleek er vanuit de veeteelt­sector wel behoefte aan een dergelijk systeem waarbij melkveehouders de data aanleveren, en vanuit dat systeem werkinstructies ontvangen op het niveau van het individuele dier. In het kader van het Smart Dairy Farming-project is zo’n systeem ontwikkeld. Binnen dit project deden zeven melkveehouders mee, die voor dit project data beschikbaar hebben gesteld. Zij hebben meegedacht over de beoogde functionaliteit van de applicatie. Werkinstructies op het niveau van het individuele dier komen niet alleen het dierenwelzijn ten goede, maar ook de kosteneffectiviteit van het veeteeltbedrijf.

Een andere uitkomst van het meedenken was dat de veeteelthouder het belangrijk vindt dat hij de regie over zijn data heeft én blijft houden.

Infobroker[bewerken]

Om aan deze eisen te voldoen, is gekozen voor de ontwikkeling van een infobroker architectuur. Deze architectuur zorgt ervoor dat de data bij de veehouder blijft, waardoor hij de regie heeft en houdt over zijn eigen data. De veehouder zorgt voor de opslag van de data en kan zelf bepalen welke toegangsrestricties hij op deze data wil toepassen. Hij registreert deze databron bij de infobroker (of laat dit doen door een derde partij) en deze infobroker weet vervolgens welke data beschikbaar is. Deze data is vervolgens via de infobroker toegankelijk, door middel van een API.

Het idee is dat derde partijen diensten kunnen aanbie­den aan deze melkveehouders, door bijvoorbeeld de data te analyseren en werkinstructies aan te bieden. Een andere mogelijke toepassing is dat de veehouder zijn data verkoopt aan onderzoeksinstellingen. Dit maakt het voor die instellingen relatief eenvoudig om toegang te krijgen tot een grote hoeveelheid data, en maakt het voor de veehouder mogelijk te verdienen aan het beschikbaar stellen van zijn data.

Dit alles was het doel van het eerste deel van Smart Dairy Farming. Het tweede deel van Smart Dairy Farming had als doel om het aantal deelnemende veehouders te vergroten (van zeven naar circa zestig, met de mogelijkheid om op te schalen naar vijfentwintighonderd deelnemende partijen). Tevens was het wenselijk om meer sensoren aan te sluiten op de infobroker, en meer partijen te betrekken die analyses op deze data zouden kunnen uitvoeren. Een ander doel was het toevoegen van semantiek aan deze databronnen. Dit zou gerealiseerd kunnen worden door de data aan de hand van een OWL-ontologie te beschrijven en als Linked Data beschik­baar te stellen. De data zou dan rechtstreeks als RDF te benaderen moeten zijn, en bevraagbaar door middel van een SPARQL endpoint.

Tweetal ontologieën[bewerken]

Het ontsluiten en beschikbaar stellen van data als Linked (Open) Data gaat via een door TNO ontwikkeld stappenplan, dat de kwaliteit van de resulterende data waarborgt. Dit plan standaardiseert het proces van het omzetten van data naar Linked Data. Het plan is toegepast bij het omzetten van de door de infobroker beschikbaar gestelde data.

Voor deze toepassing is een tweetal ontologieën ontwikkeld. De eerste was een eenvoudige sensor/meting-ontologie, die de sensoren en gemeten waar­des beschrijft. Deze ontologie kan gebruikt worden om de ruwe sensor-metingdata te bevragen. Daar bovenop is een melkvee-ontologie ontwikkeld, die het eenvoudiger moet maken om de melkvee­specifieke vraagstukken te beantwoorden. Deze twee ontologieën zijn complementair aan elkaar. De melkvee-ontologie gebruikt concepten uit de sensor­metingontologie.

Na het doorlopen van het Linked Data-stappenplan is het mogelijk om de infobroker-data door middel van een SPARQL endpoint te bevragen. Het grote voordeel van het beschikbaar stellen van data als Linked Data, is dat deze data eenvoudig te koppelen is aan andere relevante databronnen. Zo is het nu bijvoorbeeld mogelijk om een vraag te beantwoorden die ook de publieke databron van het KNMI bevraagt. Daarmee worden weer- en klimaatdata gebruikt bij het beantwoorden van vragen over melkproductie en dierwelzijn.

TNO werkt ook aan de implementatie van een Linked Data Platform. Het is een platform waarin alle applicaties die nodig zijn bij het uitvoeren van het stappenplan, geïntegreerd zijn. Dit platform moet het proces van het transformeren naar en het koppelen met Linked Data ondersteunen en verder standaardiseren.

Jacco Spek (TNO)