Boek 5/Ontwikkeling: LOD Laundromat

< Boek 5

Het gebruik van Linked Data kost normaal gesproken veel tijd en vraagt de nodige inspanning. Linked Data is in de praktijk lastig vindbaar, van suboptimale kwaliteit, en niet eenvoudig opvraagbaar. Om deze problemen op te lossen is een ‘wasserette’ voor Linked Data gebouwd: de LOD Laundromat (1ste prijs Beste Linked Data Toepassing 2015; 3de prijs European Linked Data Awards 2015).

De LOD Laundromat zoekt op het internet naar Linked Open Data-bronnen. De meeste bronnen bevatten ‘vlekken’, zoals syntaxfouten, dubbele voorkomens of incorrecte waardes. De Laundromat wast deze vlekken schoon. Wat overblijft is standaardconforme Linked Data, die je zo van de ‘waslijn’ kunt plukken.

Om dit te realiseren maakt de LOD Laundromat gebruik van de laatste technologische ontwikkelingen op het gebied van data crawling, streaming, parsing, opslag en querying. De Laundromat publiceert alle gegevens in open en gestandaardiseerde formaten die voor lokaal gebruik kunnen worden gedownload. Daarnaast biedt zij ook webservices aan, waarmee de data direct online bevraagd kan worden.

Op dit moment bevat de LOD Laundromat honderd­duizenden datasets en tientallen miljarden triples. De Laundromat wordt door duizenden ontwikkelaars op het gebied van Linked Data gebruikt. Maandelijks worden miljoenen documenten gedownload en tientallen miljoenen queries afgehandeld.

De LOD Laundromat neemt niet alleen werk uit handen bij het zoeken en vinden van Linked Data, maar helpt ontwikkelaars ook om hun data zelf beter beschikbaar te stellen. Zo worden de niet­standaardconforme eigenschappen van iedere dataset in metadata opgeschreven en is het mogelijk om schoongewassen tussenversies van de data voor eigen gebruik te downloaden.

LOD Laundromat is een ideaal raamwerk om groot­schalige Linked Data-toepassingen op te bouwen. Eén zo’n toepassing is LOD Lab, een methode om grootschalige evaluaties over de gehele LOD Cloud uit te voeren (Best Paper Award ISWC 2015). Een andere toepassing is LOD Search (2de prijs European Linked Data Awards 2016). LOD Search is een grootschalige semantische zoekmachine die gebruikers in staat stelt om op eenvoudige wijze naar Linked Data-bronnen te zoeken. De verwachting is dat in de nabije toekomst meer grootschalige toepassingen op basis van de LOD Laundromat gebouwd zullen worden.