Boek 5/Case: NXP & SEMAKU

< Boek 5

NXP biedt meer dan twintigduizend producten aan met een breed scala aan functies en technologieën. Informatie over elk van deze producten wordt in diverse interne systemen opgeslagen en beheerd. Hoe zorg je er dan voor dat informatie in alle verschillende systemen wordt bijgewerkt? NXP lost het op met Linked Data.

Informatie over producten wordt op verschillende manieren en via meerdere kanalen intern en naar de klant gecommuniceerd: bijvoorbeeld via internet, mobiel en print. Hierdoor raken data verspreid en wordt informatie gedupliceerd in meerdere applicaties en databases. Dit leidt ertoe dat mensen niet kunnen vinden wat ze zoeken of tegenstrijdige informatie vinden. De Enterprise Data Hub, een data-integratietechnologie, zorgt ervoor dat data uit verschillende databases geïntegreerd kunnen worden via Linked Dataprincipes en standaard webtechnologieën. Dankzij ‘shared identifiers’ kunnen gebruikers bijvoorbeeld data over de elektrische eigenschappen van een product samenvoegen, met gegevens over de levenscyclus van het product.

De NXP Enterprise Datahub haalt data op uit bron­systemen, transformeert deze naar RDF en laadt ze vervolgens in de RDF Graph Database, van waaruit ze conform Linked Data-principes worden gepubliceerd.

De brondata bestaan uit diverse XML- en CSV-formaten en kennen verschillende updatefrequenties. In het eenvoudigste geval kunnen data automatisch worden opgehaald. In andere gevallen worden berichten verspreid via de Enterprise Service Bus (ESB) en wordt de transformatie in het kanaal geïmplementeerd. Van XML-bronnen wordt de data naar RDF (RDF/XML of Trix) getransformeerd, gebruikmakend van XSLT of XQuery. Voor CSV-bronnen wordt de CSV naar een Java-object gebracht, vervolgens naar XML, gevolgd door XSLT.

Om te voorkomen dat interne data per ongeluk publiek toegankelijk worden, zijn strikte filtermechanismen opgezet. Deze filteren de openbare subsets uit interne data. Dit gebeurt met behulp van SPARQL 1.1 Federated Query, samen met SPARQL 1.1 Update, waar de ‘business rules’ worden gevangen in SPARQLlanguage. Waar mogelijk heeft NXP gebruikgemaakt van bestaande standaard vocabulaires als Dublin Core, SKOS, FOAF en Schema.org. Omdat er een aantal voor de sector benodigde termen en concepten ontbraken, is ook een NXP-vocabulaire ontwikkeld met mappings (zoals rdfs:subClassOf) naar externe vocabulaires. Zo zijn er voldoende mogelijkheden om de data te beschrijven en kunnen externe gebruikers de betekenis van begrippen gemakkelijker nagaan.