Once you have a schema that you are satisfied with, the next step is to convert the source data into a Linked Data representation or serialization. In this step the data is converted to RDF triples and while applying the naming scheme defined in Step 4. The Resource Description Framework (RDF) is used as a general method for conceptual description or modeling of information that is implemented in web resources, using a variety of syntax notations and data serialization formats. It is similar to classic conceptual modeling approaches such as entity–relationship or class diagrams, as it is based upon the idea of making statements about resources (in particular web resources) in the form of subject-predicate-object expressions. These expressions are known as triples in RDF terminology. The subject denotes the resource, and the predicate denotes traits or aspects of the resource and expresses a relationship between the subject and the object. RDF triples may be stored in a type of database called a triplestore.
Before converting your data to RDF you need to decide how you want to publish the data. Do you want to publish the data as a webservice that can be queried? Following, you need to make sure that your data is in the right format. We advise that you do not chose one single serialization but multiple. Potential serializations for RDF are turtle (human readable), RDF/XML, N3, RDFa (in HTML), and the lately becoming very popular JSON-LD (for JavaScript Developers).
You might decide to first make your data online available via a webservice (API) so developers can easily access your data and test its usability. This can provide you with valuable feedback about the potential value of your data before you engage in the investment to convert your data to RDF.
Conversion approaches fall into three categories:
There are different tools that can be used to do this conversion:
The Simile project made an attempt in proving a directory of tools for converting various data formats into RDF. A similar list can be found by W3C. A tutorial on converting relational data into RDF format is provided by Oracle. For an easy approach to transform spreadsheets to rdf, have a look at one of the books published by the PiLOD project containing a step by step approach based on the Open Refine tool, including screenshots of the tool. If you are interested in expressing customized mappings from relational databases to RDF datasets you should check out the R2RML language.
Once you have converted your data to RDF the next step is to make sure that you have some governance structure in place to maintain and manage your data.
Resource Description Framework (RDF) is een standaardmodel voor gegevensuitwisseling op het web. RDF heeft functies die het samenvoegen van gegevens vergemakkelijken, zelfs als de onderliggende schema's verschillen, en het ondersteunt specifiek de evolutie van schema's in de loop van de tijd zonder dat alle gegevensgebruikers moeten worden gewijzigd.
Een application programming interface (API) is een verzameling definities op basis waarvan een computerprogramma kan communiceren met een ander programma of onderdeel (meestal in de vorm van bibliotheken). Vaak vormen API's de scheiding tussen verschillende lagen van abstractie, zodat applicaties op een hoog niveau van abstractie kunnen werken en het minder abstracte werk uitbesteden aan andere programma's. Hierdoor hoeft bijvoorbeeld een tekenprogramma niet te weten hoe het de printer moet aansturen, maar roept het daarvoor een gespecialiseerd stuk software aan in een bibliotheek, via een afdruk-API.
De activiteiten van Platform Linked Data Nederland (PLDN) worden mede mogelijk gemaakt dankzij het Kadaster, TNO, Big Data Value Center (BDVC), ECP, Forum Standaardisatie, Kennisnet, SLO, Waternet, Taxonic, MarkLogic, Triply, Franz Inc., SemmTech, Rijksdienst voor het Cultureel Erfgoed (RCE), Beeld en Geluid, EuroSDR, de KVK en ArchiXL
Wilt u op de hoogte gehouden worden van nieuws en ontwikkelingen binnen PLDN?
Schrijf u dan in voor de nieuwsbrief