Once you have a schema that you are satisfied with, the next step is to convert the source data into a Linked Data representation or serialization. In this step the data is converted to RDF triples and while applying the naming scheme defined in Step 4. The Resource Description Framework (RDF) is used as a general method for conceptual description or modeling of information that is implemented in web resources, using a variety of syntax notations and data serialization formats. It is similar to classic conceptual modeling approaches such as entity–relationship or class diagrams, as it is based upon the idea of making statements about resources (in particular web resources) in the form of subject-predicate-object expressions. These expressions are known as triples in RDF terminology. The subject denotes the resource, and the predicate denotes traits or aspects of the resource and expresses a relationship between the subject and the object. RDF triples may be stored in a type of database called a triplestore.
Before converting your data to RDF you need to decide how you want to publish the data. Do you want to publish the data as a webservice that can be queried? Following, you need to make sure that your data is in the right format. We advise that you do not chose one single serialization but multiple. Potential serializations for RDF are turtle (human readable), RDF/XML, N3, RDFa (in HTML), and the lately becoming very popular JSON-LD (for JavaScript Developers).
You might decide to first make your data online available via a webservice (API) so developers can easily access your data and test its usability. This can provide you with valuable feedback about the potential value of your data before you engage in the investment to convert your data to RDF.
Conversion approaches fall into three categories:
There are different tools that can be used to do this conversion:
The Simile project made an attempt in proving a directory of tools for converting various data formats into RDF. A similar list can be found by W3C. A tutorial on converting relational data into RDF format is provided by Oracle. For an easy approach to transform spreadsheets to rdf, have a look at one of the books published by the PiLOD project containing a step by step approach based on the Open Refine tool, including screenshots of the tool. If you are interested in expressing customized mappings from relational databases to RDF datasets you should check out the R2RML language.
Once you have converted your data to RDF the next step is to make sure that you have some governance structure in place to maintain and manage your data.
Weergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat
Weergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat
Resource Description Framework (RDF) is een standaardmodel voor gegevensuitwisseling op het web. RDF heeft functies die het samenvoegen van gegevens vergemakkelijken, zelfs als de onderliggende schema's verschillen, en het ondersteunt specifiek de evolutie van schema's in de loop van de tijd zonder dat alle gegevensgebruikers moeten worden gewijzigd.
Weergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat
Weergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat
Resource Desciption Format for Attributes (RDFa) is een micro-formaat, waarmee attribuut tags aan tekst strings in HTML kunnen worden toegevoegd. Deze attribuut tags kunnen als gestructureerde data worden herkend en verwerkt door machines.
HyperText Markup Language (HTML).
JSON (JavaScript Object Notation) is een lichtgewicht data-uitwisselingsformaat. Het is gemakkelijk voor mensen om te lezen en te schrijven. Machines kunnen gemakkelijk worden ontleed en gegenereerd. Het is gebaseerd op een subset van de JavaScript-programmeertaal,
JavaScript is a high-level, dynamic, untyped, and interpreted programming language. It has been standardized in the ECMAScript language specification.7 Alongside HTML and CSS, it is one of the three essential technologies of World Wide Web content production; the majority of websites employ it and it is supported by all modern Web browsers without plug-ins. JavaScript is prototype-based with first-class functions, making it a multi-paradigm language, supporting object-oriented, imperative, and functional programming styles. It has an API for working with text, arrays, dates and regular expressions, but does not include any I/O, such as networking, storage, or graphics facilities, relying for these upon the host environment in which it is embedded.
Een application programming interface (API) is een verzameling definities op basis waarvan een computerprogramma kan communiceren met een ander programma of onderdeel (meestal in de vorm van bibliotheken). Vaak vormen API's de scheiding tussen verschillende lagen van abstractie, zodat applicaties op een hoog niveau van abstractie kunnen werken en het minder abstracte werk uitbesteden aan andere programma's. Hierdoor hoeft bijvoorbeeld een tekenprogramma niet te weten hoe het de printer moet aansturen, maar roept het daarvoor een gespecialiseerd stuk software aan in een bibliotheek, via een afdruk-API.
Een gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder.
De activiteiten van Platform Linked Data Nederland (PLDN) worden mede mogelijk gemaakt dankzij het Kadaster, TNO, Big Data Value Center (BDVC), ECP, Forum Standaardisatie, Kennisnet, SLO, Waternet, Taxonic, MarkLogic, Triply, Franz Inc., SemmTech, Rijksdienst voor het Cultureel Erfgoed (RCE), Beeld en Geluid, EuroSDR, de KVK en ArchiXL
Wilt u op de hoogte gehouden worden van nieuws en ontwikkelingen binnen PLDN?
Schrijf u dan in voor de nieuwsbrief