In this step we create a vocabulary that describes the dataset.
The starting point for this step is the documentation of the database. Part of the documentation is presented in the table below. This gives us an idea about the meaning of the data and is our starting point for a conceptual model of the data.
Variabele/veld | Mogelijke waarden | Toelichting |
---|---|---|
[A.07] Postcode | 4 cijfers 2 letters | Twee kolommen: van en naar |
[A.10] Straatnaam | Naam | Bij verschillende postcodes bij “van” en” naar”: de straatnaam van de eerste postcode |
[A.11] Woonplaats | Naam | Naam van de woonplaats |
[A.17] Productsoort | ELK of GAS | De energiesoort waarover het SJV gegeven wordt: ELK= elektriciteit, GAS = aardgas |
Aantal aansluitingen | getal | Het aantal aansluitingen in het betreffende postcodegebied voor het betreffende product. |
[A.33] SJV | kWh of m3 | Gemiddeld Standaardjaarverbruik, waarbij voor aansluitingen met een normaal én laagtarief SJV het totale SJV wordt meegenomen in de middeling, zonder decimalen. Het standaardjaarverbruik is het verwachte jaarverbruik van een afnemer op een netaansluiting bij gestandaardiseerde condities en op basis van een genormaliseerd jaar. Wanneer een aansluiting uit bedrijf is blijft het laatste SJV staan tot het moment waarop de aansluiting weer in bedrijf genomen wordt. |
[A.34] SJV laag tarief | % | Percentage van de aansluitingen dat een laagtarief SJV heeft, oftewel een dag/nachttarief geactiveerd heeft. |
[M.102] Type meter | % | Percentage slimme meters. Het betreft alle typen slimme meters, zowel de op afstand schakelbare als de niet op afstand schakelbare meters (resp codes DUS en DUN) |
[M.115] Aantal telwielen | getal | Gemiddeld aantal telwielen van de meters |
We identify the following concepts:
The figure below shows how these concepts, their properties and relations could be modelled as an ontology.
In this case we have opted to create our own basic ontology for this dataset. This has the advantage that it can be created to closely match the structure of the dataset, and that it does not require knowledge of other external ontologies (faster time to publication). The disadvantage is that the data is less accessible, because it is unlikely that data consumers will be familiar with this ontology. That is the reason why best practice prescribes to reuse existing vocabularies as much as possible to model your data. The nice thing about the Semantic Web, however, is that such links to other ontologies can always be added at a later stage as we will show later in Step 9 (linking the data).
De activiteiten van Platform Linked Data Nederland (PLDN) worden mede mogelijk gemaakt dankzij het Kadaster, TNO, Big Data Value Center (BDVC), ECP, Forum Standaardisatie, Kennisnet, SLO, Waternet, Taxonic, MarkLogic, Triply, Franz Inc., SemmTech, Rijksdienst voor het Cultureel Erfgoed (RCE), Beeld en Geluid, EuroSDR, de KVK en ArchiXL
Wilt u op de hoogte gehouden worden van nieuws en ontwikkelingen binnen PLDN?
Schrijf u dan in voor de nieuwsbrief