Example Step 3: Model the data

In this step we create a vocabulary that describes the dataset.

The starting point for this step is the documentation of the database. Part of the documentation is presented in the table below. This gives us an idea about the meaning of the data and is our starting point for a conceptual model of the dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.

Variabele/veld Mogelijke waarden Toelichting
[A.07] Postcode 4 cijfers 2 letters Twee kolommen: van en naar
[A.10] Straatnaam Naam Bij verschillende postcodes bij “van” en” naar”: de straatnaam van de eerste postcode
[A.11] Woonplaats Naam Naam van de woonplaats
[A.17] Productsoort ELK of GAS De energiesoort waarover het SJV gegevenWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat wordt: ELK= elektriciteit, GAS = aardgas
Aantal aansluitingen getal Het aantal aansluitingen in het betreffende postcodegebied voor het betreffende product.
[A.33] SJV kWh of m3Machine-to-Machine Measurement (M3) Gemiddeld Standaardjaarverbruik, waarbij voor aansluitingen met een normaal én laagtarief SJV het totale SJV wordt meegenomen in de middeling, zonder decimalen. Het standaardjaarverbruik is het verwachte jaarverbruik van een afnemer op een netaansluiting bij gestandaardiseerde condities en op basis van een genormaliseerd jaar. Wanneer een aansluiting uit bedrijf is blijft het laatste SJV staan tot het moment waarop de aansluiting weer in bedrijf genomen wordt.
[A.34] SJV laag tarief % Percentage van de aansluitingen dat een laagtarief SJV heeft, oftewel een dag/nachttarief geactiveerd heeft.
[M.102] Type meter % Percentage slimme meters. Het betreft alle typen slimme meters, zowel de op afstand schakelbare als de niet op afstand schakelbare meters (resp codes DUS en DUN)
[M.115] Aantal telwielen getal Gemiddeld aantal telwielen van de meters

We identify the following concepts:

  • Usage Area: a geographical area defined by a range of consecutive postcodes in which energy is consumed and/or produced.
  • Usage Point: a (possibly virtual) connection point at which energy is transferred from the network to and from (a set of) energy prosumer(s).
  • Measurement: amount of energy consumption or production measured or predicted for a certain date/time interval in a certain unit of measure.
  • Product Kind: kind of energy product being delivered and consumed at a certain usage point. Currently either electricity or gas.

The figure below shows how these concepts, their propertiesAls in OWL properties of RDFS properties. and relations could be modelled as an ontology.

OntologyStep3.png

In this case we have opted to create our own basic ontology for this dataset. This has the advantage that it can be created to closely match the structure of the dataset, and that it does not require knowledge of other external ontologiesFormele definitie van de klassen, eigenschappen en relaties van een datastructuur en de bijbehorende constraints als een knowledge graph (faster time to publication). The disadvantage is that the data is less accessible, because it is unlikely that data consumersZie ook Data producers. will be familiar with this ontology. That is the reason why best practice prescribes to reuse existing vocabularies as much as possible to model your dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat. The nice thing about the Semantic Web, however, is that such links to other ontologiesFormele definitie van de klassen, eigenschappen en relaties van een datastructuur en de bijbehorende constraints als een knowledge graph can always be added at a later stage as we will show later in Step 9 (linking the dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat).


Go back to example overview