SPIDER

Deelnemers

Trekkers

Inleiding

SPIDER staat (voorlopig) voor Semantic Perspectives and Interlinked Data from E-humanities Research. In dit project willen we de meerwaarde van toepassing van de principes van Linked Data bij de publicatie van resultaten van wetenschappelijk onderzoek in de geesteswetenschappen aantonen.

Datasets die als Linked Data zijn gepubliceerd zijn:

Duurzaam. DataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.-elementen worden aangeduid met permanente HTTPHypertext Transfer Protocol (HTTP) is het protocol voor de communicatie tussen een webclient (meestal een webbrowser of een app) en een webserver. Dit protocol wordt niet alleen veel op het wereldwijde web gebruikt, maar ook op lokale netwerken (we spreken dan van een intranet).-URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke.. Onderzoeksresultaten kunnen altijd beschikbaar blijven.

Koppelbaar. Via HTTPHypertext Transfer Protocol (HTTP) is het protocol voor de communicatie tussen een webclient (meestal een webbrowser of een app) en een webserver. Dit protocol wordt niet alleen veel op het wereldwijde web gebruikt, maar ook op lokale netwerken (we spreken dan van een intranet).-URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke. kan een wereldwijd web van data worden gevormd. Gegevens kunnen worden gerelateerd aan tal van andere gegevens.

Zelfbeschrijvend. Onderzoeksresultaten kunnen zodanig worden gepubliceerd dat er geen externe documenten hoeven te worden geraadpleegd om ze te goed te kunnen interpreteren.

Goed automatisch te analyseren en te verrijken. Doordat gegevens goed gestructureerd zijn en van een universeel datamodel (RDFResource Description Framework (RDF) is een standaardmodel voor gegevensuitwisseling op het web. RDF heeft functies die het samenvoegen van gegevens vergemakkelijken, zelfs als de onderliggende schema's verschillen, en het ondersteunt specifiek de evolutie van schema's in de loop van de tijd zonder dat alle gegevensgebruikers moeten worden gewijzigd.) gebruik maken kunnen er vele gegevens met zekerheid worden afgeleid uit bestaande gegevens. Ook kunnen gegevens worden afgeleid die niet zeker zijn, maar een zekere waarschijnlijkheid hebben. Die waarschijnlijkheid kan worden vastgelegd en worden gebruikt in verdere analyses.

We denken dat deze algemene eigenschappen zeer effectief kunnen zijn in de geesteswetenschappen, een terrein waarin traditioneel minder informatietechnologie wordt toegepast dan in de bètawetenschappen.

In dit project zouden deze theoretische voordelen via praktische toepassing aangetoond moeten worden, zodanig dat andere onderzoekers geïnspireerd en aangespoord worden om verder te bouwen het dataweb.

Voorziene resultaten

De gewenste resultaten van het project zijn:

1) Datasets beschikbaar als Linked DataLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires)., beschreven in één of meerdere datacatologi.

2) Ondersteuning van onderzoekers bij publicatie van dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.;

3) Slimme automatische methodes om relaties, vooral spatiotemporele relaties, tussen data te ontdekken, zowel binnen als tussen datasets.

4) Laagdrempelige interactie door eindgebruikers met oorspronkelijke data en dataverrijkingen, bijvoorbeeld door visualisatie via een kaart met een tijdbalk.

Datasets

Kerkgebouwen in Nederland

De eerste dataset die behandeld gaat worden is een dataset met gegevens over kerkgebouwen in Nederland. De dataset bevat gegevens over kerken waarbij het jaar van ingebruikname ligt tussen 1800 en 1970. De dataset wordt samengesteld in het kader van het promotieonderzoek van Herman Wesselink aan de VU. Het onderzoek draait met name om de vraag hoe kerken geclassificeerd/gerangschikt kunnen worden op cultuurhistorisch belang. Zie de detailpagina Dataset Kerken in Nederland voor meer informatie.

Thema's

In de loop van het project komen verschillende algemene vraagstukken aan de orde. Van deze vraagstukken wordt in dit hoofdstuk verslag gedaan.

  1. Versies van dingen in een dataset
  2. SKOS-concepten als temporele eigenschappen

Bijeenkomsten

Conceptual Monday 2015-02-24