SPIDER

Deelnemers

Trekkers

Inleiding

SPIDER staat (voorlopig) voor Semantic Perspectives and Interlinked Data from E-humanities Research. In dit project willen we de meerwaarde van toepassing van de principes van Linked Data bij de publicatie van resultaten van wetenschappelijk onderzoek in de geesteswetenschappen aantonen.

Datasets die als Linked Data zijn gepubliceerd zijn:

Duurzaam. Data-elementen worden aangeduid met permanente HTTPHypertext Transfer Protocol (HTTP)-URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke.. Onderzoeksresultaten kunnen altijd beschikbaar blijven.

Koppelbaar. Via HTTPHypertext Transfer Protocol (HTTP)-URIsEen Uniform Resource Identifier (URI), is een internet-protocolelement, gebaseerd op eerdere voorstellen van Tim Berners-Lee. Het is een unieke benaming van een bron, een stuk informatie, data of dergelijke. kan een wereldwijd web van data worden gevormd. Gegevens kunnen worden gerelateerd aan tal van andere gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat.

Zelfbeschrijvend. Onderzoeksresultaten kunnen zodanig worden gepubliceerd dat er geen externe documenten hoeven te worden geraadpleegd om ze te goed te kunnen interpreteren.

Goed automatisch te analyseren en te verrijken. Doordat gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat goed gestructureerd zijn en van een universeel datamodel (RDFResource Description Framework (RDF) is een standaardmodel voor gegevensuitwisseling op het web. RDF heeft functies die het samenvoegen van gegevens vergemakkelijken, zelfs als de onderliggende schema's verschillen, en het ondersteunt specifiek de evolutie van schema's in de loop van de tijd zonder dat alle gegevensgebruikers moeten worden gewijzigd.) gebruik maken kunnen er vele gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat met zekerheid worden afgeleid uit bestaande gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat. Ook kunnen gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat worden afgeleid die niet zeker zijn, maar een zekere waarschijnlijkheid hebben. Die waarschijnlijkheid kan worden vastgelegd en worden gebruikt in verdere analyses.

We denken dat deze algemene eigenschappen zeer effectief kunnen zijn in de geesteswetenschappen, een terrein waarin traditioneel minder informatietechnologie wordt toegepast dan in de bètawetenschappen.

In dit project zouden deze theoretische voordelen via praktische toepassing aangetoond moeten worden, zodanig dat andere onderzoekers geïnspireerd en aangespoord worden om verder te bouwen het dataweb.

Voorziene resultaten

De gewenste resultaten van het project zijn:

1) Datasets beschikbaar als Linked DataLinked Data is een internettechnologie waarmee je gestructureerde gegevens op een uniforme manier kunt beschrijven, modelleren, opslaan, publiceren en onderling kunt koppelen via het internet met behulp van RDF-gebaseerde open standaarden en URI's (bijv. W3C-aanbevelingen en vocabulaires)., beschreven in één of meerdere datacatologi.

2) Ondersteuning van onderzoekers bij publicatie van dataWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat;

3) Slimme automatische methodes om relaties, vooral spatiotemporele relaties, tussen data te ontdekken, zowel binnen als tussen datasetsEen gegevensverzameling is een verzameling RDF-triples, die wordt gepubliceerd, onderhouden of geaggregeerd door één aanbieder..

4) Laagdrempelige interactie door eindgebruikers met oorspronkelijke data en dataverrijkingen, bijvoorbeeld door visualisatie via een kaart met een tijdbalk.

Datasets

Kerkgebouwen in Nederland

De eerste dataset die behandeld gaat worden is een dataset met gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat over kerkgebouwen in Nederland. De dataset bevat gegevensWeergave van een feit, begrip of aanwijzing, geschikt voor overdracht, interpretatie of verwerking door een persoon of apparaat over kerken waarbij het jaar van ingebruikname ligt tussen 1800 en 1970. De dataset wordt samengesteld in het kader van het promotieonderzoek van Herman Wesselink aan de VU. Het onderzoek draait met name om de vraag hoe kerken geclassificeerd/gerangschikt kunnen worden op cultuurhistorisch belang. Zie de detailpagina Dataset Kerken in Nederland voor meer informatie.

Thema's

In de loop van het project komen verschillende algemene vraagstukken aan de orde. Van deze vraagstukken wordt in dit hoofdstuk verslag gedaan.

  1. Versies van dingen in een dataset
  2. SKOS-concepten als temporele eigenschappen

Bijeenkomsten

Conceptual Monday 2015-02-24