Boek/GeerdinkVerhoeven

< Boek

LINKED OPEN DATA EN LINKED ENTERPRISE DATA: VERVAGENDE GRENZEN IN DE ‘EXTENDED ENTERPRISE'

Door: 

Bas Geerdink (ING) 

John Verhoeven (Inspiring Data)


Inleiding[bewerken]

Waarom is het in de ‘extended enterprise’ van toenemend belang om een synthese tot stand te brengen van de reguliere Enterprise Data en de grote hoeveelheden Open Data die uit diverse bronnen beschikbaar is en nog gaat komen? En hoe kunnen we deze synthese tot stand brengen? Om deze sleutelvragen te kunnen beantwoorden, gaan we dieper in op de specifieke dynamiek van de ‘extended enterprise’, en de centrale rol die daarin is weggelegd voor het slim toepassen van allerlei soorten data uit diverse bronnen. We leggen uit hoe je in dit proces toegevoegde waarde kunt vinden in de combinatie van ‘Enterprise Data’ en ‘Open Data’. Hierbij gaan we zowel in op inhoudelijke als op technisch/organisatorische aspecten. 

Met het explosief groeien van de hoeveelheid Linked Open Data (LOD) worden bedrijven, overheden en kennisinstellingen uitgedaagd tot het ontwikkelen van nieuwe en krachtige instrumenten om zicht te krijgen op deze reusachtige bron van nieuwe kennis. Met de groei van de hoeveelheid kwalitatief hoogstaande informatie wordt het bovendien steeds interessanter om koppelingen te leggen tussen deze externe Open Data en de interne (gesloten) enterprise data. Een derde element dat kwaliteit kan toevoegen aan data, is het gebruik ervan zélf. Het gebruik van LOD in combinatie met enterprise data kan leiden tot verrijking, omdat in de combinatie van datasets nieuwe informatie naar voren komt. In dit verband is een belangrijke trend zichtbaar: de opkomst van de ‘extended enterprise’. In een ‘extended enterprise’ komt informatie niet meer alleen van interne, vertrouwde bronnen, maar ook van externe partners. Deze externe informatie kan zowel afkomstig zijn van professionele partners als van tijdelijke of incidentele allianties , zoals spelers die deze data zelf genereren (zoals de individuele burger). Het bedrijf van de toekomst, de ‘extended enterprise’, zal in staat moeten zijn om, ongeacht de herkomst ervan, data uit diverse bronnen en in diverse formaten te kunnen verwerken, beoordelen en toepassen, zodat de datastroom oplevert waarvoor het bedoeld is: toegevoegde waarde en nieuwe inzichten.

Kathedraal of Bazaar[bewerken]

"Kathedraal of bazaar? Nog maar vijftien jaar geleden was dit een fundamentele tegenstelling tussen twee soorten organisaties. In een kathedraal doe je alles onder centrale aansturing, autonoom, binnen eigen muren. Daar tegenover staat het model van de bazaar: in een open, maar afgebakende, constructie werken instellingen met dezelfde spelregels en doeleinden maar vanuit verschillende locaties en specialismen samen aan een product of een dienst. 

Het essay waarin Eric Raymond deze tegenstelling schetste, is een veelgebruikte metafoor geworden voor het verschil in denken tussen een traditioneel, hiërarchisch bedrijfsmodel, met dikke muren tussen ‘binnen’ en ‘buiten’, en anderzijds een bedrijf dat in een netwerk vrijelijk kennis deelt voor de gezamenlijke doelstelling. Zie ook: Eric Raymond, ‘The cathedral and the bazar’, http://nl.wikipedia.org/wiki/The_Cathedral_and_the_Bazaar.

Anno nu is deze tegenstelling grotendeels verdwenen. Elk bedrijf is op weg een ‘extended enterprise’ te worden. Dat stelt grote uitdagingen en nieuwe eisen aan de infrastructuur en de organisatie van datastromen. Maar het vergt vooral nieuwe vaardigheden en samenwerkingsverbanden van de mensen die in zo’n ‘extended enterprise’ met data werken. Een ‘extended enterprise’ is volgens Martin van den Berg (docent module ‘The Extended Enterprise’ van de opleiding Master of Informatics, Hogeschool Utrecht) ‘a smart business network which is:

  • linked together via one or more communication networks forming the links,
  • with compatible goals,</span
  • interacting in novel ways, 
  • perceived by each participant as increasing its own value, and
  • sustainable over time as a network.’

 In het perspectief van Linked Open Data springen er twee aspecten uit: de noodzaak om meerdere (en diverse) soorten communicatiekanalen met elkaar te verbinden, en de behoefte aan nieuwe vormen van interactie. In zo’n dynamische omgeving, waarbij de muren van een bedrijf zo dun als papier zijn geworden, is behoefte aan een levende, open en toegankelijke datastructuur waaraan gebruikers ook informatie kunnen toevoegen en dus verrijken. Een ‘linked data enterprise’ heeft de uitdaging om de diverse datastromen, die uit verschillende en soms ook wisselende bronnen komen, centraal te stellen in de organisatie. De datastroom is een levensader. De uitdaging is ervoor te zorgen dat deze aders tot in de kleinste delen van de ‘extended enterprise’ kunnen doordringen.

In dit hoofdstuk gaan we verder in op de wijze van integratie van diverse soorten data en datastromen binnen een ‘extended enterprise’, en op de fundamentele inhoudelijke vraag welke doelen de data moeten dienen. Daarna hebben we aandacht voor de gevolgen ervan voor de werkwijze van de mensen binnen een organisatie en hoe dit kan leiden tot meerwaarde. Tenslotte geven we ook aan welke stappen een ‘extended enterprise’ kan zetten om optimaal te kunnen kapitaliseren op de toegevoegde waarde van Open Data.

Definities[bewerken]

Omdat er verwarring kan zijn omtrent de termen die in dit hoofdstuk staan, hierbij de definities die gehanteerd worden. Voor ‘Linked Open Data’ (LOD) hanteren we de definitie van Tim Berners-Lee, de directeur van het World Wide Web Consortium: LOD zijn gestructureerde gegevens die via URL’s over HTTP te benaderen zijn, en zelf informatie geven over hun inhoud via standaarden als RDF (http://bit.ly/FQVNV). Dit sluit aan bij de algemenere definitie van Open Data: gegevens die vrijelijk toegankelijk zijn, zonder restricties (opendefinition.org). Voorbeelden van Linked Open Dataset zijn te vinden op sites als <data.gov.uk>, <data.overheid.nl> en <datahub.io>.

Onder ‘Enterprise Data’ verstaan we simpelweg alle gegevens, gestructureerd of ongestructureerd, die zich binnen een organisatie bevinden en niet gepubliceerd zijn. De data worden gedeeld door de medewerkers van de organisatie, maar niet daarbuiten. Voorbeelden van enterprise data zijn de gegevens in ERP en CRM systemen, op het intranet, in databases van applicaties, op fileshares, en in e-mail.

Een gezond lichaam[bewerken]

Data als levensader heeft een fysieke component: er moet een infrastructuur zijn, de data moeten aan allerlei technische eisen voldoen om te kunnen worden gelinkt en gebruikt. Maar er is natuurlijk ook een inhoudelijk aspect. De vraag welke data nu eigenlijk van belang zijn is in deze tijden van informatie-overdaad veel lastiger te beantwoorden dan in het nog recente verleden (http://bit.ly/Bg0r).

Wat stroomt er eigenlijk door die levensader? Hebben de beschikbare data wel voldoende kracht om het ‘lichaam’, de ‘extended enterprise’, gezond te laten groeien?

De technische revoluties van het laatste decennium hebben het gedrag van de gebruiker fundamenteel veranderd: we gaan niet meer naar een bibliotheek om in te loggen op de database, we roepen de gewenste data op vanaf de plaats waar we op dat moment zijn. Achter het bureau, in de auto, of thuis. En we kijken verder; we gaan ook nog even het internet op, de grootste database van allemaal.

Dit verandert niet alleen de manier waarop we data benaderen, het verandert ook de data zelf en de eisen die we eraan stellen. Enterprise Data kunnen door de gebruiker worden aangevuld, verrijkt. Dit verandert ook de traditionele rol van de data-consument: de gebruiker wordt soms ook ‘producent’: een ‘prosumer’.

Dit proces doet zich overal in de samenleving voor. Bij bedrijven, maatschappelijke organisaties, kennisinstellingen en overheden worden grote hoeveelheden data verzameld die steeds vaker beschikbaar komen voor de buitenwereld. Deze nieuwe vloedgolf van data (Big Data) is soms het gevolg van gericht overheidsbeleid (meer transparantie), vaak ook het gevolg van allianties tussen bedrijven en kennisinstellingen. Soms gebeurt het ook simpelweg ‘omdat het kan’. Dus waarom niet? Wat dit voor het bedrijfsleven betekent, laat zich raden: de ‘Open Data’ tsunami biedt veel kansen om gerichter, beter geïnformeerd en dus met meer kennis en inzicht te werken aan de eigen toekomst.

(Zie ook: Carlo Ratti e.a.: Open Data: Issues and opportunities for the enterprise?, An initiative by bluenove on the basis of the bluenove-BVA survey, nov 2011.)

‘Eigen data eerst’[bewerken]

Van nature hecht een bedrijf meer waarde aan de eigen data, waarschijnlijk omdat men weet hoeveel moeite het heeft gekost om die te verzamelen en de betrouwbaarheid te borgen. Het is dan ook begrijpelijk dat een bedrijf meer waarde hecht aan de ‘eigen’ data dan aan informatie van buiten. ‘Eigen data eerst!’, zo zou je deze visie kunnen vertalen. We zijn van mening dat zo’n houding in deze tijd niet meer productief is en zelfs een rem kan zijn op innovatie. De kernvraag is hoe je Enterprise Data kunt integreren en optimaal benutten zonder aan kwaliteit in te boeten. Dat is niet alleen een technische vraag, maar ook een psychologische. Het gaat immers ook om de vraag: welk gewicht de data krijgen in het proces van innovatie, en vooral als het gaat om inzichten die zijn ontleend aan ‘open’, al dan niet gestructureerde data. Toen Apple voortvarend aan de slag ging met touchscreens voor de eerste smartphones, zei directeur Steve Ballmer van concurrent Microsoft keihard ‘niet te geloven’ in de toegevoegde waarde van een touchscreen boven een fysiek toetsenbordje. Zijn visie kreeg vervolgens meer gewicht dan andere beschikbare data, vooropgesteld dat Microsoft zijn huiswerk had gedaan en een goed beeld had van de trends in consumentenproducten. Het geeft aan hoe lastig het is om ongelijksoortige data (trendonderzoek versus ‘persoonlijke mening’) het gewicht te geven dat hen toekomt. We weten hoe dit voor Microsoft en haar partners is afgelopen.

Bedrijven kunnen ruim twintig procent meer rendement boeken als ze in staat zijn om hoogkwalitatieve en heel diverse soorten van data te integreren in een samenhangende infrastructuur. (Gartner, 2011)

Het organiseren van meerwaarde[bewerken]

Met enterprise data hoeven we ons niet af te vragen wat de zin is van deze data voor de organisatie. Deze data komen immers tot stand omdat wij dat willen. Zodra de data niet meer voldoende worden benut of niet meer in staat zijn meerwaarde te bieden, kan de organisatie, als aanjager van de informatiestroom, daar iets aan doen. Bij het integreren van ‘Open Data’ in het informatiesysteem van een ‘extended enterprise’, is dat niet het geval.

De Open Data zijn niet gemaakt met het directe belang van de eigen organisatie voor ogen. Bovendien is er heel erg veel van... Daarom is het ordenen, het organiseren, van deze data meer dan alleen een technisch of organisatorisch verhaal. Het vergt een helder antwoord op de vraag: wat wil ik van de data weten? Wat is werkelijk relevant voor mijn organisatie?

Bij het integreren van diverse soorten data zien we iets opvallends ontstaan: de herkomst van data wordt van secundair belang. Relevant is eigenlijk alleen de vraag wat de stroom externe gegevens aan meerwaarde biedt (of verbergt). Die meerwaarde zit meestal niet alleen of zozeer in de intrinsieke data, in de data ‘an sich’, maar schuilt in de synthese ervan met de Enterprise Data. Pas in het samenbrengen van die verschillende data ontstaat het leeuwendeel van de meerwaarde: 1+1=3. Een gevoel van superioriteit met betrekking tot de eigen data versus de Open Data is daarom gevaarlijk – en in elk geval achterhaald.

Ruimte voor ‘prosumers’[bewerken]

Bij het integreren van Open Data in de bedrijfsinformatie is het essentieel om niet alleen de data zelf, maar ook de gebruikers mee te nemen in dat proces. Immers: bij Open Data zijn de consumenten vaak ook de producenten. Voor het verbeteren/verrijken van de data is hun rol essentieel.

Een voorbeeld van hoe je Open Data uit heel diverse bronnen integreert en hoe je deze producerende consumenten (‘prosumers’) een actieve rol kunt geven, is - met vallen en opstaan - ontwikkeld door wellicht het grootste Open Dataproject in de recente geschiedenis: Wikipedia. Deze online encyclopedie, die inmiddels meer content heeft en een even lage foutmarge als de traditionele, in een gesloten model gemaakte encyclopedieën, onderscheidt drie ‘prosumer’-groepen: anonieme gebruikers (1), geregistreerde gebruikers (2) en administrateurs (3). Opvallend is dat alle drie groepen content kunnen leveren, dus data kunnen verrijken – ja, ook de anonieme deelnemer. Waarbij de administrator de meeste bevoegdheden heeft (en bijvoorbeeld content weghalen). Deze dynamiek werkt dankzij een systeem van openlijke reviewing en een publiek debat over de content. De relatieve laagdrempeligheid voor het ‘prosumeren’ van informatie heeft dus een glasheldere keerzijde: het systeem van ‘reviewing’ is stevig neergezet en uitermate transparant. En met een echte ‘eindbaas’: de administrateur.

(Zie ook: The Role of Community-Driven Data Curation for Enterprises: Linking Enterprise Data, hoofdstuk 5, Edward Curry, Andre Freitas, and Sean O’Riain. Digital Enterprise Research Institute, National University of Ireland, Galway, Ireland.) 

‘Er wordt getwijfeld aan de juistheid van dit artikel...’[bewerken]

De ‘extended enterprise’ gaat allerlei allianties en samenwerkingen aan, in diverse gradaties van intensiteit en belang. In al die relaties gaan datastromen heen en weer. In een innovatieve omgeving kunnen de Enterprise Data een vruchtbare mix vormen met de Open Data die vanuit diverse hoeken en in diverse formats beschikbaar zijn. De vraag hoe je dit het beste kunt aansturen, is voor elke instelling anders te beantwoorden, maar in de basis is dus veel te leren van het Wikipediamodel: zet de bevoegdheid tot dataverrijking en amenderen zo laag mogelijk in de organisatie en wijs een aantal administrateurs aan die knopen doorhakken en een oogje in het zeil houden. Er zijn allerlei gradaties van overleg met contribuanten, en bijbehorende procedures. Van alle informatie die nog niet voldoet aan de zelf opgelegde standaard, meldt dit massieve online project ook netjes: ‘overleg gewenst’ of, in het ergste geval: ‘Er wordt getwijfeld aan de juistheid van een of meer onderdelen van dit artikel’.

In een bedrijfsomgeving is de identiteit van alle data-gebruikers bekend: wie wat bijdraagt kan door zijn collega’s of door de administrateurs worden bijgestaan/gecorrigeerd of gesteund. En misschien is anonimiteit van dataverrijkers, ook bínnen een bedrijf aan te bevelen. Hoe anders krijg je een slimme nieuwkomer binnen een hiërarchische organisatie zover om vraagtekens te zetten bij de data en deze te verbeteren?

Deze vorm van data-management en integratie resulteert bovendien in een ‘agile’-aanpak: al doende bouw je voort aan een datasysteem dat zowel open als gesloten data bevat, je ziet snel genoeg waar de gaten zitten, en waar nog nieuwe inbreng gewenst is. Dat is zowel transparant als een prikkel voor vernieuwing. Deze innovatieve dimensie van de LOD-LED synthese is overigens ook goed te organiseren, bijvoorbeeld door middel van kleine incentives voor de beste en ijverigste data-verbeteraars in huis. Het geeft bovendien een ander belangrijk signaal af naar de organisatie als geheel: ‘We werken met wat we weten. Morgen willen we meer weten dan vandaag’.

 De vermenging van LOD en LED zal bovendien leiden tot nieuwe en betere data. Het toepassen van allerlei soorten data en het terugploegen van de verrijkte data in de publieke ruimte geeft groei. ‘Joining and sharing’ zijn sleutelbegrippen geworden als het gaat om deze trend.

(Zie ook: ‘Joining and sharing’ als een kernbegrip van deze tijd. Uitspraak van Neelie Kroes, Europees Commissaris belast met de portefeuille Digitale Agenda, tijdens de Europadag van de ECP in Zeist, op 7 mei 2013.)

Vervagende datagrenzen[bewerken]

Het is bepaald geen sinecure om hiervoor de juiste infrastructuur op te bouwen. De uitdagingen die hiermee samenhangen, worden elders in deze publicatie en in het LED-vakgebied al uitgebreid geanalyseerd. Daarover verderop meer. Het doel van de instrumenten verdient hier nog enige aandacht. Vanouds zijn datasystemen erop gericht om zoveel mogelijk data te linken en inzichtelijk te maken voor gebruikers. In de toekomst zullen de tools en de infrastructuur er vooral op gericht moeten zijn om het nuttige te scheiden van het nutteloze.

We denken dat binnen afzienbare tijd het onderscheid tussen Enterprise Data en Open Data een puur technische zal zijn. Waarbij zal blijken dat Open Data, eenmaal gelinkt, soms beter en betrouwbaarder is en dus meer waarde toevoegt, dan de ‘eigen’, vaak duur betaalde en gekoesterde bedrijfsdata. 

Open Data die door overheden zijn verzameld met het oog op het publiek belang, of die zijn te filteren uit natuurlijk gedrag van consumenten en burgers, bieden nu al inzichten die waardevol zijn voor hele bedrijfstakken. Google is, als zoekmachine, ‘s werelds grootste verzamelaar en analist van publieke data geworden. De ‘wisdom of the crowd’ kennen we natuurlijk al, zoals in het al genoemde Wikipedia. Maar inmiddels is Google Trends een nauwkeuriger voorspeller van, bijvoorbeeld, een griepgolf dan de gezondheidsinstellingen van de diverse overheden en van de verzamelde farmaceutische industrie. Terwijl die laatste er toch ettelijke miljarden per jaar aan verdienen. En bedenk dat Google nog geen vijftien jaar oud is. Deze trend is nog maar net begonnen. Er bestaan straks nog slechts twee categorieën data: nuttige data en nutteloze data. Waarbij de vraag „wat is nuttig?’ in een ‘extended enterprise’ lastiger is te beantwoorden dan menigeen misschien denkt. 

De belofte van inzicht: ‘...asking the right questions...’[bewerken]

De kernvraag die we eerder stelden is: welke data kunnen mijn organisatie toegevoegde waarde bieden? Daar vloeien twee vervolgvragen uit voort: waar zitten die data dan? En: hoe kom ik er aan als ik ze nog niet heb?

Bij discussies over Open Data en datamanagement gaat het vaak over (het verbeteren van) beheersstructuren en systemen. Begrijpelijk: binnen een bedrijf zijn de kwalitatieve data verspreid over tientallen, honderden of duizenden locaties: van diverse databases tot de individuele desktops en email accounts. Feitelijk weet geen enkel bedrijf precies welke kennis het nu al in huis heeft, laat staan waar die kennis zit. Het aanboren van additionele kennis in grote hoeveelheden Open Data is daarom geen sinecure. Data is, op zichzelf, gewoon data. Data wordt pas ‘informatie’ als het vindbaar en toegankelijk is, en liefst ook nog gekoppeld. Informatie kan tot kennis leiden zodra de informatie op het juiste moment op de juiste manier op de juiste plaats aanwezig is, gevraagd of ongevraagd. Maar pas als de betrokken ‘prosumer’ de juiste achtergrond heeft en de juiste mindset, kan deze kennis leiden tot inzichten. Pas dan – en niet eerder – lossen de data hun belofte in en geven ze hun toegevoegde waarde prijs. Vergelijk het met olie: pas als er een stevige infrastructuur is kan de olie worden gewonnen en verwerkt, pas na raffinage wordt de olie tot brandstof. Maar pas als het ook nog in de tank terecht komt, is de belofte ingelost.

Welke vragen stellen we aan de data? Welk probleem moeten de LOD en LED voor ons oplossen? Daarbij gaat het natuurlijk in de meeste gevallen om het verbeteren of versnellen van allerlei praktische processen binnen de organisatie of in een samenwerking met anderen. We formuleren een vraag of een claim en richten ons op de data voor antwoorden. We zijn van mening dat een goede synthese van LOD met LED tot iets kan leiden dat verder gaat dan de gebaande paden: je vindt nieuwe trends, inzichten die je niet had gezocht maar die zich aandienen door deze synthese van data uit diverse bronnen. Het helpt dan, dat de Open Data in de regel niet werden verzameld met een vooropgezette vraag uit het bedrijf, maar juist vanuit een heel andere vraag uit een andere sector. Neem bijvoorbeeld de gegevens van het Centraal Plan Bureau (CPB) of het CBS met betrekking tot sportief gedrag en beweging. Die zijn niet verzameld om vragen van bijvoorbeeld Nike of de Bond voor Gehandicaptensport te beantwoorden, maar om de politieke bestuurders een beeld te geven van de gezondheid van verschillende bevolkingsgroepen. Op basis hiervan kunnen gemeenten beslissen of er een sporthal of een voetbalveld moet bijkomen, of dat er beter wat meer geld gestopt kan worden in fitness in buurthuizen voor allochtone vrouwen.

Toch kunnen deze data veel vertellen aan de Nike’s en de sportbonden van deze wereld. De samensmelting van Open Data en Enterprise Data kan een bedrijf op het spoor zetten van nieuwe trends waarmee de concurrentie op achterstand komt te staan. Een bedrijf in sportartikelen kan producten gaan ontwikkelen voor een nieuwe markt van oudere ‚bewegers’, bijvoorbeeld. Een markt die nu nog nauwelijks zichtbaar is, maar die er volgens de Open Data van overheden snel aankomt. Met technologische snufjes die ook laagopgeleiden of allochtone ouderen kunnen snappen. Of met voorzieningen die ook voor bejaarden goed toegankelijk zijn.

Wat weten we?[bewerken]

De synthese van Open Data en Enterprise Data is vooral interessant voor bedrijven die innovatief naar hun producten en diensten willen kijken. Wie naar trends zoekt, kan naar Open Data kijken en daarin ‚zwakke signalen’ opsporen. De grote hoeveelheden al dan niet gestructureerde data waarover bedrijven kunnen beschikken, dwingen tot de hier al eerder geformuleerde kernvraag: ‘wat wil ik weten?’ Dit lijkt een simpele vraag. Maar eigenlijk raken we hier aan de essentie van de hele discussie over nut en toepassing van data. Welke kennis is al aanwezig? Wat ontbreekt nog om tot een goed oordeel of besluit te komen? Waar halen we die ontbrekende kennis vandaan?

Zonder te verzanden in filosofische verhandelingen willen we hier de vraag naar de behoefte aan kennis even aanstippen, omdat dit naar onze mening van wezenlijk belang is bij het maximaal benutten van de toegevoegde waarde van Open Data. Er zijn diverse soorten van kennis. Opvallend genoeg was het de Amerikaanse minister van Defensie Donald Rumsfeld die dit paradigma beroemd maakte. Hij gebruikte het om de beslissingen rondom het aanvallen van Saddam Hoesseins Irak te legitimeren - maar dit terzijde (zie ook: http://bit.ly/hUQDLF). 

Rumsfeld maakte onderscheid in drie soorten kennis: 

1. Er zijn dingen waarvan je niet weet dat je ze weet. 

Dit eerste paradigma hebben we zelf toegevoegd, om de logica van Rumsfeld in zijn consequentie door te trekken naar een relevant element, namelijk het zicht op bestaande data. Binnen een onderdeel van het bedrijf is kennis aanwezig die onbekend is bij de rest van de organisatie. Bijvoorbeeld omdat die kennis op een spreadsheet staat van een paar individuele collega’s of binnen de database die zo slecht is ‘getagt’ dat niemand het kan vinden. 

2. Er zijn dingen waarvan je weet dat je ze weet. 

Dit bestrijkt het hele veld van aanwezige 'Linked Data’. Dit is wat we formeel weten. De meeste debatten over Linked Data beperken zich tot de twee bovenstaande categorieën. 

3. Er zijn dingen waarvan je weet dat je ze niet weet.

Dit is het uitzicht dat we kunnen hebben op onze omgeving – mits we goed kijken. We kunnen trends zien waar we meer van willen of moeten weten, met het oog op verbetering van bestaande of het bedenken van nieuwe diensten of producten. Opleidingen en afdelingen R&D zijn veelal hierop gericht. Om dit potentieel aan te boren is veel creatieve capaciteit nodig. Uiteindelijk zullen de inspanningen in dit deel van het traject leiden tot het vermogen om ‘de juiste vragen te stellen’ aan de data. Dit is een essentiële vaardigheid.

4. Er zijn dingen waarvan je niet weet dat je ze niet weet.

"Onwetendheid over wat er allemaal bestaat buiten onze eigen professionele leefwereld is iets wat iedereen zal herkennen en waar niemand aan ontsnapt. In dit ‘veld’, het grootste van alle vier geschetste terreinen, zitten de data waar we niet specifiek naar zochten, maar die ons niettemin op nieuwe ideeën en inzichten kunnen brengen. De vloedgolf aan Open Data, al dan niet gestructureerd, brengen deze categorieën 3 en 4 van ‘kennis’ binnen handbereik. Het ‚niet-weten’ kan een belangrijke drijfveer zijn voor innovatie. Het openstaan voor nieuwe dingen waar we helemaal niet naar op zoek waren, maar die de organisatie verder kunnen helpen, klinkt voor sommigen misschien in de oren als luchtfietserij, fantasie of dagdromerij. Dit aspect van innovatie is echter niet afhankelijk van de creatieve ingeving van een enkeling, maar kan wel degelijk worden georganiseerd en gestructureerd. Vaak ontstaat het uit de synthese van twee ogenschijnlijk erg verschillende kennisvelden: bijvoorbeeld statistiek en sport (zoals in ‘Moneyball’, film: http://en.wikipedia.org/wiki/Moneyball_(film)) en design versus techniek (Apple).

Kunstenaars, maar ook visionaire ondernemers als Steve Jobs en Richard Branson hebben een talent om dergelijke verbindingen te leggen en laten ook steeds merken binnen hun organisatie veel waarde te hechten aan dit talent. 

Op zoek naar ‘zwakke signalen’[bewerken]

Op organisatieniveau is op dit vlak nog een wereld te winnen. Juist de informatie in Open Data kan hier een sleutelrol in spelen, omdat deze met andere bedoelingen zijn verzameld dan waarvoor uw organisatie ze wil bestuderen. Het ontdekken van dingen waar we niet naar op zoek waren - omdat we het bestaan niet hadden vermoed - is een belangrijke dynamiek waarvoor elke organisatie eigen antennes zou dienen te ontwikkelen. Die antennes kunnen ‘zwakke signalen’ opvangen, en in een ‘early warning system’ data uit diverse bronnen combineren tot een scenario voor de innovatie van producten of diensten.

Diverse succesvolle bedrijven doen dit al: vaak in stilte, soms in het publieke domein. Een bedrijf als Shell heeft dit tot een van de belangrijkste hoekstenen van beleid gemaakt (zie ook [[1]]). Met zeer gedegen scenario’s schetst de oliemaatschappij de megatrends van de toekomst, in meerdere variaties. Ze liggen aan de basis van nader onderzoek, en van strategisch beleid voor de langere termijn. Dankzij deze scenario’s was Shell goed voorbereid toen begin jaren zeventig plotseling de oliecrisis losbarstte. Dat werd namelijk al eens uitgewerkt in een van hun toekomstscenario’s. De scenario’s zijn opgebouwd uit een mix van Open en Enterprise Data, waarbij context en kruisbestuiving zorgen voor een 1+1=3. De scenario's van Shell belanden anno nu op de directiebureaus van bedrijven en overheden in de hele wereld. Ze zijn een perfect voorbeeld van waar de synthese van Open Data en Enterprise Data toe kan leiden.

De 'extended enterprise' in de praktijk[bewerken]

Waar gaat het nu echt om? In bovenstaande paragrafen komen een aantal thema’s en uitdagingen terug:

  • Organisaties en systemen zijn ‘loosely coupled’; 
  • Interoperabiliteit speelt een belangrijke rol;
  • Meerdere organisaties streven een gemeenschappelijk doel na.

Om een ‘extended enterprise’ te vormen is het dus noodzakelijk om samen te werken. De manier van samenwerking kan verschillen. We hebben hier twee opties geselecteerd die een antwoord geven op de uitdagingen van de marsroute naar een ‘extended enterprise’ en de synthese van de diverse soorten Open en Enterpise Data in een werkbaar systeem dat de koppeling van LOD en LED meerwaarde geeft: supply chain management en chain computerization. Deze opties zijn in de praktijk getoetst maar hebben ook een sterke wetenschappelijke verantwoording. 

A. Meerwaarde in Supply Chain Management. [bewerken]

Een goede optie is om een samenwerkingsverband tussen organisaties af te sluiten dat gebaseerd is op supply chain management (SCM, http://bit.ly/v4m6W). Dit is een manier die sinds de tachtiger jaren gebruikt wordt om te benadrukken dat bedrijfsprocessen binnen en tussen organisaties op elkaar afgestemd moeten worden. Het gaat hierbij om de stroom van goederen, geld en diensten. De betrokken bedrijfsprocessen zijn onder andere logistiek, capaciteitsmanagement en werkverdeling. Een supply chain is een complex en dynamisch netwerk van vraag en aanbod (http://en.wikipedia.org/wiki/Supply_chain). In zo’n netwerk is goede governance (bestuur) in de vorm van SCM noodzakelijk. Sinds de introductie van het internet en de toename in IT-services is SCM belangrijker geworden dan ooit tevoren.

B. Meerwaarde in Chain-Computerization. [bewerken]

Een andere insteek voor het invoeren van een ‘extended enterprise’ is chain-computerization. Dit is een relatief jong concept, geïntroduceerd door Jan Grijpink (http://bit.ly/10qRTzL). Bij chain-computerization (of keteninformatisering) geldt dat er een ‘dominant ketenprobleem’ is dat moet worden opgelost (http://bit.ly/12EkvFZ). Een keten van organisaties bedenkt op ‘ketenniveau’ oplossingen voor het ketenprobleem. Hierbij is geen enkele instantie leidend of dominant aanwezig; het ketenprobleem in zichzelf is de drijvende kracht achter de keteninformatisering. De belangen van de individuele betrokken organisaties zijn in principe nevengeschikt aan het probleem. Voorbeelden van zulke ketens zijn de medicatieketen (ketenprobleem: er kan gezondheidsschade optreden door het onjuist toedienen van geneesmiddelen) en de voetbalvandalisme bestrijdingsketen (ketenprobleem: vandalisme en geweld gerelateerd aan voetbalwedstrijden). 

Architectuur en technologie

Bij al deze vormen van samenwerking is technologie belangrijk. Een ‘extended enterprise’ bevat een IT-speelveld, waarin zaken als architectuurprincipes een belangrijke rol gaan spelen. Het denken in services volgens de SOA-gedachten en principes (http://bit.ly/ZKCR0v) is een goed startpunt om interoperabiliteit en digitale samenwerking te realiseren. Linked Open Data is natuurlijk een belangrijk onderdeel van deze aanpak; welke data worden gedeeld, met welke beveiliging? We zijn het tijdperk voorbij van Excel-bestanden aan elkaar doormailen; een organisatie die zich profileert als een onderdeel van een ‘extended enterprise’ kan hier niet meer mee wegkomen. Er zal dus serieus werk gemaakt moeten worden van (REST) web services, SaaS-integratie en open standaarden zoals SAML, EDI, EbXML en UDEF.

In plaats van applicaties direct aan elkaar te koppelen, is het mogelijk om als middleware laag een integratieservice in te schakelen. In feite functioneert zo’n service als een Enterprise Service Bus (ESB): een technisch doorgeefluik voor berichten met inhoud, die verantwoordelijk is voor zaken als autorisatie, authenticatie, orkestratie en logging. Een ESB is een belangrijk onderdeel van een service-oriented architecture (SOA). Een dergelijke architectuur biedt veel voordelen op het gebied van interoperabiliteit en standaardisatie, doordat applicaties als services gezien worden die via een generiek protocol met elkaar communiceren (bijvoorbeeld SOAP web services over http). Alle populaire ESB-producten, bijvoorbeeld Microsoft BizTalk en Tibco, kunnen ingezet worden in een Linked Open Data architectuur van een ‘extended enterprise’.

Open Data 'maturity'[bewerken]

De ‘volwassenheid’ van een organisatie op het gebied van Linked Open Data is lastig te bepalen. In 2013 hebben John van Echtel (CGI) en de auteurs van dit artikel een maturity model ontwikkeld in samenwerking met Hogeschool Utrecht en het Nederlands Architectuur Forum (NAF), op basis van bestaande modellen van onder andere Luftman, CMM, Gartner, Sacu en IDC. Het model bestaat uit een conceptueel raamwerk waarin de mate van volwassenheid van een organisatie kan worden bepaald op zes dimensies: Business model, Open Data consumptie, Open Data publicatie, Enterprise Data, Architectuur & technologie en Ontwikkel & beheerprocessen. Op elke dimensie wordt een score van 1 t/m 5 toegekend. Dit model is onderdeel van de workshop ‘Open Data Value’.

Deze aanpak heeft zich in de praktijk bewezen bij enkele organisaties, die daarmee hun positie in de ‘extended enterprise’ bepalen en een strategie ontwikkelen voor het gebruik (consumptie en publicatie) van Linked Open Data. De scan en de workshop waarin diverse ‘meedenkers’ uit andere disciplines aanschuiven, vormen samen zowel een technische tool als een psychologisch mechanisme om het denkproces hierover op gang te brengen en tegelijk een ‘foto’ te maken van de stand van zaken binnen een organisatie. De werkwijze wordt uitgelegd op http://www.utrechtopendata.org/workshops

Samenvatting[bewerken]

Wat is een organisatie? Waar liggen de grenzen? Welk bedrijf of instelling staat nog op zich? Een organisatie is tegenwoordig een ‘beschouwingsniveau’, een relatief concept dat in feite zegt: alles is als een zelfstandige organisatie te kenmerken, onafhankelijk van de grootte.

Op microniveau is een ‘extended enterprise’ een afdeling, een team, of een individu. Op macroniveau is een ‘extended enterprise’ een bedrijf, een multinational, of een conglomeraat. Elk van deze entiteiten kan niet functioneren zonder zijn omgeving, en die omgeving definieert wát de ‘extended enterprise’ inhoudt. We leven in een wereld van virtuele organisaties en smart business networks. Een bouwproject is een gezamenlijke onderneming van bedrijven: infrastructuur, weg- en waterbouw, ingenieurs, lokale overheden. De implementatie van een nieuw ERP-pakket is een ‘extended enterprise’ van de interne IT-afdeling, meerdere leveranciers, onderaannemers, ZZP’ers en toezichthouders. Een onderzoeksorganisatie doet onderzoek naar cultuur en sportbeoefening in Nederland, en werkt daarvoor samen met sportbonden, overheden en vrijwilligers. Zelfs de ‘bakker op de hoek’ is een onderdeel van de ‘extended enterprise’, namelijk de supply chain van boer tot consument.

Met het explosief groeien van de hoeveelheid Linked Open Data (LOD) worden bedrijven, overheden en kennisinstellingen uitgedaagd tot het ontwikkelen van nieuwe en krachtige instrumenten om zicht te krijgen op deze reusachtige bron van nieuwe kennis. Daarbij gaat het om het vinden van toegevoegde waarde in Open Data, maar tevens om het realiseren van verrassende koppelingen van open en gesloten datasets. Een derde element dat kwaliteit toevoegt aan data, is het gebruik ervan zelf: het toepassen en toevoegen van LOD resulteert, mits goed gestructureerd en geborgd in de organisatie, in ‘verrijking’ door de gebruikers.

"Extended enterprise"

Tegelijkertijd is een tweede grote trend zichtbaar: de opkomst van de ‘extended enterprise’. In een ‘extended enterprise’ komt informatie niet meer alleen van interne, en gescreende bronnen, maar ook van ‘buiten’. Deze externe informatiebronnen kunnen zowel professionele partners zijn als tijdelijke of incidentele allianties met partijen die over informatie beschikken (andere bedrijven, overheden, kennisinstellingen) of die deze data zelf genereren (de individuele burger). Deze externe informatiestroom kan zowel big data, small data, en gestructureerde of ongestructureerde data zijn. Deze bronnen van kennis bestaan nu nog goeddeels los van elkaar, waarbij van nature meer waarde wordt toegekend aan de ‘eigen’ Enterprise Data dan aan informatie van buiten. ‘Eigen data eerst’, zo zou je deze visie kunnen vertalen.

 In een innovatieve, professionele omgeving is dit onderscheid achterhaald. LOD en ‘Enterprise Data’ komen samen in een vruchtbare mix waarbij de toegevoegde waarde meer is dan de som der delen. ‘Joining and sharing’ zijn de nieuwe sleutelbegrippen zodra het gaat om data. Een bedrijf dat op zoek is naar meer kennis en inzicht over klanten, producten en nieuwe markten, zal hier een competitief voordeel kunnen behalen. Centraal hierbij staat het vermogen van de organisatie om data goed te beoordelen, te linken en te verrijken.

Dat houdt in dat de organisatie geen volledige controle heeft over belangrijke onderdelen van de ‘extended enterprise’. Het is nu eenmaal niet altijd mogelijk eisen te stellen aan leveranciers of afnemers. Dat betekent dat selectie van de diensten en afstemming over integratie erg belangrijk wordt, naast de technische uitdagingen. Deze selectie moet gedaan worden op basis van criteria op gebied van beveiliging en interoperabiliteit. Als bijvoorbeeld communicatie op basis van open standaarden een must is, wordt dat een criterium voor het selecteren van partners en technologie. Als ontwikkelaars een open API nodig hebben om een extern systeem te kunnen benaderen, is dat ook een criterium. Als er eenmaal partners gekozen zijn en diensten worden aangeboden en afgenomen, moeten de leveranciers worden aangestuurd en de contracten worden beheerd. 

Om Linked Open Data op enterpriseniveau toe te passen en dus een succesvolle ‘extended enterprise’ te vormen, moeten beslissingen op strategisch, tactisch en operationeel niveau worden genomen. 

1. Strategisch

Op boardroom-niveau moeten bestaande governance modellen aangepast worden. Directieleden en managers moeten zich ervan bewust worden dat hun organisatie onderdeel is van een groter geheel; ‘eiland-denken’ is uit den boze. Het governancemodel dient daarin te voorzien door middel van de juiste standaarden, processen en rollen.

2. Tactisch

Het implementeren van een ‘extended enterprise’ met Linked Open Data biedt uitdagingen op gebied van architectuur, beveiliging, processen en menselijke zaken (bijvoorbeeld rollen en verantwoordelijkheden). Gemeenschappelijke afspraken (met leveranciers, tussen gebruikers) dienen te worden vastgelegd, uitgevoerd en gecontroleerd.

3. Operationeel

Ten slotte zijn er enkele technische (operationele) uitdagingen om ‘extended enterprises’ goed te laten werken. Interne software moet geïntegreerd worden met externe applicaties en services. Beveiliging en integratie is lastig doordat de leverancier ‘buiten de deur’ zit. Gelukkig vordert de IT-technologie razendsnel en zijn cloud, SaaS, SOA en Open Data gemeengoed geworden.

Conclusies[bewerken]

1. In de ‘extended enterprise’ vormt de enorme stroom data het kloppende hart van de onderneming. De tegenstelling tussen een bedrijf als Kathedraal of een bedrijf als Bazaar is ingehaald door de tijd. Zelfs een bedrijf dat als Kathedraal functioneert, zal in de talloze allianties met partijen buiten de muren, het karakter moeten kunnen aannemen van een Bazaar. In de Bazaar is het welslagen van de doelstelling volledig afhankelijk geworden van een geslaagde synthese van Linked Enterprise Data en Linked Open Data. Commerciële bedrijven en overheidsinstellingen hebben geen bestaansrecht zonder goede verbindingen naar buiten. Bovendien hoort het bij de hedendaagse cultuur: we zijn Open en transparant, werken samen op alle vlakken en vinden de technische stand van zaken de normaalste zaak van de wereld. We leven in een wereld van ‘extended enterprises’. Linked Open Data is daar een onlosmakelijk en, in sterk toenemende mate, onmisbaar onderdeel van voor elke organisatie die op zoek is naar toegevoegde waard en een competitief voordeel.

2. Bij de integratie van Open Data met Enterprise Data komen twee aspecten naar voren: de noodzaak om meerdere (en diverse) soorten van communicatiekanalen met elkaar te verbinden, en de behoefte aan nieuwe vormen van interactie.

3. De meerwaarde van Open Data voor een ‘extended enterprise’ is vaak niet op voorhand duidelijk, omdat deze data zijn niet geproduceerd met het belang van de eigen organisatie voor ogen. Daarom is het integreren van Open Data meer dan alleen en technische of organisatorische kwestie, maar ook een psychologische en intellectuele uitdaging. Het raakt aan de kernvraag: wat willen we eigenlijk weten? Welke kennis is relevant voor mijn organisatie?

4. Om Linked Open Data succesvol op enterprise niveau toe te passen, zijn beslissingen nodig op strategisch, tactisch en operationeel niveau. Strategisch moeten bestaande governance modellen aangepast worden. Op tactisch vlak is behoefte aan een heldere architectuur en afspraken. Operationeel ligt de uitdaging vooral in het benutten van de nieuwste IT-mogelijkheden van transparante cloud-applicaties.