7.5.1Hoofddoelstellingen

Het onderzoek naar de analyse van onderzoeks- en innovatie-activiteiten is onderhevig aan significante trends die nieuwe methodes noodzaken voor de integratie van gegevens afkomstig van verschillende, heterogene databronnen. Enkele belangrijke trends zijn hier samengevat:

  • De snelgroeiende beschikbaarheid van open en gekoppelde data;
  • De snelle evolutie van Big Data naar Big Data Science;
  • Het meten van een bredere impact door de ontwikkeling van altmetrics; 
  • Het gebrek aan interpretatieve kaders voor de uitbreiding van indicatoren voor funding en evaluatie (bijv. Wilkson et al., 2015)
  • De toenemende complexiteit van de evaluatie van onderzoeksprestaties (vgl., Moed & Halevi, 2015);
  • De noodzaak de lineaire en tendentieuze aanpak van rankings te vervangen door betere methodes (Daraio & Bonaccorsi, 2017; Glänzel et al., 2016).

De evaluatie van prestaties is gebaseerd op gegevens die uit verschillende open en commerciële bronnen komen en die op basis van diverse gecentraliseerde en gedecentraliseerde, top-down en bottom-up methoden, worden verzameld.

‘‘Scientific innovation has been called on to spur economic recovery; science and technology are essential to improving public health and welfare and to inform sustainability; and the scientific community has been criticized for not being sufficiently accountable and transparent. Data collection, curation, and access are central to all of these issues’’ (Dealing with Data. Challenges and Opportunities, Science, 2011, 692, 3).


In deze context heeft de kwaliteit van de gegevens een bijzondere betekenis. Volgens de OECD (2011) Quality Framework wordt de datakwaliteit gedefinieerd als “geschiktheid voor gebruik” t.o.v. de noden van de gebruiker, die de volgende zeven dimensies hebben:

  • Relevantie (in welke mate dient de context van het gebruik duidelijk te zijn),
  • Nauwkeurigheid (beschrijven de gegevens de eigenschappen die ze bedoeld zijn te meten),
  • Geloofwaardigheid (vertrouwen van de gebruiker in het dataproduct en de objectiviteit van de gegevens),
  • Actualiteit (tijd tussen beschikbaarheid van gegevens en de fenomenen die ze weergeven),
  • Beschikbaarheid (hoe snel gegevens kunnen gelokaliseerd worden en toegankelijk zijn),
  • Interpreteerbaarheid (hoe gemakkelijk de gebruiker gegevens kan verstaan, juist gebruiken en analyseren),
  • Coherentie (in welke mate gegevens met elkaar logisch verbonden en onderling consistent zijn).

Hieruit resulteert dat gegevens context-afhankelijk zijn en daarom de kwaliteit van een enkele dataset niet voldoende is. De verbinding tussen verschillende datasets is evenzo belangrijk. Inderdaad, de heterogeniteit van gegevens in de evaluatie van onderzoek en innovatie mag niet worden onderschat (Luwel, 2015). De compatibiliteit, uitwisselbaarheid en connectiviteit van een dataset met gerelateerde gegevens zijn fundamentele aspecten die eveneens in aanmerking moeten genomen worden.