We ontmoeten haar in hartje Amsterdam, waar Marleen Stikker (1962) met haar Waag Society sinds 1994 de digitalisering van de samenleving actief begeleidt met onderzoek en allerlei initiatieven. Ze herinnert zich de obscure zaaltjes met internetactivisten uit haar beginjaren. Nu adviseert Stikker de policy strategy group van de Europese Commissie en bezoekt ze grote conferenties met beleidsmakers, onderzoekers en ja, ook nog steeds activisten. Marleen Stikker zet zich in voor een open toegang tot internet en voor transparantie in de omgang met data. We beginnen ons gesprek bij de basale vragen over het wat en hoe van big data.
Wat zijn big data?
“Big data is een verzamelbegrip voor alles wat ‘gedataficeerd’ wordt. Alle informatie kan worden omgezet in digitale data en de datasets die daarmee ontstaan kun je weer combineren. Als je heel veel data verzamelt, kun je inzichten verkrijgen die je anders niet hebt. Je kunt bijvoorbeeld patronen vinden en voorspellingen doen.”
Wie verzamelt die data?
“Iedereen, dat is het spannende: de wetenschap, bedrijven, adviesbureaus, overheden en tegenbewegingen. Er zijn datasets waarvan we niet weten dat ze worden verzameld of waar we zelden van horen, zoals die van de veiligheidsdienst. Mede dankzij Edward Snowden krijgen we daar iets meer zicht op. De grootste verzamelaars zijn natuurlijk de Googles van deze wereld, maar vlak ook bedrijven als Uber en Airbnb niet uit. De waarde van deze groep technologische Silicon Valley-bedrijven zit in de data en de bijbehorende algoritmes.”
Dat is ook een cruciale term, algoritme. Wat is dat?
“Een algoritme is een instructie, een reeks codes die je van tevoren programmeert volgens de regel 'als dit, dan dat'. Dat is de basis van elke software. In die regel staat ook hoe je data moet interpreteren. Algoritmes worden geschreven, ontworpen. Die komen niet van god, die zijn man made. Veel mensen beschouwen technologie en ICT als een ´harde wetenschap´, die ontdekt wat al bestond: een natuurwet. Maar alles in relatie tot ICT creëren wij als mensen zelf. Ik noem het ook wel ontwerpende wetenschap.”
Algoritmes zijn dus sturingsmechanismen bij het verzamelen en ordenen van data?
“Data zelf zijn natuurlijk ook al interpretatie. Als je bijvoorbeeld een verzameling mensen demografisch indeelt, dan heb je die categorieën zelf aangebracht. Allerlei niet meetbare zaken laat je buiten beschouwing. Als je iemand vraagt: ben je een man of een vrouw, dan zijn dat de categorieën waartoe je je moet verhouden. Al het andere telt niet mee. Onder de keuze voor wat we wel of niet meten, ligt een heel wereldbeeld. Dergelijke veronderstellingen met betrekking tot data worden eigenlijk nooit besproken. Big data en alles wat ermee samenhangt worden doorgaans gepresenteerd als een ongecompliceerde oplossing: ‘We gaan dingen veiliger, inzichtelijker, makkelijker, duurzamer, sneller én leuker maken’. Waar is dat optimisme eigenlijk op gebaseerd?”
Misschien op de gedachte dat technologie een neutraal instrument is dat je op verschillende manieren kunt inzetten?
“De eerste stap is accepteren dat technologie niet neutraal is. Dat is lastig, want dat opent een enorm gebied met vragen. Veel mensen willen gewoon leuke dingen doen: apps maken, een beetje opschieten en de wereld redden met big data. En je kan er inderdaad van alles mee: je kunt er nieuwe inzichten mee krijgen waardoor we misschien beter gaan handelen, maar je kan met big data mensen ook manipuleren.”
We hebben sinds de opkomst van de wetenschap altijd al zaken gemeten, maar sinds een aantal jaar spreken we ineens over big data. Wat maakt big data nou big?
“Door de toenemende groei van de dataverzamelingen is er een kantelpunt bereikt. We steken niet langer een metertje in de grond, om de resultaten op de computer te verwerken; we stoppen nu sensors in de grond die voor een permanente stroom data zorgen. Ook voor sociale media geldt: het is een stroom van data. En al die stromen kunnen ook met elkaar gecombineerd worden. Dat is het tweede element. Een bank kijkt niet meer alleen naar je transacties, maar combineert die ook met data uit je sociale gedrag. Ten derde zijn er businessmodellen rondom het interpreteren van data ontstaan. Dit alles samen maakt dat we van big data spreken. Vooral over de verdienmodellen maken mensen zich zorgen: men voelt dat men er geen vat meer op heeft.”
Het Big Brother-gevoel.
“Er is al lang niet meer één Big Brother, er zijn meerdere Big Brothers en ook nog verscheidene little sisters, en we weten niet of die samenwerken. Wat we wel weten, en dat is een vierde dimensie, is dat alle apparaten data onderscheppen. Sinds Snowden weten we dat de waarschuwing van hackers geen complotdenken was: elke telefoon, camera, of wat voor apparaat of applicatie ook, verstuurt standaard data naar de bedrijven die ze gemaakt hebben. Het probleem is dat de bedrijven niet transparant zijn over de codes, de algoritmes. Als bedrijven ons niet willen vertellen wat er onder de motorkap gebeurt, dan kunnen we ze alleen maar wantrouwen.”