Waarom AI steeds vaker ontspoort op iets fundamenteels: wat we “data” noemen
Nieuws
04-02-2026
Emily M. Bender
AI-modellen in pricing, forecasting en risicomodellering gebruiken steeds vaker datasets waarvan relevantie, aannames, vertekeningen en geaccepteerde risico’s onvoldoende duidelijk of expliciet gedocumenteerd zijn.
Het klinkt efficiënt. Praktisch. Business-proof. Maar het is ook intellectueel lui. En risicovol — juist voor organisaties die steeds meer beslissingen laten ondersteunen door modellen.
In echte wetenschap bestaat “data” niet zomaar
Bender herinnert ons eraan hoe dat in de taalkunde werkt. Een uiting wordt pas data als zij is verzameld binnen een afgebakende setting, geannoteerd volgens expliciete aannames, gekoppeld aan een concrete onderzoeksvraag en interpreteerbaar binnen een theoretisch kader.
Dat geldt net zo goed in natuurkunde, scheikunde en biomedisch onderzoek. Een logbestand, een meetreeks of een simulatie-uitkomst is geen data op zichzelf. Het wordt pas data als duidelijk is:
- welk systeem wordt geobserveerd
- onder welke omstandigheden
- met welk protocol
- en met welk doel
Zonder die context blijft er geen data over, maar ruis met opslagcapaciteit.
[....]