Dat lijkt wellicht een open deur, ware het niet dat kunstmatige intelligentie vaak wordt besproken alsof het vooral draait om steeds grotere modellen, krachtigere chips en slimmer opgebouwde software. Maar volgens Gaël Varoquaux, CSO van Probabl en onderzoeksdirecteur bij Inria (het Franse nationale instituut voor research in digital science en technologie), mist die benadering een belangrijk punt. AI mag dan het zichtbare eindproduct zijn, de werkelijke basis ligt in data science. Niet als programmeerdiscipline, maar als statistische manier van denken.
Die boodschap is relevant nu steeds meer organisaties AI-systemen in productie willen nemen. Generatieve AI, taalmodellen en AI-agents beloven processen te automatiseren, beslissingen te ondersteunen en kenniswerk te versnellen. Tegelijk lopen bedrijven en overheden tegen dezelfde vraag aan: wanneer is een AI-uitkomst eigenlijk betrouwbaar genoeg om ernaar te handelen? Volgens Varoquaux ligt het antwoord niet alleen in betere modellen, maar vooral in beter begrip van data, onzekerheid, bias en validatie.
Data science is niet hetzelfde als AI, stelt hij vast. Het is eerder de voedingsbodem waaruit moderne AI is ontstaan. De kern van data science is het gebruiken van data om betere modellen en inzichten te bouwen. Dat gebeurt in uiteenlopende toepassingen: van gezondheidszorg en logistiek tot productieoptimalisatie, fraudedetectie, aanbevelingssystemen en cybersecurity. Dezelfde manier van werken heeft ook de basis gelegd voor de huidige generatie beeld- en taalmodellen.
Data science ≠ software engineering
Toch wordt data science in organisaties nog vaak behandeld als een vorm van software engineering. Dat is volgens Varoquaux te beperkt. Natuurlijk speelt code een rol, maar de echte moeilijkheid zit ergens anders: in statistisch redeneren. Welke data zijn verzameld? Wat ontbreekt er? Waar zit vertekening? Kan een model generaliseren naar nieuwe situaties? En ondersteunen de voorspellingen daadwerkelijk de beslissingen waarvoor ze worden gebruikt?
Die vragen worden belangrijker naarmate AI-systemen zelfstandiger gaan opereren. Zeker bij AI-agents, die niet alleen informatie geven maar ook acties mogen uitvoeren, kunnen fouten direct gevolgen hebben. Een model dat overtuigend klinkt maar op de verkeerde data is gebaseerd, kan dan leiden tot verkeerde adviezen, verkeerde prioriteiten of zelfs ongewenste automatische beslissingen.
AI-uitkomsten zijn probabilistisch
Een centraal probleem is dat AI-uitkomsten probabilistisch zijn. Een taalmodel geeft geen antwoord zoals een klassieke regelgebaseerde applicatie dat doet. Het herkent patronen, legt verbanden en produceert een waarschijnlijke uitkomst op basis van enorme hoeveelheden gegevens. Dat werkt indrukwekkend goed bij veel taken, maar het betekent ook dat onzekerheid nooit volledig verdwijnt.
Daarom wijst Varoquaux op het belang van kalibratie: als een model aangeeft voor 80 procent zeker te zijn, zou het in ongeveer 80 procent van de gevallen gelijk moeten hebben. In de praktijk is dat echter lastiger dan het lijkt. Een model kan gemiddeld redelijk goed gekalibreerd zijn, terwijl het voor specifieke groepen of onderwerpen grote fouten maakt. Bijvoorbeeld omdat bepaalde talen, landen, personen of kennisdomeinen veel beter vertegenwoordigd zijn in de trainingsdata dan andere.
Dat maakt AI-fouten niet alleen technisch, maar ook sociaal en organisatorisch relevant. Een model kan bij bekende onderwerpen betrouwbaar lijken, maar bij minder goed gedocumenteerde onderwerpen met evenveel zelfvertrouwen verkeerde informatie geven. Voor bedrijven en overheden is dat een belangrijk aandachtspunt. Zeker wanneer AI wordt gebruikt in domeinen waar beslissingen impact hebben op mensen, processen of middelen, is gemiddelde nauwkeurigheid onvoldoende. Organisaties moeten weten waar en voor wie een model faalt.
Zwakke plekken zichtbaar maken
Data science biedt de methoden om die zwakke plekken zichtbaar te maken, schrijft Varoquaux. Het helpt onderscheid te maken tussen fouten die te verbeteren zijn en onzekerheid die inherent is aan de data. Sommige verschijnselen zijn nu eenmaal moeilijk of onmogelijk exact te voorspellen op basis van de beschikbare gegevens. Andere fouten wijzen juist op tekortkomingen in het model, de dataset of de manier waarop data zijn verzameld.
Dat onderscheid is cruciaal. Meer data of een groter model is niet altijd de oplossing. Als de beschikbare data niet representatief zijn voor de situatie waarin het model wordt gebruikt, kan opschalen het probleem zelfs verhullen. Een model kan dan steeds beter worden in het reproduceren van een vertekend beeld van de werkelijkheid. Vooral selectie-bias is daarbij gevaarlijk,meent Varoquaux: de dataset lijkt rijk, maar is ontstaan via een proces dat de relatie tussen input en uitkomst verstoort.
Een bekend voorbeeld komt uit de zorg. Een model dat patiëntuitkomsten voorspelt op basis van historische data kan leren dat behandelde patiënten slechtere uitkomsten hebben. Dat is op zichzelf logisch, omdat juist zieke patiënten vaker behandeld worden. Maar als zo’n model vervolgens wordt gebruikt om behandelbeslissingen te ondersteunen, kan het de verkeerde conclusie trekken: niet behandelen lijkt statistisch gunstiger, terwijl behandeling juist nodig kan zijn. In zo’n geval is niet alleen voorspelling nodig, maar causaal redeneren.
Patronen herkennen én beslissingen sturen?
Daar raakt data science aan een van de grootste uitdagingen voor enterprise AI. Veel organisaties willen AI niet alleen inzetten om patronen te herkennen, maar ook om beslissingen te sturen. Dan is het niet genoeg om te weten wat ‑waarschijnlijk- gebeurt. De vraag wordt wat er gebeurt als een organisatie ingrijpt. Welke actie verandert de uitkomst? En is dat effect echt af te leiden uit de beschikbare data? Dat zijn geen eenvoudige machine learning-vragen, maar klassieke datascience-vragen waarin statistiek, domeinkennis en validatie samenkomen.
Ook validatie blijft een belangrijk knelpunt, meent Varoquaux. De basisregel is eenvoudig: test een model op data waarop het niet is getraind. In de praktijk gaat dat vaak mis. Data leakage, waarbij informatie uit de testset onbedoeld in de trainingsfase terechtkomt, kan prestaties kunstmatig opblazen. Een model lijkt dan sterk in ontwikkeling, maar valt tegen zodra het in productie wordt gebruikt.
Daar komt bij dat de gekozen meetwaarde grote invloed heeft op het beeld van succes. Accuracy is eenvoudig te begrijpen, maar kan misleidend zijn bij scheve datasets. Een fraudemodel kan bijvoorbeeld een hoge nauwkeurigheid halen door bijna alles als niet-fraude te classificeren, terwijl het zakelijk weinig waarde toevoegt. Goede evaluatie moet daarom aansluiten op de werkelijke toepassing: kosten, risico’s, beslissingswaarde en impact.
Aandacht verbreden
Voor AI in productie betekent dit dat organisaties hun aandacht moeten verbreden. Het bouwen of inkopen van een model is slechts één onderdeel van het proces. Minstens zo belangrijk zijn datakwaliteit, representativiteit, onzekerheidsinschatting, evaluatiemethodiek en monitoring na ingebruikname. Zeker bij toepassingen in industrie, zorg, finance, overheid en logistiek zijn die vragen bepalend voor de vraag of AI betrouwbaar genoeg is.
De boodschap van Varoquaux past daarmee in een bredere verschuiving in de AI-markt. Na de eerste golf van enthousiasme over generatieve AI groeit de aandacht voor productie, governance en betrouwbaarheid. Organisaties willen niet alleen experimenteren met chatbots of copilots, maar AI-systemen inzetten in echte processen. Juist daar blijkt dat statistisch denken geen academisch detail is, maar een praktische voorwaarde.
Data science is dus niet achterhaald door de opkomst van grote AI-modellen. Integendeel, stelt Varoquaux: de discipline wordt juist belangrijker. Naarmate AI krachtiger wordt en dichter op besluitvorming komt te zitten, neemt de noodzaak toe om beter te begrijpen wat data wel en niet kunnen zeggen. De toekomst van AI draait daardoor niet alleen om schaal, automatisering en modelprestaties, maar ook om de vraag of organisaties zorgvuldig genoeg redeneren over de data waarop hun systemen steunen.
Wie AI betrouwbaar wil maken, moet daarom terug naar de basis, aldus Varoquaux in zijn blog post. Niet omdat AI minder indrukwekkend is dan vaak wordt voorgesteld, maar omdat de waarde ervan uiteindelijk staat of valt met de kwaliteit van de datawetenschappelijke onderbouwing. Data science is misschien niet hetzelfde als AI, maar zonder data science blijft AI een systeem dat overtuigend kan klinken zonder dat duidelijk is wanneer het gelijk heeft.





0 Reacties