Onderzoek: ‘Nederlands AI-model verstaat accenten tot 30% beter dan concurrentie’

Onderzoek: ‘Nederlands AI-model verstaat accenten tot 30% beter dan concurrentie’

Wie met een Limburgs of Gronings accent spreekt, wordt door de gang­bare spraak­tech­no­logie slechter verstaan. Murmel, een nieuw spraak­model afkom­stig uit Neder­land, verkleint dat verschil aanzien­lijk. Zo blijkt uit onder­zoek van de ontwik­ke­laar waarin zes veel­ge­bruikte open source-spraak­mo­dellen op negen uur Tweede Kamer-audio werden getest. Bij Groningse spre­kers maakt het Neder­landse spraak­model tot 30 procent minder fouten dan het best scorende alter­na­tief.

Nederlands als bijzaak

De meeste spraak­mo­dellen op de markt zijn primair getraind op Engels­ta­lige data. Neder­lands wordt als extra taal toege­voegd, maar krijgt aanzien­lijk minder trai­nings­data dan Engels. Het gevolg: regi­o­nale accenten en niet-stan­daard uitspraak worden slecht herkend. Murmel is getraind op duizenden uren open­baar beschik­bare Neder­landse spraak.

Voor het onder­zoek is negen uur aan Kamer­de­batten geana­ly­seerd, met spre­kers uit elf provin­cies. Murmel scoort in alle elf het laagste fouten­per­cen­tage. Bij spre­kers geboren in Limburg behaalt het model 14,6 procent fouten, waar de alter­na­tieven tussen de 17,9 en 23,9 procent scoren. Spre­kers geboren in Groningen worden door Murmel herkend met 6,4 procent fouten, tegen­over 9,3 procent bij het best scorende alter­na­tief, een verbe­te­ring van circa 30 procent.

In de prak­tijk zorgt dit ervoor dat spraak met een accent veel nauw­keu­riger om te zetten is naar tekst. Waar spre­kers geboren in Limburg bij andere modellen gemid­deld één op de vijf woorden fout ging, is dat bij Murmel één op de zeven. Daar­onder vallen ook stop­woorden en onaf­ge­maakte woorden zoals ‘eh’ en ‘uh’.

Sprekers geboren buiten Nederland beter verstaan

Niet alleen regi­o­nale accenten scoren beter. Bij Kamer­leden die buiten Neder­land zijn geboren, behaalt Murmel een fouten­per­cen­tage van 12,4 procent. De alter­na­tieven zitten tussen de 16,1 en 20,7 procent.

“Spraak­tech­no­logie is pas echt inclu­sief als die iedereen verstaat, ook mensen die niet perfect te verstaan zijn voor een AI-model. Dat geldt voor iemand uit Maas­tricht net zo goed als voor iemand die niet in Neder­land is geboren, voor iemand die op leef­tijd of jong is, of op een andere manier niet over­een­komt met de norm­groep”, zegt dr. Maarten Sukel, oprichter van The AI Factory en ontwik­ke­laar van Murmel.

Ingezet van raadszitting tot radiofragment

Murmel wordt gebruikt voor het uitschrijven van verga­de­ringen, raads­zit­tingen en tele­foon­ge­sprekken, maar ook voor het vast­leggen van gesprekken in de zorg en het door­zoek­baar maken van radio- en tele­vi­sie­ar­chieven. Het model telt inmid­dels circa 200 gebrui­kers, van over­heden en zorg­in­stel­lingen tot media­be­drijven en parti­cu­lieren.

“Tijdens raads­ver­ga­de­ringen wordt veel rele­vante, lokale infor­matie besproken die voor burgers slecht toegan­ke­lijk is. Waar in de lande­lijke poli­tiek gere­geld jour­na­listen en andere belang­stel­lenden meeluis­teren, en zo rele­vante infor­matie naar buiten kunnen brengen, gebeurt dat op gemeen­te­lijk niveau veel minder. Accu­rate spraak­her­ken­ning is dan een belang­rijke voor­waarde om die infor­matie wél effec­tief bij lokale burgers te kunnen krijgen”, zegt dr. David Graus, univer­si­tair docent aan de Univer­si­teit van Amsterdam. Graus zet Murmel inmid­dels samen met studenten in om gemeen­te­raads­ver­ga­de­ringen te trans­cri­beren.

Rekenkracht verwarmt verzorgingshuis in Zaandam

Murmel draait op Neder­landse servers, deels bij hosting­partij Leaf­cloud. De GPU-servers staan onder meer in een verzor­gings­huis in Zaandam, waar de rest­warmte wordt ingezet om warm water te leveren aan bewo­ners. Sinds begin april 2026 leverde de reken­kracht achter Murmel circa 297 kWh aan warmte, verdrong 34 kubieke meter aardgas en bespaarde 250 kilo­gram CO₂ ten opzichte van een gemid­deld Euro­pees data­center.

Gebouwd zonder extern kapitaal

Murmel is zonder externe inves­teer­ders ontwik­keld door Sukel, gepro­mo­veerd in Machine Learning aan de Univer­si­teit van Amsterdam. Het model is getraind op duizenden uren Neder­landse spraak­data. Alle data wordt uitslui­tend verwerkt en opge­slagen op Neder­landse servers. Audio verlaat het land niet en hoeft niet opge­slagen te worden. Het model voldoet aan de AVG zonder afhan­ke­lijk­heid van Ameri­kaanse cloud­in­fra­struc­tuur. Murmel is onlangs opge­nomen in het Tech Sove­reignty Cata­logue van de Euro­pean DIGITAL SME Alli­ance, een Euro­pees register van digi­tale oplos­singen die bijdragen aan tech­no­lo­gi­sche onaf­han­ke­lijk­heid.

Photo by Giu Vicente on Unsplash

redactie@ai-visie

19 mei 2026 - 09:05

WEERGAVEN

0 Reacties

Gerelateerde berichten

AI-model Mythos markeert kantelpunt: cyberaanvallen worden sneller, schaalbaarder en toegankelijker

AI-model Mythos markeert kantelpunt: cyberaanvallen worden sneller, schaalbaarder en toegankelijker

Solita wordt een van de eerste Europese spelers die Claude AI-modellen rechtstreeks aanbiedt

Solita wordt een van de eerste Europese spelers die Claude AI-modellen rechtstreeks aanbiedt

Hexaware breidt Agentverse uit om AI beter te kunnen opschalen

Hexaware breidt Agentverse uit om AI beter te kunnen opschalen

Nog geen gerelateerde berichten...

0 Reactie(s)

0 Reacties

Plaats Een Reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Share This