Steeds vaker nemen AI-vertaalapps de rol van tolk over in ziekenhuizen. Maar wat gebeurt er wanneer een systeem één medisch begrip verkeerd vertaalt, en niemand die fout opmerkt?
Het is net na middernacht. De spoedarts schuift zijn stoel dichterbij. Aisha zit naast haar dochtertje Nour, die versuft op het ziekenhuisbed ligt. Nog geen vier maanden geleden vluchtte Aisha met haar drie kinderen uit Gaza. Via Egypte en Turkije kwam ze na een lange reis uiteindelijk in België terecht. Vandaag verblijven ze in een opvangcentrum van het Rode Kruis aan de rand van een Vlaamse stad.
Aisha spreekt Palestijns Arabisch, een beetje Engels, maar geen Nederlands. Tussen haar en de arts licht een tablet op. Op dit uur is geen professionele tolk beschikbaar.
De arts kijkt opnieuw naar Nour. Ze reageert nauwelijks op haar omgeving, haar ademhaling klinkt diep en zwaar. Hij activeert Arabisch in de vertaalsoftware op de tablet, tikt op het microfoonicoon en zegt tegen Aisha in het Nederlands:
“Hoe gaat het met u en uw dochtertje?”
Het lijkt alsof de tablet de woorden van de arts rechtstreeks omzet naar Arabisch. In werkelijkheid gebeurt dat stap voor stap. Eerst luistert de software naar wat de arts zegt en zet die woorden om in geschreven tekst. Daarna voorspelt een taalmodel wat de zin betekent en vertaalt die naar geschreven Arabisch. Ten slotte leest een computergestuurde stem de vertaling voor aan Aisha.
Alles gebeurt in enkele seconden, waardoor het realtime lijkt. Maar in werkelijkheid doorloopt AI een hele ketting van stappen waarin op elk moment informatie verloren kan gaan, verkeerd geïnterpreteerd kan worden of automatisch “aangevuld” wordt.
Aisha fronst. Ze aarzelt even voordat ze iets terugzegt, en snel, angstig antwoordt ze in het Palestijns Arabisch:
“Ze heeft gisterenavond pasta gegeten. Daarna begon ze te braken. Eerst één keer, toen nog eens. Nu blijft ze overgeven. Ze heeft niets meer gegeten. Ze wil niet drinken. Ze zegt dat haar buik pijn doet.”
Aisha kijkt naar haar dochter.
“Ze wordt steeds slaperiger. Thuis kreeg ik haar bijna niet meer wakker. Ze is zichzelf niet meer.”
De software luistert. Op het scherm verschijnen woorden, ze verdwijnen weer en worden vervangen door andere.
Dan begint Aisha haastig in haar handtas te zoeken.
Ze haalt een blauwe insulinepen tevoorschijn en legt die voor de arts neer.
De arts kijkt op.
“Nour heeft diabetes?”
Aisha knikt.
“Diabetes type 1. Ze heeft vanavond nog insuline gekregen bij het eten.”
De arts buigt zich naar voren.
“Welke insuline heeft ze gekregen?”
Aisha probeert uit te leggen dat Nour haar gewone insulinebolus kreeg: de dosis insuline die ze nodig heeft bij een maaltijd.
De tablet vertaalt.
Op het scherm verschijnt:
“Ze kreeg een snelle dosis insuline”.
Aisha merkt de vertaalfout niet op. Ze begrijpt geen Nederlands en vertrouwt volledig op wat de app voorleest.
Het is niet wat ze zei.
De arts voelt zijn aandacht verscherpen. Hij kijkt nogmaals naar het meisje.
Kreeg ze misschien al extra insuline? Dan zou haar bloedsuiker gevaarlijk laag kunnen zijn. Een kind kan dan beginnen trillen, zweten, verward raken of het bewustzijn verliezen.
Maar kreeg ze juist te weinig insuline, dan kan haar bloedsuiker gevaarlijk stijgen. Zonder snelle behandeling kan Nour steeds verder achteruitgaan, in coma raken en uiteindelijk overlijden.
Voor de arts maakt het een wereld van verschil welk van beide scenario's zich afspeelt.
Tijdens een evaluatie van Arabische AI-vertaling in een Vlaams ziekenhuis zagen we als taalkundigen en onderzoekers deze fout verschijnen. De rest van het gesprek verliep grotendeels vlot. De toon was warm. Veel uitleg klopte. Net daardoor viel de fout ook voor de arts niet op. Voor de arts klonk het medisch plausibel.
Een insulinebolus is geen willekeurige “snelle dosis”. Het is een berekende dosis bij een maaltijd of bij een te hoge bloedsuiker. De hoeveelheid hangt af van wat iemand gegeten heeft en van de bloedsuiker op dat moment. Dat verschil in vertaling lijkt klein, tot je op spoed staat.
Dat maakt AI-vertaling in de zorg zo verraderlijk. Niet omdat de technologie voortdurend spectaculaire fouten maakt, maar omdat kleine fouten in medische termen grote gevolgen kunnen hebben.
Digitale vertaaltools zijn intussen ingeburgerd in de zorg. In Oost-Vlaanderen gebruikt ongeveer drie kwart van de bevraagde zorgverleners ze minstens één keer per maand. In West-Vlaanderen ongeveer de helft. Vandaag kan bijna iedereen een vertaalapp downloaden. Tegelijk proberen steeds meer gespecialiseerde AI-bedrijven ziekenhuizen te overtuigen van hun dure medisch getrainde vertaalsystemen. De belofte is aantrekkelijk: sneller communiceren, minder wachttijden en meer meertalige zorg.
Alleen bestaan er voorlopig geen duidelijke regels over wanneer zulke systemen veilig ingezet kunnen worden, welke kwaliteit ze moeten halen of wanneer een professionele tolk noodzakelijk blijft. Voor nieuwe geneesmiddelen en medische toestellen gelden strenge controles voordat ze op de markt komen. Voor AI-vertaaltools, die mee bepalen hoe diagnoses, behandelingen en medicatie-instructies begrepen worden, ontbreken zulke kwaliteitskaders in Vlaanderen nog volledig.
Dat heeft gevolgen voor echte mensen. Niet elke patiënt krijgt dezelfde kwaliteit van vertaling. AI-systemen presteren doorgaans beter voor talen waarvoor veel digitale data beschikbaar zijn dan voor dialecten of minder goed vertegenwoordigde talen. AI-systemen werken beter voor Engels, Frans en Spaans, de zogenaamde high-resource languages: er bestaan enorme hoeveelheden digitale teksten, spraakopnames en vertaaldata waarop AI kan worden getraind.
Voor Arabisch ligt dat ingewikkelder. Er is veel digitaal materiaal beschikbaar in Modern Standaardarabisch, maar Aisha spreekt niet hetzelfde Arabisch als een nieuwslezer op televisie. AI-systemen moeten daarom niet alleen herkennen dat iemand Arabisch spreekt, maar ook begrijpen welke variant van het Arabisch ze horen. Dat noemen onderzoekers dialect sensitivity: de gevoeligheid van AI voor verschillen in uitspraak, woordenschat en grammatica tussen dialecten.
Daardoor ontstaat het risico op wat onderzoekers een two-tier system noemen: een zorgsysteem met twee snelheden, waarin sommige patiënten toegang krijgen tot betere communicatie dan andere. Dat betekent niet dat menselijke tolken de perfecte oplossing zijn. Ook zij maken fouten, en vaak zijn ze niet beschikbaar. De vraag is dus niet óf AI een plaats heeft in de zorg, maar wanneer we erop kunnen vertrouwen - en of elke patiënt dat in gelijke mate kan.
Nour mocht diezelfde nacht weer naar huis. De arts had de situatie correct ingeschat. Het verkeerd vertaalde woord veranderde niets aan de afloop.
Deze keer niet.