Wetenschapsblog

Computersimulaties laten zien hoe taal versimpelt

Doctoraatsstudent Peter Dekker combineert moeiteloos taalwetenschap en artificiële intelligentie. Met computersimulaties bootst hij talen na. Wat gebeurt er wanneer die talen met elkaar in contact komen? En worden we ‘simpel’ van onze buren?

Taal verandert constant. Het woord ellende betekende in de middeleeuwen bijvoorbeeld ‘verblijf in een ander land’, terwijl het nu een heel andere betekenis heeft. Maar wat drijft taalverandering? Dat onderzoek ik in mijn doctoraat, aan het Artificial Intelligence (AI) Lab van de VUB. Taalonderzoek en artificiële intelligentie? Jazeker, ik gebruik computersimulaties, om na te spelen hoe mensen met elkaar praten. Op die manier hoeven we geen honderd jaar te wachten, om te zien hoe de taal verandert. Een computer kan op korte tijd duizenden gesprekken simuleren, die ons leren hoe taal in de loop van de tijd evolueert. Benieuwd hoe dat in zijn werk gaat?

Ik spreek, jij spreek, hij spreek

Om een blik te krijgen op taalverandering in het algemeen, zoom ik in op specifieke gevallen. Het lukt beter om een globaal beeld te krijgen van taalverandering, als je in detail bestudeert hoe divers verschillende talen in de wereld kunnen zijn. Denk bijvoorbeeld aan een taal die wordt gesproken in een bergdal, afgesloten van de buitenwereld, of een taal met verschillende toonhoogtes. Op dit moment onderzoek ik samen met onderzoekers van de Universiteit Leiden het Alorees, een taal die gesproken wordt op twee kleine eilanden in het oosten van Indonesië: Alor en Pantar.

Foto: omgeving van de Alor-Pantar eilanden. (Marian Klamer)
Foto: kust op het eilandje Kangge, bij het eiland Pantar. Hier wordt Alorees gesproken. (Yunus Sulistyono)
Foto: taalkundige Yunus Sulistyono maakt opnames van sprekers van het Alorees op het eiland Pantar (Yunus Sulistyono)

Het opvallende aan Alorees is dat het bijna zijn hele systeem van woorduitgangen heeft verloren. Dat wordt duidelijk als we kijken naar de Alorese werkwoorden. Sommige talen, zoals het Italiaans, hebben voor elke persoon (ik, jij, hij, wij, jullie en zij) een unieke uitgang. In het Nederlands zijn er drie verschillende uitgangen (stam, stam+t, stam+en), dus geen unieke uitgang per spreker: “jij spreekt” en “hij spreekt” kan je op basis van het werkwoord alleen niet onderscheiden. Dat systeem van uitgangen noemen we in de taalkunde morfologie. Terug naar het Alorees, daar zijn (voor bijna alle werkwoorden) alle uitgangen weggevallen: 

Voor elke persoon wordt alleen de stam van het werkwoord gebruikt. Daar zeg je in feite dus: “ik spreek”, “jij spreek”, “hij spreek”. Gek genoeg heeft de meest verwante taal aan het Alorees, het Lamaholot, wél alle werkwoordsuitgangen behouden. Hoe is dat mogelijk?

"Aleng Keleng"

met Jakobus | over drie mensen die een boom willen beklimmen

Ben je benieuwd hoe Alorees klinkt? Hier kan je een kort audiofragment beluisteren uit een lokaal volksverhaal, vrij verteld door Jakobus (bewoner van het eiland Pantar). Opname: Francesca Moro.

Word je 'simpel' van contact met je buren?

Taalkundigen denken dat het Alorees zijn morfologie is verloren, doordat het contact heeft gehad met andere talen op de twee eilanden, de zogeheten Alor-Pantar-talen, die bij een heel andere taalfamilie horen.

Als je je als volwassene probeert uit te drukken in een vreemde taal, bestaat de kans dat je die taal ‘versimpelt’. Je gooit bijvoorbeeld het ingewikkelde systeem van uitgangen overboord. Dat gebeurde vermoedelijk ook bij Alor-Pantar-sprekers die Alorees leerden om handel te kunnen voeren en huwelijken te kunnen sluiten met hun buren aan de kust. Op één of andere manier heeft de vereenvoudiging van die handeldrijvende taalleerders zich dan verspreid naar de bevolking die Alorees als moedertaal sprak.

" Als je je als volwassene probeert uit te drukken in een vreemde taal, bestaat de kans dat je die taal 'versimpelt' "

Alorees is zo’n interessante case study, omdat het gaat om een afgebakend gebied (de eilanden Alor en Pantar) waar Alorees in contact is geweest met andere talen. De naaste verwanten van Alorees (zoals het Lamaholot) worden op andere eilanden gesproken, verder in het westen, waar er geen contact is met talen van andere families.

Foto: Kaart met rechts de eilanden Pantar en Alor: Alorees wordt er enkel aan de kusten gesproken (blauwe gebieden), op de rest van de eilanden worden Alor-Pantar-talen gesproken die tot een andere taalfamilie behoren (rode gebieden). Auteur: Marian Klamer.

Simuleren in een computermodel

Hoe leidt volwassen taalcontact juist tot vereenvoudiging van morfologie? En hoe onderzoek je zoiets? Je kan niet zomaar een situatie mét en zonder taalcontact vergelijken. Je kan de geschiedenis van de eilanden Alor en Pantar, met veel taalcontact, niet terugspoelen, en opnieuw afspelen met minder taalcontact. Ook zou het te ingrijpend zijn om inwoners van de eilanden te vragen nu iets anders te doen in hun taalgebruik of dagelijks leven, om het effect ervan te onderzoeken. Taalexperimenten met proefpersonen in het lab zijn interessant, maar staan dan weer verder af van het taalgebruik in de echte wereld.

Daarom gebruik ik computersimulaties, waarin taal in de meest basale vorm wordt nagespeeld: in de simulatie wisselt een groep sprekers onderling woorden uit. Met die woorden drukken ze telkens een bepaald concept of een bepaalde betekenis uit: ze gebruiken bijvoorbeeld het woord “appel” om te verwijzen naar een appel.

In mijn model laat ik de sprekers werkwoordsvormen en -uitgangen uitwisselen, waarbij degene die luistert moet bepalen welk werkwoord en welke persoon wordt bedoeld. Je hoort bijvoorbeeld “loopt” en moet bepalen dat dit het werkwoord “lopen” is, in de 2de persoon enkelvoud (jij) of de 3de persoon enkelvoud (hij).

We kunnen de geschiedenis misschien niet terugdraaien, maar wel simuleren! Daarvoor gebruik ik het Lamaholot. Het is een zustertaal van het Alorees en lijkt er erg sterk op, maar het heeft geen morfologische vereenvoudiging ondergaan en heeft nog al zijn verschillende werkwoordsuitgangen. Je kan het Lamaholot dus zien als de ‘beginstaat’ van het Alorees.

Ik voer twee experimenten uit. In het eerste experiment zijn alle gesprekspartners moedertaalsprekers van het Lamaholot. Zij hebben dus aan het begin van het experiment al de werkwoordsuitgangen perfect in hun hoofd. In een tweede experiment zijn er naast moedertaalsprekers ook taalleerders, die nog helemaal geen werkwoordsuitgangen in hun hoofd hebben, en dus alles moeten leren door te luisteren en te praten. Als in het tweede experiment (met taalleerders), de werkwoordsuitgangen veel meer wegvallen dan in het eerste experiment (zonder taalleerders), vormt dat bewijs dat het leren van een taal kan leiden tot vereenvoudiging van de morfologie.

Foto: Peter Dekker (auteur van dit artikel) aan het werk in zijn thuiskantoor.

Bij het ontwikkelen van zo’n model is de vraag wat het mechanisme is dat taalleerders onderscheidt van moedertaalsprekers. Zijn moedertaalsprekers misschien beter in het maken van veralgemeniseringen (als het “jij spreek”+t is, zal het ook wel “jij loop”+t zijn)? Kunnen taalleerders minder goed de verschillende varianten van een woord onthouden? Of is er geen verschil, maar passen de moedertaalsprekers zich aan aan de taalleerders? Zo zou het kunnen dat een moedertaalspreker in dat geval zelf ook vereenvoudigt (hij loop), of niet vereenvoudigt (hij loopt) maar wel extra traag en duidelijk probeert te spreken. Het zijn allemaal factoren die in een simulatie getest kunnen worden. Ik ben nog volop aan de slag met de experimenten, maar het is nu al duidelijk dat computersimulaties interessante nieuwe inzichten kunnen opleveren. Zeker wanneer ze worden gecombineerd met gedegen taalkundige kennis over het leren van taal, en het uitgebreide veldwerk dat al is gedaan om talen te documenteren. Computersimulaties kunnen taalkundigen in dat geval heel wat ellende besparen. (En ja, dat kon je in de middeleeuwen zelfs letterlijk nemen!)

Meer weten?
Een eerste schets van mijn computermodel van het Alorees is te vinden in een kort academisch artikel met mijn promotor Bart de Boer.
Veel van de data over het Alorees, en de theorie over morfologische simplificatie in die taal, zijn afkomstig van het de onderzoeksgroep van Marian Klamer, Universiteit Leiden. Deze artikels geven meer informatie:
  • Klamer, M. (2020). From Lamaholot to Alorese: Morphological loss in adult language contact. In D. Gil & A. Schapper (Eds.), Austronesian Undressed: How and why languages become isolating (pp. 339–367). John Benjamins Publishing Company. [download]
  • Moro, F. R. (2019). Loss of Morphology in Alorese (Austronesian): Simplification in Adult Language Contact. Journal of Language Contact, 12(2), 378–403. [download]
FOTO BOVENAAN: © YUNUS SULISTYONO
CARTOON: © WTNSCHP, SARAH LEURIDAN