Column

Pech met echo's

Sinds de coronacrisis is het een bekend probleem: echo’s en ruis op je videocall. Hoe ontstaan die, en hoe los je ze op?

Nog net voor de tweede lockdown verdedigde mijn doctoraatsstudent zijn proefschrift. Wat normaal een groot evenement moest zijn voor collega’s, familie en vrienden werd een videoconferentie met een zeer beperkt livepubliek. Voor de juryleden uit Engeland en Frankrijk was reizen uitgesloten, dus zij legden hem van een afstand op de rooster. Om het gebeuren toch wat cachet te geven presenteerde de student in de mooie promotiezaal van de VUB. De microfoon van zijn laptop capteerde zijn stem. So far so good. 

Maar ergens liep het mis. Om de jury goed te kunnen verstaan, had de student zijn computer verbonden met de luidsprekers in de zaal. Toen de vragen van de juryleden weergalmden, capteerde de microfoon van zijn laptop ook die stemmen. De jury hoorde zichzelf nu in de call met vertraging: een zogenoemde feedback loop creëerde een echo. Onder een brug kunnen echo’s van je geroep fijn zijn, maar in deze context was het effect zeer storend. 

De student kon het snel oplossen door de laptop los te koppelen. Maar waarom eigenlijk? Wanneer de stemmen van de jury uit de boxen van zijn laptop komen, registreert de microfoon die evengoed en kunnen de geluiden toch opnieuw de ether ingaan? En waarom stelt zich geen probleem wanneer je jouw telefoon op speaker zet, om handenvrij te bellen in de auto? 

Een welkom geschenk in tijden van lockdown is een koptelefoon met noise cancellation

Het antwoord schuilt in ingenieuze wiskunde. De echo komt voort uit de vertraging die optreedt. Een vertraging van minder dan 25 milliseconden is voor ons niet detecteerbaar. Wanneer we rond de 55 milliseconden zitten, klinkt het alsof je praat in een grote lege kamer. Wanneer de vertraging groter is dan dat, wordt de echo al gauw te storend om nog een normaal gesprek te voeren. 

Als het toestel waarmee de call gebeurt geluid ontvangt via zowel de luidspreker als de microfoon, dan kan het die twee bronnen op elkaar afstemmen. Een laptop kan de inkomende geluidsstroom die door zijn luidsprekers komt én het geluid dat hij via de microfoon opneemt tegelijk monitoren. Als het toestel dan een kopie van de inkomende stroom ontdekt in wat het moet versturen, zal het die er eerst vanaf trekken. Dat proces staat bekend als acoustic echo cancellation

De wiskundige theorie hiervoor werd begin jaren 1960 ontwikkeld door Bell Labs. Aanvankelijk verstuurde men de signalen van beide communicerende personen op verschillende frequenties, maar dat verkleinde de bandbreedte gevoelig. De daaropvolgende oplossing bestond erin om de vertraging op de lijn te meten nog voordat de connectie tot stand kwam. Het opgenomen signaal werd dan rechtstreeks, maar ook via een zogenoemde delay line, verstuurd. Dat signaal kon worden gebruikt om de echo te vernietigen.

Sindsdien kwamen nog heel wat verbeteringen uit de bus. Echo onderdrukken blijft moeilijk. Je toestel weet niet altijd hoeveel vertraging optreedt en door onder andere omgevingsgeluiden is het echosignaal niet noodzakelijk hetzelfde als het inkomende signaal. Het toestel moet het originele signaal daarom eigenlijk schatten. Zo wordt trouwens elk verstuurd en ontvangen signaal ook eerst ontdaan van ruis, wat men acoustic noise cancellation noemt. 

Dat doet dan weer een ander belletje rinkelen. Een welkom geschenk in tijden van lockdown is een koptelefoon met noise cancellation. Deze toestellen hebben naast hun luidspreker in de hoofdtelefoon ook microfoontjes zitten die het omgevingsgeluid opvangen en ‘tegengesteld’ uitzenden in je oor. Ze maken daarbij gebruik van het feit dat geluid uit golven bestaat. Ze introduceren een zogenaamd faseverschil en zorgen er zo voor dat het omgevingsgeluid wordt opgeheven. Dat lukt al beter met monotone geluiden dan met onverwachtse geluidspieken. 

Daarom klinkt een applaus via videocall helaas niet zo indrukwekkend als in het echt. Wat een pech voor mijn student! Al kan ik hem verzekeren dat het luid en welverdiend was.