Column

Hoeveel tijd verliezen we door AI te gebruiken? De ‘prutsfactor’ geeft het weer

Generatieve AI, zoals ChatGPT en Copilot, wordt vaak in één adem genoemd met efficiëntie. Toch zien we de inefficiëntie ervan over het hoofd.

Efficiëntie is de verhouding van de nuttige uitvoer tot de totale invoer. Als je vijf minuten investeert om een script te schrijven waarmee je vervolgens honderden gepersonaliseerde mails automatisch kunt versturen, zodat je uren manueel werk uitspaart, dan is dit duidelijk een heel efficiënt proces. Althans voor de verzender; of de ontvangers dit wel zo nuttig vinden is een ander verhaal.

Bij generatieve AI volstaat een korte prompt om een lange tekst, afbeelding of video te genereren. De verhouding tussen output en input lijkt dus heel gunstig. Om echt van efficiëntie te spreken, moet de output echter ook nuttig zijn, maar de kwaliteit en betrouwbaarheid van de output is erg variabel.

Toegegeven, er zijn situaties waarbij je een AI-systeem een taak geeft, het resultaat controleert en dit correct blijkt te zijn. In dat geval heb je tijd bespaard. Maar meestal blijkt het resultaat na controle niet helemaal of zelfs helemaal niet goed te zijn. Dan begint het gepruts. Door de verspilde tijd stijgt de noemer en daalt de efficiëntie.

In augustus 2025 schreef de Amerikaanse programmeur Glyph Lefkowitz hier een stuk over met als titel The Futzing Fraction: de ‘prutsfactor’. Die factor vergelijkt de efficiëntie van een mens die AI gebruikt voor een taak (M+) met een mens die de taak zelf uitvoert (M-).

De gemiddelde kost voor één poging met AI bestaat uit vier termen: de gemiddelde tijd die een mens nodig heeft om één prompt te schrijven (P); de gemiddelde tijd die het systeem nodig heeft om een resultaat te genereren (R); de gemiddelde tijd die een mens nodig heeft om het resultaat te controleren (C); en de kost om het AI-systeem te gebruiken (S). De laatste term gaat over geld, de eerste drie termen over tijd, wat hetzelfde is als je tijd in loonkost uitdrukt.

Deze som moet dan nog vermenigvuldigd worden met het aantal keer dat de persoon met AI opnieuw moet proberen. Als schatting hiervoor deelt Lefkowitz de som door de kans K op een juist antwoord. Zo bekomt hij een formule voor de prutsfactor, F:

We onthouden de zeldzame successen van AI en vergeten het vele gepruts

Enkel als de prutsfactor kleiner is dan één levert het AI-systeem tijdswinst op. De meeste variabelen in deze formule zijn echter onbekend. De tijd om één prompt te schrijven (P) en tot een resultaat te komen (R) en ook de financiële kost (S) zijn relatief klein, wat deze systemen juist zo aantrekkelijk maakt. Maar hoe zit het met C en K?

Lefkowitz benadrukt dat de tijd die in het controleren van de output gaat zitten, C, veel groter is dan je wellicht denkt. Vuistregels die handig zijn om slechte antwoorden van andere mensen snel te herkennen, helpen namelijk niet bij AI-output. Bovendien kunnen onervaren medewerkers de resultaten minder goed beoordelen, waardoor ze meer tijd verliezen aan foute antwoorden.

Ook het aantal vereiste pogingen, 1/K, is wellicht groter dan we denken. De gebruikersinterface is zo ontworpen dat elke poging weinig lijkt te kosten en bijna onmiddellijk een nieuw resultaat geeft, wat ons aanzet om te blijven proberen. En we beseffen niet hoeveel tijd we verprutsen.

Lefkowitz vergelijkt het met een gokkast: de uitzonderlijke keer dat je de jackpot wint zal je zeker bijblijven, maar van de veel talrijkere keren dat je je inzet kwijt was zul je je veel minder herinneren. Van een casino weten we dat het huis altijd wint, maar Lefkowitz suggereert dat de situatie met AI vergelijkbaar is. We onthouden de zeldzame successen en vergeten het vele gepruts.

Net zoals het verstandig is om je inzet in een casino bewust te beperken, zodat je niet meer kunt verliezen dan wat je op zak hebt, raadt Lefkowitz ons aan om ook vooraf een tijdsbudget te bedenken als we met AI beginnen spelen. Als het gepruts langer aanhoudt, moeten we onszelf streng toespreken en de taak alsnog zelf uitvoeren.

Als we dat niet doen, worden we afhankelijk van deze systemen. Daardoor dreigt M- te stijgen: we worden zelf minder goed in taken die we vroeger wel aankonden. Hoewel dit gunstig is voor de prutsfactor, is dit toch beslist niet het gewenste resultaat. Bovendien kijkt de prutsfactor enkel naar de eindgebruiker. Of de globale investeringen van tijd, geld en natuurlijke hulpbronnen in AI-systemen wenselijk zijn, zegt de formule ons niet.