Hoe lezen wetenschappers wat er in DNA staat geschreven?

DNA is een fantastische molecule. Al 5 jaar werk ik dag in dag uit met DNA en toch ben ik regelmatig nog verbaasd door de schat aan informatie die er in kan worden opgeslagen.

Al die informatie wordt in DNA bewaard door “simpelweg” te spelen met de volgorde van z’n vier bouwstenen, adenine (A), cytosine (C), thymine (T) en guanine (G). Die volgorde (of basevolgorde) van A,C, T en G’s wordt van generatie op generatie doorgegeven en bevat alle cruciale informatie die een organisme nodig heeft om te groeien en te overleven.

DNA bepaalt waarom sommige mensen sproetjes hebben en anderen niet. Het bepaalt waarom sommige appelsoorten zoet smaken en anderen zuur. En nog zoveel meer (zo kan je bijvoorbeeld ook DNA gebruiken om digitale informatie, zoals een bitcoin, in op te slaan). Ondanks dat het vandaag exact 66 jaar geleden is dat de bekende dubbele helixstructuur van DNA werd gepubliceerd, zijn we nog maar een dertigtal jaar in staat om die (bijna) allesbepalende basevolgorde van DNA uit te lezen. Maar misschien vraag je je nu af hoe we dat doen, DNA uitlezen?

Van 85 miljoen naar 1.000 euro

Eerst even een stap terug in de tijd. De eerste volledig geautomatiseerde commerciële machine kwam in 1987 op de markt, vierendertig jaar na de ontdekking van de dubbele helixstructuur. Vandaag wordt deze machine, en zijn opvolgers, aanzien als de eerste generatie DNA sequencers. Initieel werden ze ingezet om de volledige basevolgorde (ook wel genoomsequentie genoemd) te bepalen van verschillende virussen, bacteriën en gisten. Daarna werd de technologie ook gebruikt om voor de allereerste keer de A, C, T en G’s van het menselijk genoom uit te lezen, al duurde dat klusje wel nog ongeveer 10 jaar.

Deze eerste generatie bracht alvast een schat aan informatie op. Echter, een groot nadeel van deze DNA sequencers is dat het best wel arbeidsintensief is om met deze machines een volledige genoomsequentie uit te lezen. Wetenschappers moesten het DNA immers in korte stukjes van ongeveer 1.000 tot 2.000 lettertjes knippen. Vervolgens werden deze korte stukjes DNA ingebracht in een bacterie (voor de liefhebbers: de Escherichia coli bacterie) die de stukjes dan voor ons vermenigvuldigde. Pas na die vermenigvuldigingstap konden de korte stukjes DNA succesvol worden uitgelezen met de DNA sequencer en weer aan elkaar worden gepuzzeld met gespecialiseerde software. Neem maar van mij aan dat dit een serieus werkje is. Zeker als je weet dat het volledige menselijke genoom ongeveer 3 miljard DNA letters bevat. Daar hing toen dus ook een stevig prijskaartje aan vast: deze eerste humane genoomsequentie in 2001 kostte maar liefst 85 miljoen euro.

Gelukkig voor ons stond er vanaf 2004 al een tweede generatie aan DNA sequencers klaar. Deze zogenaamde Next Generation Sequencers zijn gebaseerd op een volledig andere technologie dan de eerste generatie. Hierdoor zijn ze in staat zijn om een grotere hoeveelheid DNA simultaan uit te lezen. Bovendien maakte deze technische innovatie de hierboven beschreven arbeidsintensieve stap volledig overbodig. In plaats van biologische vermenigvuldiging in E. coli bacteriën kon nu worden overgeschakeld naar biochemische vermenigvuldiging via PCR. En dat is véél sneller en efficiënter.

Met de komst van deze tweede generatie verdubbelde de hoeveelheid DNA dat kon worden uitgelezen tussen 2004 en 2010 maar liefst elke vijf maandHierdoor zakte de prijs voor het uitlezen van één menselijke genoomsequentie van ongeveer 18 miljoen euro in 2004 naar 30.000 euro in 2010 tot onder de 1.000 euro in 2017. Door deze gigantische prijsdaling werd er wereldwijd meer en meer DNA uitgelezen, de start van een echte genomics revolution.

Er is echter ook één groot nadeel verbonden aan de DNA sequencers van de tweede generatie. Ze kunnen enkel héél korte stukjes DNA uitlezen die niet langer zijn dan 500 lettertjes. Deze kortere DNA sequenties maken het een pak moeilijker om een volledige genoomsequentie te reconstrueren. Vergelijk het met een kinderpuzzel met enorme grote puzzelstukken (lange sequenties) of een puzzel voor volwassenen met stukjes niet groter dan het topje van je pink (korte sequenties). Die kinderpuzzel is ongetwijfeld sneller gelegd dan de puzzel voor volwassenen. Gelukkig hebben we computers en bio-informatici die gespecialiseerde software ontwikkelen om ons te assisteren bij deze complexe taak. Hierdoor wordt het toch net iets makkelijker om ook die uitdagende puzzel, of toch het grootste deel daarvan, te kunnen oplossen.

Binnenkort DNA uitlezen met je smartphone?

Ondertussen blijft de innovatie op vlak van het uitlezen van DNA maar doorgaan. Zo zitten we momenteel middenin de opkomst van een derde generatie van DNA sequencers. Deze derde generatie onderscheidt zich vooral van de tweede doordat zij het probleem van de korte sequenties aanpakken. Ze zijn in staat om “ultralange” DNA sequenties uit te lezen. Gezien het bij deze machines niet meer nodig is om het DNA in kleine stukjes te knippen, is het mogelijk om de genoomsequentie van virussen, en binnenkort misschien wel bacteriën, in één keer volledig uit te lezen.

De keerzijde van de medaille is dat de nauwkeurigheid van deze 3e generatie DNA sequencers en pak lager ligt dan die van de tweede generatie. Per honderd bouwstenen zullen zij er minstens tien foutief uitlezen. Ter vergelijking, de machines van de tweede generatie zullen maar één foutje maken per 10.000 DNA lettertjes. Dat is een serieus verschil. Hierdoor is de derde generatie momenteel nog ongeschikt voor een aantal toepassingen die een hoge accuraatheid verwachten.

Je kan dus besluiten dat het uitlezen van DNA de laatste dertig jaar een ongeziene evolutie heeft doorgemaakt. Drie generaties aan DNA sequencers hebben de prijs voor het uitlezen van één humane genoomsequentie doen kelderen van 85 miljoen euro in 2001 tot minder dan 1.000 euro vandaag. Daarnaast worden de machines ook steeds kleiner en kleiner waardoor het binnen 5 jaar misschien wel mogelijk is om zo’n DNA sequencer aan te sluiten op je smartphone. Eén ding is dus zeker, de toekomst zullen ze nooit kunnen uitlezen, maar de genomics revolution is nog lang niet gedaan.

 

Sander Wuyts (UAntwerpen) is genomineerd voor de Eos Pipet 2019. Hij speurt in gefermenteerd voedsel naar gezonde bacteriën. Dat doet hij door het DNA van die bacteriën te bestuderen. Lees er hier meer over.