Kwaliteitscontrole bij grootschalige dataverwerking

Onderzoeker:  Lennart Martens (UGent)

Enorme, op het eerste zicht ondoordringbare hoeveelheden data is het belangrijkste kenmerk van de resultaten van de technieken gebruikt in modern biotechnologisch onderzoek. Lennart Martens en zijn team maken gebruik van  krachtige computers en uitgekiende algoritmen om die overvloed aan gegevens te lijf te gaan. Zijn werkveld is erg divers: van onderzoek naar kanker, over eiwitbiologie tot genetische data. Al zijn werk heeft één ding gemeen: bioinformatica inzetten om massa’s data te vertalen naar concrete resultaten die inzicht verschaffen in biologische problemen.
 

Modern onderzoek levert miljoenen datapunten

Klassiek biomedisch onderzoek ging vaak als volgt: een wetenschapper had een hypothese, waarrond een experiment werd opgezet, en een paar maanden laten werden er enkele tientallen datapunten gegenereerd die de hypothese bevestigden of ontkrachtten.  Sleutelelement was het formuleren van de juiste biologische vraag - de verwerking van de data was relatief eenvoudig. Het eerste deel, het formuleren van de wetenschappelijke vraag, is hetzelfde gebleven.  Maar huidige technologieën zoals genoom-, transcriptoom- en proteoomanalyse leveren data aan van een totaal ander kaliber. De tientallen datapunten worden niet gegenereerd per maand, maar per milliseconde. Dat betekent dat een experiment makkelijk miljoenen datapunten oplevert.
 

Samenwerking is de sleutel

De noodzaak om al die data te verwerken heeft een nieuwe tak van de biologie doen ontstaan: bio-informatica. Dat is een combinatie van biologie, informatica, statistiek en informatietheorie. Bio-informatici zoals Lennart Martens moeten dus van alle markten thuis zijn. Ze moeten inzicht hebben in biologische processen, statistiek, computerwetenschap en informatietheorie. Uit de gegevens oogsten ze patronen die tot nieuw biologisch inzicht leiden. Zo werkt Martens mee aan de analyse van grote hoeveelheden data van patiënten met darmkanker. Door te analyseren welke lipiden er aanwezig zijn bij de patiënten, willen de onderzoekers kunnen voorspellen in welk stadium de patiënt zich bevindt en waarom de lipiden verschillen van patiënt tot patiënt. Die kennis kan helpen om de biologie van de ziekte beter te doorgronden, maar ook  om te bepalen welke behandeling meest geschikt is voor welke patiënt.
 

Kwaliteitscontrole van de gegevens

Een ander veld waarop Lennart Martens actief is, is de kwaliteitscontrole van de gegevens. Want als een machine miljoenen datapunten levert in één enkel experiment, hoe ga je dan na wat de foutenmarge op die gegevens is? Of hoe kan je afwijkende resultaten detecteren? Martens werkt aan methodes om die controles automatisch te laten verlopen. Dat moet de kwaliteit van de experimenten verhogen en  toelaten om nog sneller en preciezer te werken. Eén ding is zeker, hoewel bio-informatica nog maar een jonge tak van de wetenschap is, is de toekomst al verzekerd door de steeds maar verder uitdijende zee van gegevens.
 

 Verwante onderzoeken aan VIB

 
 

 Nieuws

 
bio-informatica