Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Benchmarking a memetic algorithm for global all-atom protein-protein docking with backbone flexibility

Karlin, Vera LU (2022) KEML10 20221
Department of Chemistry
Abstract
Determining how proteins interact with each other to form complexes is very important for understanding both disease and cellular functions, but experimentally determining the structures of these complexes is both tedious and slow, which is why a great number of protein-protein docking algorithms have been developed to predict them. To this day, conformational changes in protein backbones have been one of the largest challenges when making docking predictions. The recently developed docking algorithm EvoDOCK aims to resolve this challenge by making use of a memetic algorithm that combines an evolutionary algorithm with Monte Carlo optimisations while also performing swaps of the backbone structures with conformer ensembles to simulate... (More)
Determining how proteins interact with each other to form complexes is very important for understanding both disease and cellular functions, but experimentally determining the structures of these complexes is both tedious and slow, which is why a great number of protein-protein docking algorithms have been developed to predict them. To this day, conformational changes in protein backbones have been one of the largest challenges when making docking predictions. The recently developed docking algorithm EvoDOCK aims to resolve this challenge by making use of a memetic algorithm that combines an evolutionary algorithm with Monte Carlo optimisations while also performing swaps of the backbone structures with conformer ensembles to simulate flexibility. In this thesis, a docking benchmark evaluating the performance of EvoDOCK against a standard Monte Carlo optimization based algorithm was constructed and performed along with evaluations of the algorithm’s backbone flexibility strategy. The results showed an improvement of prediction quality for EvoDOCK as measured by iRMSD, DockQ and CAPRI for most of the benchmark complexes, with slightly better results when using a more exploratory set of evolutionary parameters. However, the predictions were more computationally costly than the standard method and only made efficient use of a small part of the backbone ensemble libraries, although showing clear room for optimisations and improvements of the methodology. (Less)
Popular Abstract (Swedish)
Det är sen länge känt att de proteiner som utför cellernas funktioner mestadels inte är oberoende och enskilda, utan sitter ihop i proteinkomplex. Förståelsen om hur dessa komplex ser ut och sitter ihop är väsentlig för att till exempel kunna avgöra deras funktion eller förstå hur strukturändringar från sjukdomar och mutationer kan påverka dem. Bestämning av strukturerna på proteinkomplex brukar göras experimentellt, vilket ofta är en långsam och utdragen process som är otillräcklig för att kunna kartlägga den stora mängden av interaktioner som finns. För att lösa problemet har en mängd algoritmer för så kallad proteindockning utvecklats med syftet att försöka förutspå proteinkomplexens strukturer. Dockningsalgoritmer har lyckats skapa... (More)
Det är sen länge känt att de proteiner som utför cellernas funktioner mestadels inte är oberoende och enskilda, utan sitter ihop i proteinkomplex. Förståelsen om hur dessa komplex ser ut och sitter ihop är väsentlig för att till exempel kunna avgöra deras funktion eller förstå hur strukturändringar från sjukdomar och mutationer kan påverka dem. Bestämning av strukturerna på proteinkomplex brukar göras experimentellt, vilket ofta är en långsam och utdragen process som är otillräcklig för att kunna kartlägga den stora mängden av interaktioner som finns. För att lösa problemet har en mängd algoritmer för så kallad proteindockning utvecklats med syftet att försöka förutspå proteinkomplexens strukturer. Dockningsalgoritmer har lyckats skapa modeller av komplex med god precision, men har svårigheter när det kommer till proteiner med flexibla ryggrader, som har olika form när de är i obundet respektive bundet tillstånd.
EvoDOCK är en variant på en evolutionär algoritm som dessutom använder sig av optimeringar med Monte Carlo, en metod baserad på många små slumpmässiga förändringar. Algoritmen hanterar flexibilitet med hjälp av byten av proteinernas ryggrader med förgenererade bibliotek av strukturer som försöker imitera de möjliga strukturförändringar som kan uppstå vid bindning. I denna rapport utfördes ett benchmark, det vill säga en mätning av EvoDOCKs dockningsförmåga i jämförelse med en standard Monte Carlo-baserad algoritm för 10 komplex som klassifierats som svåra.
Resultaten visade på att EvoDOCK hade en bättre förmåga att skapa modeller mer lika de verkliga komplexen i majoriteten av testerna, där de modellerna som använde sig av parametrar som var mer åt det utforskande hållet hade generellt sett större framgångar. Prestandan var å andra sidan lägre då algoritmen ofta tog dubbelt eller trippelt så lång tid som standardalgoritmen. Den dåliga prestandan skulle dock enkelt kunna förbättras genom att skapa färre dockingsmodeller eller byta ut ryggraderna mindre frekvent, vilka båda visats ha n negativliten negativ påverkan på själva kvaliteten av modellerna. Det visade sig även att stora delar av strukturbiblioteken ej kom till användning, dock även här med tydliga möjligheter för förbättring.
Allt som allt tyder EvoDOCKs framgångar på att forskningen tagit sig ett steg närmre knäckandet av de flexibla proteinkomplexens gåta. Med många förbättringsområden kvar finns det även mycket goda förutsättningar för ännu större framtida framsteg. (Less)
Please use this url to cite or link to this publication:
author
Karlin, Vera LU
supervisor
organization
course
KEML10 20221
year
type
M2 - Bachelor Degree
subject
keywords
biochemistry, EvoDOCK, algorithm, protein, iRMSD, DockQ, CAPRI
language
English
id
9078600
date added to LUP
2022-06-09 09:08:57
date last changed
2022-06-09 09:08:57
@misc{9078600,
  abstract     = {{Determining how proteins interact with each other to form complexes is very important for understanding both disease and cellular functions, but experimentally determining the structures of these complexes is both tedious and slow, which is why a great number of protein-protein docking algorithms have been developed to predict them. To this day, conformational changes in protein backbones have been one of the largest challenges when making docking predictions. The recently developed docking algorithm EvoDOCK aims to resolve this challenge by making use of a memetic algorithm that combines an evolutionary algorithm with Monte Carlo optimisations while also performing swaps of the backbone structures with conformer ensembles to simulate flexibility. In this thesis, a docking benchmark evaluating the performance of EvoDOCK against a standard Monte Carlo optimization based algorithm was constructed and performed along with evaluations of the algorithm’s backbone flexibility strategy. The results showed an improvement of prediction quality for EvoDOCK as measured by iRMSD, DockQ and CAPRI for most of the benchmark complexes, with slightly better results when using a more exploratory set of evolutionary parameters. However, the predictions were more computationally costly than the standard method and only made efficient use of a small part of the backbone ensemble libraries, although showing clear room for optimisations and improvements of the methodology.}},
  author       = {{Karlin, Vera}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Benchmarking a memetic algorithm for global all-atom protein-protein docking with backbone flexibility}},
  year         = {{2022}},
}