- Twee soorten modellen die de kinetiek van enzymen beschrijven: De sQ en tQ modellen
- Raming met het tQ-model is unbiased voor elke combinatie van enzym- en substraatconcentraties
- Gelijktijdige schatting van k cat en K M lijdt aan het gebrek aan identificeerbaarheid
- Gecombineerde gegevens van verschillende experimenten maken nauwkeurige en nauwkeurige schatting met de tQ model
- Optimaal ontwerp van experimenten voor nauwkeurige en efficiënte schattingen met het tQ-model
Twee soorten modellen die de kinetiek van enzymen beschrijven: De sQ en tQ modellen
Een fundamentele enzymreactie bestaat uit een enkel enzym en een enkel substraat, waarbij het vrije enzym (E) reversibel bindt met het substraat (S) om het complex (C) te vormen, en het complex irreversibel dissocieert in het product (P) en het vrije enzym:
waarbij de totale enzymconcentratie (E T ≡ C + E) en de totale substraat- en productconcentratie (S T ≡ S + C + P) worden geconserveerd. Een populair model dat de accumulatie van het product in de tijd beschrijft, is gebaseerd op de MM-vergelijking, en wel als volgt (zie Aanvullende methode voor gedetailleerde afleiding):
waarbij K M = (k b + k cat )/k f de Michaelis-Menten-constante is en k cat de katalytische constante is. Dit sQ-model, afgeleid met de standaard QSSA, is op grote schaal gebruikt om de kinetische parameters, K M en k cat te schatten uit de voortgangscurve van het product8,9,10,11,23,25. Een ander model dat de accumulatie van het product beschrijft, is afgeleid met de totale QSSA; het is later ontwikkeld dan het sQ-model en heeft daarom minder aandacht gekregen voor de parameterraming26,27,28,29:
Hoewel dit tQ-model gecompliceerder is dan het sQ-model, is het nauwkeurig over een groter bereik dan het sQ-model. Meer bepaald is het sQ-model accuraat wanneer
hetgeen een lage enzymconcentratie vereist7,14. Anderzijds is het tQ-model accuraat wanneer
waarbij K = k b /k f de dissociatieconstante is27,28,29. Belangrijk is dat deze voorwaarde algemeen geldig is en dat het tQ-model, in tegenstelling tot het sQ-model, dus nauwkeurig is, zelfs wanneer het enzym in overmaat aanwezig is. Zie 14,30 voor meer details.
Vervolgens hebben wij de nauwkeurigheid onderzocht van de stochastische simulaties die met beide modellen zijn uitgevoerd. Meer bepaald vergeleken wij de stochastische simulaties met het Gillespie-algoritme op basis van de neigingfuncties van het oorspronkelijke volledige model (beschreven in tabel S1), het sQ-model (tabel S2) of het tQ-model (tabel S3) voor 9 verschillende condities31,32,33,34,35,36: E T is ofwel lager dan, vergelijkbaar met of hoger dan K M , en S T is ook ofwel lager dan, vergelijkbaar met of hoger dan K M (fig. 1). De stochastische simulaties van het sQ-model benaderen die van het oorspronkelijke volledige model niet wanneer E T niet laag is (d.w.z. wanneer E T lager is dan noch S T noch K M ). Anderzijds zijn stochastische simulaties met het tQ-model accuraat voor alle omstandigheden (fig. 1), hetgeen consistent is met een recente studie waaruit blijkt dat stochastische simulaties met het sQ- en het tQ-model accuraat zijn wanneer hun deterministische geldigheidsvoorwaarden gelden (Eqs (3) en (4))37,38. Tezamen is het tQ-model geldig voor een breder scala van omstandigheden dan het sQ-model, zowel in deterministische als in stochastische zin.
Raming met het tQ-model is unbiased voor elke combinatie van enzym- en substraatconcentraties
Omdat het tQ-model accuraat is voor een breder scala van condities dan het sQ-model is (Fig. 1), stelden we de hypothese dat de parameterschatting op basis van het tQ-model ook accuraat is voor meer algemene condities. Om deze hypothese te onderzoeken, genereerden we eerst 102 ruisende vooruitgangscurven van P uit de stochastische simulaties van het originele volledige model (Fig. S1). Vervolgens hebben we uit deze gesimuleerde datareeksen parameters (k cat en K M ) afgeleid door de Bayesiaanse gevolgtrekking toe te passen met de waarschijnlijkheidsfuncties gebaseerd op ofwel het sQ ofwel het tQ model, onder zwak informatieve gamma priors (Fig. S2) (zie Methoden voor details). Merk op dat we in deze hele studie de gesimuleerde productvoortgangscurven hebben gebruikt (bv. Fig. S1) omdat we de werkelijke waarden van de parameters moeten kennen voor een nauwkeurige vergelijking van de schattingen op basis van het sQ-model en het tQ-model.
We hebben ons eerst gericht op de schatting van de k kat onder de aanname dat de waarde van K M bekend is. Wanneer E T laag is, zodat zowel het sQ- als het tQ-model accuraat zijn (Fig. 1 links), zijn de posterior steekproeven die met beide modellen worden verkregen vergelijkbaar en geven ze met succes de ware waarde van k cat weer (Fig. 2a links). De posterior steekproeven die met de twee modellen worden verkregen zijn vergelijkbaar omdat, wanneer E T laag is en dus {E}_{T}+{K}_{M}}, beide modellen (Eqs 1 en 2) als volgt bij benadering gelijkwaardig zijn:
waarbij de eerste benadering afkomstig is van de Taylor-expansie in termen van {E}_{T}({S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)/({E}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P) (zie27,28,29 voor details). Wanneer het sQ-model nauwkeurig is en dus {E}_{T}+{K}_{M}} nauwkeurig is, zouden de schattingen met het sQ- en het tQ-model vergelijkbaar moeten zijn. Wanneer E T echter hoog is, vertonen zij duidelijke verschillen (Fig. 2a rechts): de posterieure steekproeven verkregen met het sQ model vertonen grote fouten, terwijl die verkregen met het tQ model de ware waarde van k cat nauwkeurig weergeven.
Gelijkaardige resultaten worden ook waargenomen in de boxplots van posterior gemiddelden en posterior variatiecoëfficiënten (CV’s) (Fig. S3a,b). Terwijl de posterieure gemiddelden verkregen met het sQ model vertekend zijn wanneer E T hoog is, zijn die verkregen met het tQ model accuraat voor alle condities (Fig. S3a). In het bijzonder geven de smalle verdelingen van de posterior gemiddelden aan dat de schatting van k cat met het tQ model robuust is tegen de ruis in de data (Fig. S1). Bovendien zijn de posterior CV’s veel kleiner dan de priorior CV’s (Fig. S3b), hetgeen wijst op een nauwkeurige schatting van k cat met het tQ model.
Volgende werd K M geschat in de veronderstelling dat de waarde van k cat bekend is (Fig. 2b). De posterieure steekproeven van de K M die met het sQ-model zijn verkregen, vertonen opnieuw fouten die toenemen met toenemende E T . Merk op dat de schattingen van K M een opwaartse vertekening vertonen, wat impliceert dat het gebruik van de posterieure schattingen van K M om de MM-vergelijking te valideren ({K}_{M}}gg {E}_{T})) misleidend kan zijn. Anderzijds zijn de schattingen van K M verkregen met het tQ model weinig vertekend voor alle condities. Echter, in tegenstelling tot de smalle posterior verdelingen van k cat (Fig. 2a), worden die van K M verkregen met het tQ model breder; dus neemt de precisie af als E T of S T toeneemt (Fig. 2b). Deze patronen worden ook waargenomen in de boxplots van posterieure gemiddelden en posterieure CV’s (Fig. S3c,d). Het identificeerbaarheidsprobleem ontstaat omdat, wanneer \({E}_{T}\gg {K}_{M}) of \({S}_{T}\gg {K}_{M}) en dus \({E}_{T}+{S}_{T}\gg {K}_{M}), de K M verwaarloosbaar is in het tQ model (Eq. 2), als volgt:
Specifiek is dat wanneer K M te laag is, de waarde van K M weinig effect heeft op de dynamiek van het tQ-model en de K M dus structureel niet te bepalen is. Alles bij elkaar zijn de schattingen van K M met zowel het sQ- als het tQ-model niet bevredigend, hoewel om verschillende redenen: schattingen met het sQ-model kunnen vertekend zijn en die met het tQ-model kunnen structureel onidentificeerbaar zijn (Fig. 2b). Soortgelijke patronen werden ook waargenomen wanneer een meer informatieve prior werd gegeven (Fig. S4). In het bijzonder, zelfs met de informatieve prior, schattingen verkregen met de sQ model nog steeds aanzienlijke fout als E T toeneemt.
Gelijktijdige schatting van k cat en K M lijdt aan het gebrek aan identificeerbaarheid
Volgende, hebben we beschouwd gelijktijdige schatting van twee parameters, k cat en K M , dat is het typische doel van enzym kinetiek. Voor dezelfde gamma priors gebruikt in de enkel-parameter schatting (Fig. 2), werden de verdelingen van de posterior monsters verkregen met beide modellen breder in het algemeen (Fig. 3). Om de reden voor deze onnauwkeurige schatting te vinden, analyseerden we de spreidingsplots van posterior k cat en K M monsters (Fig. 4). Wanneer {S}_{T} {K}_{M}} (Fig. 4a-c), vertoonden de posterior monsters van k cat en K M verkregen met het sQ model een sterke correlatie, omdat de dynamica van het sQ model alleen afhangt van de verhouding k cat /K M , zoals te zien is in de volgende benadering:
waarbij ({K}_{M}gg {S}_{T}ge {S}_{T}-P}) wordt gebruikt. Daarentegen wordt de puntenwolk van het sQ model horizontaal bij gebruik van \({S}_{T}}g {K}_{M}}) (Fig. 4g-i), hetgeen wijst op de onidentificeerbaarheid van de structuur van K M . De waarde van K M heeft immers vrijwel geen invloed op de dynamiek van het sQ-model, zoals blijkt uit de volgende benadering:
waarbij K M + S T ≈ S T wordt gebruikt als ({S}_{T}}gg {K}_{M}). Een dergelijk gebrek aan parameteridentificeerbaarheid wanneer \({S}_{T}}}} of \({S}_{T}}}} {K}_{M}}) wordt gebruikt is consistent met eerdere studies, die aanbevelen om S T ≈ K M te gebruiken voor een nauwkeurigere schatting22,23. Maar zelfs wanneer S T ≈ K M , schattingen zijn nog steeds onnauwkeurig (Fig. 3a en b midden). Bovendien zijn de met het sQ-model verkregen schattingen, naarmate E T toeneemt, vertekend (fig. 3), zoals bij de schatting met één parameter (fig. 2). Uit deze analyse blijkt dat de gelijktijdige schatting van k cat en K M met het sQ-model een uitdaging vormt vanwege problemen met zowel de identificeerbaarheid als de vertekening.
Wanneer k({E}_{T}\gg {K}_{M}) of k({S}_{T}\gg {K}_{M}), heeft de K M een verwaarloosbaar effect op de dynamiek van het tQ model (Eq. 6), en dus was alleen k cat identificeerbaar in de schatting met één parameter (Fig. 2a en b rechts of onder). Evenzo, wanneer zowel k cat en K M gelijktijdig worden afgeleid met het tQ model, is de schatting van alleen k cat nauwkeurig en precies (Fig. 3a en b rechts of onder), zoals blijkt uit de horizontale spreidingsplots langs de werkelijke waarde van k cat (Fig. 4c,f,g-i). In andere gevallen (wanneer noch \({E}_{T}\gg {K}_{M}}), noch \({S}_{T}\gg {K}_{M}})), neemt de posterior variantie van beide parameters dramatisch toe in vergelijking met de schatting met één parameter (Figs 2 en 3 links en boven). Deze onnauwkeurige schatting is het gevolg van twee bronnen, volgens de puntenwolken (Fig. 4a,b,d,e). Wanneer k cat en K M samen afnemen, verandert het gedrag van het tQ model weinig ten opzichte van het SQ model (Eq. 5), hetgeen leidt tot de sterke correlatie tussen posterior steekproeven van k cat en K M . Naarmate de schattingen van K M samen met die van k cat blijven dalen, zodat ze veel kleiner worden dan E T + S T (verticale stippellijn van fig. 4), hangt het tQ-model niet langer af van de waarde van K M , zoals blijkt uit Eq. 6, en worden de puntenwolken dus horizontaal.
Gecombineerde gegevens van verschillende experimenten maken nauwkeurige en nauwkeurige schatting met de tQ model
Zoals hierboven getoond, de schatting van zowel k kat en K M met behulp van een enkele vooruitgang curve lijdt aan aanzienlijke bias en gebrek aan identificeerbaarheid (Figs 3 en 4), wat consistent is met eerdere studies melden dat een vooruitgang curve verkregen uit een enkel experiment is niet genoeg om beide parameters tegelijk te identificeren19. Dus, hier onderzoeken we of het gebruik van meerdere tijdsverloop data sets verkregen onder verschillende experimentele omstandigheden kan de schatting te verbeteren.
In typische in-vitrotests worden voortgangscurven gemeten met ofwel een vaste S T en gevarieerde E T ofwel een vaste E T en gevarieerde S T 8,9,10,11,39. We beschouwen eerst het geval waarin de progressiecurves worden gemeten met een vaste S T en een gevarieerde E T . In het bijzonder worden progressiecurven van zowel lage als hoge E T gebruikt om de parameters voor een vaste S T op verschillende niveaus te schatten (Fig. S1 boven en onder). In dit geval vertonen de met het sQ-model verkregen posterieure steekproeven aanzienlijke fouten wanneer de gegevens van hoge E T worden gebruikt (Figs 5a en S5). Daarentegen geven de met het tQ-model verkregen posterieure steekproeven nauwkeurig de ware waarden van zowel k cat als K M met geringe variantie weer (fig. 5a en S5). Deze verbetering is het gevolg van het feit dat de gegevens die onder de lage en hoge E T zijn verkregen, verschillende soorten informatie voor de parameterschatting opleveren. In het bijzonder kan uit de gegevens van de hoge E T, hoewel de K M niet identificeerbaar is, de k cat nauwkeurig worden geschat met het tQ model (Fig. 4c,f,i). Een dergelijke nauwkeurige schatting van k cat uit de hoge E T-gegevens kan de correlatie tussen k cat en K M voorkomen wanneer deze uit de lage E T-gegevens worden geschat (Fig. 4a,d). De smalle puntenwolken van het tQ-model (Fig. 5b links en midden) zijn immers het snijpunt van twee puntenwolken, een horizontale die met de hoge E T-gegevens is verkregen (Fig. 4c,f) en een niet-horizontale die met de lage E T-gegevens is verkregen (Fig. 4a,d). Wanneer S T echter hoog is, wordt de scatter plot van de lage E T ook horizontaal (Fig. 4c), en dus neemt het synergetische effect van het gebruik van gecombineerde gegevens af (Fig. 5a,b rechts). Alles bij elkaar genomen kan het tQ-model beide parameters nauwkeurig schatten uit de combinatie van lage E T- en hoge E T-gegevens wanneer S T niet veel groter is dan K M . Merk op dat een dergelijke lage S T de voorkeur geniet voor in vitro-experimenten24,39,40,41 en het geval is voor de meeste fysiologische omstandigheden24.
Volgende beschouwen we het geval waarin voortgangscurven worden gemeten met een vaste E T en een gevarieerde S T . Met name de combinatie van twee progressiecurven van lage en hoge S T wordt gebruikt om parameters af te leiden voor een vaste E T op verschillende niveaus (Fig. S1 links en rechts). Wanneer E T laag is, en het sQ- en het tQ-model zich dus op vergelijkbare wijze gedragen (Eq. 5), geven de met beide modellen verkregen posterieure steekproeven nauwkeurig de ware waarden van k cat en K M weer (Fig. 6a links en S6). Ook hier wordt de smalle spreidingsplot (Fig. 6b links) verkregen als het snijpunt van een niet-horizontale spreidingsplot van lage S T (Fig. 4a) en een horizontale spreidingsplot van hoge S T (Fig. 4g). Naarmate E T toeneemt, en dus het sQ-model minder nauwkeurig wordt, zijn de met het sQ-model verkregen resultaten echter vertekend, zoals verwacht (Fig. 6a rechts en S6). Terwijl dergelijke vertekeningen niet worden waargenomen in die verkregen met het tQ-model, neemt de precisie van de K M-schattingen af naarmate E T toeneemt, net als bij de schatting met één parameter (fig. 2 en Eq. 6).
Optimaal ontwerp van experimenten voor nauwkeurige en efficiënte schattingen met het tQ-model
Wanneer een uit één experiment verkregen progressiekromme wordt gebruikt, kunnen de posterior spreidingsplots van het tQ-model worden gecategoriseerd als een gecorreleerd type (Fig. 4a,b,d,e) en een horizontaal type (Fig. 4c,f,g-i). De snijpunten van deze twee verschillende typen puntenwolken hebben de neiging dicht bij de werkelijke waarde te liggen (Fig. 5b en 6b). Het combineren van twee van dergelijke gegevensreeksen maakt dus een nauwkeurige schatting van zowel k cat als K M mogelijk (fig. 5a en 6a). Een progressiekromme gemeten onder \({E}_{T}}ll {K}_{M}) en \({S}_{T}}ll {K}_{M}) (Fig. 4a,b,d,e) en een gemeten onder \({E}_{T}}gg {K}_{M}) of \({S}_{T}}gg {K}_{M}}) (Fig. 4c,f,g-i) en een gemeten onder \({E}_{T}}ll {K}_{M}}) (Fig. 5a,6a). 4c,f,g-i) geven verschillende soorten informatie voor de parameterschatting; dus leidt het gebruik van beide gegevensverzamelingen tot een succesvolle schatting. In de praktijk is het echter moeilijk om de waarden van S T , E T , en K M te vergelijken, omdat de waarde van K M gewoonlijk a priori onbekend is. Dit probleem kan gemakkelijk worden opgelost door gebruik te maken van de puntenwolk. Dat wil zeggen, als de posterior spreidingsdiagram van het eerste experiment horizontaal is, moeten zowel E T als S T voor het volgende experiment worden verlaagd, zodat een niet-horizontale spreidingsdiagram kan worden verkregen (fig. 7a). Anderzijds, als de spreidingsdiagram van het eerste experiment een sterke correlatie vertoont tussen K M en k cat , dan moet of S T of E T in het volgende experiment worden verhoogd (Fig. 7b). In principe bepaalt, zonder voorafgaande informatie over de waarde van K M en k cat , de vorm van de spreidingsplots van de huidige schattingen het volgende optimale experimentele ontwerp, dat een nauwkeurige en precieze schatting garandeert. Deze benadering kan echter niet worden gebruikt met het sQ-model, omdat de schatting met het sQ-model vertekend kan zijn, afhankelijk van de relatie tussen E T of S T en K M , die a priori onbekend is. Dat wil zeggen dat, in tegenstelling tot het tQ-model, nauwkeurige schatting niet altijd een nauwkeurige schatting met het sQ-model garandeert, zoals hierboven te zien is (bijv. fig. 5a rechts).
We testen of de voorgestelde benadering met het tQ-model nauwkeurig k cat en K M kan schatten voor de katalyse van N-acetylglycine ethylester, fumaraat en ureum door de enzymen chymotrypsine, urease en fumarase, respectievelijk (fig. 7c). Deze drie enzymen werden gekozen omdat ze verschillende katalytische efficiëntie (k kat / K M )1: 0,12, 4 – 105, en 1,6 – 108 s -1 M -1, respectievelijk. Voor elk enzym, 102 ruis tijdsverloop data sets werden gegenereerd met behulp van stochastische simulaties op basis van bekende enzym kinetische parameters 1. Wanneer progressie curven verkregen met een lage E T en lage S T worden gebruikt, zoals verwacht, niet-horizontale scatter plots van latere monsters werden verkregen voor alle drie enzymen (Fig. 7c). Dit geeft aan dat ofwel E T of S T moet worden verhoogd in het volgende experiment om een horizontale scatter plot te verkrijgen. Wanneer een progressiecurve met een 100-voudige toename van E T werd gebruikt, werden voor alle enzymen horizontale spreidingsplots verkregen (fig. 7c). Wanneer deze twee progressiecurven samen worden gebruikt, kunnen zowel k cat als K M dus nauwkeurig worden geschat (Fig. 7c rode stippen). Deze resultaten ondersteunen dat een dergelijke in twee stappen geoptimaliseerde experimentele opzet (Fig. 7a,b) om twee verschillende soorten spreidingsplots te verkrijgen een nauwkeurige en efficiënte schatting van de enzymkinetiek met het tQ model mogelijk maakt. Het computationele pakket dat een dergelijke schatting uitvoert wordt verstrekt (zie Methode voor de details).