- Dwa typy modeli opisujących kinetykę enzymów: Modele sQ i tQ
- Estymulacja za pomocą modelu tQ jest nieobiektywna dla każdej kombinacji stężenia enzymu i substratu
- Równoczesna estymacja k cat i K M cierpi na brak identyfikowalności
- Połączone dane z różnych eksperymentów pozwalają na dokładną i precyzyjną estymację za pomocą modelu tQ
- Optymalne projektowanie eksperymentów dla dokładnej i efektywnej estymacji za pomocą modelu tQ
Dwa typy modeli opisujących kinetykę enzymów: Modele sQ i tQ
Podstawowa reakcja enzymatyczna składa się z pojedynczego enzymu i pojedynczego substratu, gdzie wolny enzym (E) odwracalnie wiąże się z substratem (S) tworząc kompleks (C), a kompleks nieodwracalnie dysocjuje na produkt (P) i wolny enzym:
gdzie całkowite stężenie enzymu (E T ≡ C + E) oraz całkowite stężenie substratu i produktu (S T ≡ S + C + P) są zachowane. Popularny model opisujący akumulację produktu w czasie oparty jest na równaniu MM, jak poniżej (szczegółowe wyprowadzenie znajduje się w Metodzie Uzupełniającej):
gdzie K M = (k b + k cat )/k f jest stałą Michaelisa-Mentena, a k cat jest stałą katalityczną. Ten model sQ wyprowadzony za pomocą standardowego QSSA był szeroko stosowany do szacowania parametrów kinetycznych, K M i k cat z krzywej postępu produktu8,9,10,11,23,25. Inny model opisujący akumulację produktu jest wyprowadzany za pomocą całkowitego QSSA; został on opracowany później niż model sQ i dlatego poświęcono mu mniej uwagi przy szacowaniu parametrów26,27,28,29:
Mimo, że model tQ jest bardziej skomplikowany niż model sQ, jest on dokładny w szerszych zakresach niż model sQ. W szczególności, model sQ jest dokładny, gdy
co wymaga niskiego stężenia enzymu7,14. Z drugiej strony, model tQ jest dokładny, gdy
gdzie K = k b /k f jest stałą dysocjacji27,28,29. Co ważne, warunek ten jest ogólnie obowiązujący i dlatego model tQ, w przeciwieństwie do modelu sQ, jest dokładny nawet wtedy, gdy enzym jest w nadmiarze. Zobacz14,30 aby uzyskać więcej szczegółów.
Następnie, zbadaliśmy dokładność symulacji stochastycznych przeprowadzonych przy użyciu obu modeli. W szczególności porównaliśmy symulacje stochastyczne przy użyciu algorytmu Gillespie opartego na funkcjach propensity z oryginalnego modelu pełnego (opisanego w Tabeli S1), modelu sQ (Tabela S2) lub modelu tQ (Tabela S3) dla 9 różnych warunków31,32,33,34,35,36: E T jest albo niższe, podobne do, lub wyższe niż K M , a S T jest również albo niższe, podobne do, lub wyższe niż K M (Rys. 1). Symulacje stochastyczne modelu sQ nie przybliżają symulacji oryginalnego modelu pełnego, gdy E T nie jest niskie (tzn. E T jest niższe niż S T lub K M ). Z drugiej strony, symulacje stochastyczne z użyciem modelu tQ są dokładne dla wszystkich warunków (Rys. 1), co jest zgodne z niedawnym badaniem pokazującym, że symulacje stochastyczne z użyciem modeli sQ i tQ są dokładne, gdy spełnione są ich deterministyczne warunki ważności (równania (3) i (4))37,38. W sumie model tQ jest ważny w szerszym zakresie warunków niż model sQ zarówno w sensie deterministycznym, jak i stochastycznym.
Estymulacja za pomocą modelu tQ jest nieobiektywna dla każdej kombinacji stężenia enzymu i substratu
Ponieważ model tQ jest dokładny dla szerszego zakresu warunków niż model sQ (Rys. 1), postawiliśmy hipotezę, że estymacja parametrów oparta na modelu tQ jest również dokładna dla bardziej ogólnych warunków. Aby zbadać tę hipotezę, najpierw wygenerowaliśmy 102 zaszumione krzywe postępu P z symulacji stochastycznych oryginalnego pełnego modelu (Rys. S1). Następnie, wywnioskowaliśmy parametry (k cat i K M ) z tych symulowanych zestawów danych poprzez zastosowanie wnioskowania bayesowskiego z funkcjami prawdopodobieństwa opartymi na modelu sQ lub tQ, przy słabo informatywnych priorytetach gamma (Rys. S2) (szczegóły w Metodach). Zauważ, że w całym tym badaniu używaliśmy symulowanych krzywych postępu produktu (np. Rys. S1), ponieważ musimy znać prawdziwe wartości parametrów, aby dokładnie porównać estymacje oparte na modelu sQ i modelu tQ.
Pierw skupiliśmy się na estymacji kota przy założeniu, że wartość K M jest znana. Gdy E T jest niskie, tak że zarówno model sQ jak i tQ są dokładne (Rys. 1 po lewej), próby potomne uzyskane za pomocą obu modeli są podobne i z powodzeniem wychwytują prawdziwą wartość k cat (Rys. 2a po lewej). Próbki potomne uzyskane za pomocą obu modeli są podobne, ponieważ, gdy E T jest niskie, a zatem \({E}_{T} {S}_{T}+{K}_{M}}), oba modele (Eqs 1 i 2) są w przybliżeniu równoważne, jak poniżej:
gdzie pierwsze przybliżenie pochodzi z rozwinięcia Taylora w kategoriach \({E}_{T}({S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)\) (szczegóły patrz27,28,29). W związku z tym, gdy {E}_{T}+{K}_{M}} jest dokładny, a tym samym model sQ jest dokładny, oszacowania za pomocą modeli sQ i tQ powinny być podobne. Z drugiej strony, gdy E T jest wysokie, wykazują one wyraźne różnice (Rys. 2a po prawej): próbki posterior uzyskane za pomocą modelu sQ wykazują duże błędy, podczas gdy te uzyskane za pomocą modelu tQ dokładnie oddają prawdziwą wartość k cat .
Podobne wyniki obserwuje się również w wykresach pudełkowych średnich posterior i współczynników zmienności posterior (CV) (ryc. S3a,b). Podczas gdy średnie potomne uzyskane za pomocą modelu sQ są nieobiektywne, gdy E T jest wysokie, te uzyskane za pomocą modelu tQ są dokładne dla wszystkich warunków (Ryc. S3a). W szczególności, wąskie rozkłady średnich potomnych wskazują, że estymacja k cat za pomocą modelu tQ jest odporna na szumy w danych (Rys. S1). Ponadto, wartości CV są znacznie mniejsze niż wartości CV prior (Rys. S3b), co wskazuje na precyzyjną estymację k cat za pomocą modelu tQ.
Następnie oszacowano K M przy założeniu, że wartość k cat jest znana (Rys. 2b). Próbki tylne K M otrzymane za pomocą modelu sQ ponownie wykazują błędy, które rosną wraz ze wzrostem E T . Zauważmy, że oszacowania K M są skośne w górę, co sugeruje, że użycie estymacji potomnych K M do walidacji równania MM ({K}_{M} {E}_{T}}) może być mylące. Z drugiej strony, oszacowania K M uzyskane za pomocą modelu tQ są mało tendencyjne dla wszystkich warunków. Jednakże, w przeciwieństwie do wąskich rozkładów posterioralnych k cat (Rys. 2a), rozkłady K M uzyskane za pomocą modelu tQ stają się szersze; zatem precyzja maleje wraz ze wzrostem E T lub S T (Rys. 2b). Wzorce te są również obserwowane na wykresach pudełkowych średnich i współczynników zmienności (Rys. S3c,d). Problem z identyfikowalnością pojawia się, ponieważ w przypadku, gdy \({E}_{T} {K}_{M}) lub \({S}_{T} {K}_{M}}), a więc \({E}_{T}+{S}_{T}} {K}_{M}}), K M jest pomijalne w modelu tQ (Eq. 2), jak następuje:
W szczególności, gdy K M jest zbyt niskie, wartość K M ma niewielki wpływ na dynamikę modelu tQ, a zatem K M jest strukturalnie nieidentyfikowalne. W sumie, oszacowania K M za pomocą modeli sQ i tQ nie są zadowalające, choć z różnych powodów: oszacowania za pomocą modelu sQ mogą być nieobiektywne, a te za pomocą modelu tQ mogą być strukturalnie nieidentyfikowalne (Rys. 2b). Podobne prawidłowości zaobserwowano również w przypadku podania bardziej informatywnego priorytetu (Rys. S4). W szczególności, nawet przy informatywnym priorytecie, oszacowania otrzymane z modelem sQ nadal wykazują znaczny błąd wraz ze wzrostem E T.
Równoczesna estymacja k cat i K M cierpi na brak identyfikowalności
Następnie, rozważyliśmy jednoczesną estymację dwóch parametrów, k cat i K M , co jest typowym celem kinetyki enzymatycznej. Dla tych samych priorytetów gamma użytych do estymacji pojedynczego parametru (Rys. 2), rozkłady próbek potomnych otrzymanych za pomocą obu modeli stały się szersze (Rys. 3). Aby znaleźć przyczynę tak nieprecyzyjnej estymacji, przeanalizowaliśmy wykresy rozrzutu próbek posteriorów k cat i K M (Rys. 4). W przypadku, gdy k ({S}_{T}} {K}_{M}}) (Rys. 4a-c), próbki potomne k cat i K M otrzymane za pomocą modelu sQ wykazywały silną korelację, ponieważ dynamika modelu sQ zależy tylko od stosunku k cat /K M , co widać w następującym przybliżeniu:
gdzie ^{K}_{M}}}g {S}_{T}-P}}} jest używane. Z drugiej strony, w przypadku użycia \u0026apos; (Rys. 4g-i), wykres rozrzutu modelu sQ staje się poziomy, co wskazuje na nieidentyfikowalność struktury K M . Istotnie, wartość K M nie ma prawie żadnego wpływu na dynamikę modelu sQ, co widać w następującym przybliżeniu:
gdzie K M + S T ≈ S T jest używany jako ≈ {K}_{M}}. Taki brak identyfikowalności parametrów w przypadku użycia S T lub K M jest zgodny z wcześniejszymi badaniami, które zalecają użycie S T ≈ K M dla bardziej precyzyjnej estymacji22,23. Jednakże, nawet gdy S T ≈ K M , oszacowania są nadal nieprecyzyjne (Rys. 3a i b pośrodku). Co więcej, wraz ze wzrostem E T, oszacowania uzyskane za pomocą modelu sQ są tendencyjne (Rys. 3), podobnie jak w przypadku estymacji jednoparametrowej (Rys. 2). Na podstawie tej analizy wydaje się, że jednoczesna estymacja k cat i K M za pomocą modelu sQ jest trudna ze względu na problemy z identyfikacją i stronniczością.
Gdy K M ma pomijalny wpływ na dynamikę modelu tQ (Eq. 6), a zatem tylko k cat było możliwe do zidentyfikowania w estymacji jednoparametrowej (Rys. 2a i b prawy lub dolny). Podobnie, gdy zarówno k cat jak i K M są wnioskowane jednocześnie z modelem tQ, estymacja tylko k cat jest dokładna i precyzyjna (Rys. 3a i b po prawej lub na dole), co pokazują poziome wykresy rozrzutu wzdłuż prawdziwej wartości k cat (Rys. 4c,f,g-i). W innych przypadkach (gdy ani \(E}_{T}g {K}_{M}} ani \({S}_{T}g {K}_{M}}}) wariancja potomna obu parametrów drastycznie wzrasta w porównaniu z estymacją jednoparametrową (Rys. 2 i 3 po lewej i u góry). Taka nieprecyzyjna estymacja wynika z dwóch źródeł, zgodnie z wykresami rozrzutu (Rys. 4a,b,d,e). Gdy k cat i K M maleją razem, zachowanie modelu tQ zmienia się w niewielkim stopniu w stosunku do modelu SQ (Eq. 5), co prowadzi do silnej korelacji pomiędzy próbkami potomnymi k cat i K M . Ponieważ estymaty K M maleją razem z estymatami k cat , tak że stają się znacznie mniejsze niż E T + S T (przerywana pionowa linia na Rys. 4), model tQ przestaje zależeć od wartości K M , jak pokazano w Eq. 6, a zatem wykresy rozrzutu stają się poziome.
Połączone dane z różnych eksperymentów pozwalają na dokładną i precyzyjną estymację za pomocą modelu tQ
Jak pokazano powyżej, estymacja zarówno k cat, jak i K M przy użyciu pojedynczej krzywej postępu cierpi z powodu znacznej tendencyjności i braku możliwości identyfikacji (Rys. 3 i 4), co jest zgodne z wcześniejszymi badaniami donoszącymi, że krzywa postępu uzyskana z pojedynczego eksperymentu nie wystarcza do jednoczesnej identyfikacji obu parametrów19. Dlatego tutaj badamy, czy użycie wielu zestawów danych przebiegu czasowego uzyskanych w różnych warunkach eksperymentalnych może poprawić estymację.
W typowych badaniach in vitro, krzywe postępu są mierzone albo z ustalonym S T i zróżnicowanym E T albo z ustalonym E T i zróżnicowanym S T 8,9,10,11,39. Najpierw rozważamy przypadek, gdy krzywe postępu są mierzone przy stałym S T i zróżnicowanym E T . Konkretnie, krzywe postępu zarówno z niskiego, jak i wysokiego E T są wykorzystywane do estymacji parametrów dla stałego S T na różnych poziomach (Rys. S1 góra i dół). W tym przypadku, próbki potomne uzyskane za pomocą modelu sQ wykazują znaczne błędy, ponieważ wykorzystywane są dane z wysokiego E T (Rys. 5a i S5). Z drugiej strony, próbki uzyskane za pomocą modelu tQ dokładnie odwzorowują prawdziwe wartości zarówno k cat jak i K M z niską wariancją (Rys. 5a i S5). Taka poprawa wynika z faktu, że dane uzyskane w warunkach niskiego i wysokiego E T dostarczają różnych rodzajów informacji do estymacji parametrów. W szczególności, z danych o wysokim E T, chociaż K M nie jest identyfikowalne, k cat może być dokładnie oszacowane za pomocą modelu tQ (Rys. 4c,f,i). Taka dokładna estymacja k cat z danych o wysokim E T może zapobiec korelacji pomiędzy k cat i K M, gdy są one szacowane z danych o niskim E T (Rys. 4a,d). Rzeczywiście, wąskie wykresy rozrzutu modelu tQ (Rys. 5b po lewej i pośrodku) są przecięciem dwóch wykresów rozrzutu, poziomego uzyskanego z danych o wysokim E T (Rys. 4c,f) i niehoryzontalnego uzyskanego z danych o niskim E T (Rys. 4a,d). Jednakże, gdy S T jest wysokie, wykres rozrzutu z niskiego E T również staje się poziomy (Rys. 4c), a zatem efekt synergiczny wykorzystania połączonych danych maleje (Rys. 5a,b po prawej). Podsumowując, model tQ może dokładnie oszacować oba parametry z połączenia danych o niskim E T i wysokim E T, gdy S T nie jest dużo większe niż K M . Zauważmy, że tak niskie S T jest preferowane w eksperymentach in vitro24,39,40,41 i dotyczy większości warunków fizjologicznych24.
Następnie rozważamy przypadek, gdy krzywe postępu są mierzone przy stałym E T i zróżnicowanym S T . W szczególności, kombinacja dwóch krzywych postępu z niskiego i wysokiego S T jest używana do wnioskowania o parametrach dla stałego E T na różnych poziomach (Rys. S1 po lewej i prawej). Gdy E T jest niskie, a więc modele sQ i tQ zachowują się podobnie (Eq. 5), próby potomne uzyskane z obu modeli dokładnie oddają prawdziwe wartości k cat i K M (Rys. 6a po lewej i S6). Ponownie, wąski wykres rozrzutu (Rys. 6b po lewej) jest otrzymany jako przecięcie niehoryzontalnego wykresu rozrzutu niskiego S T (Rys. 4a) i horyzontalnego wykresu rozrzutu wysokiego S T (Rys. 4g). Jednak wraz ze wzrostem E T, a tym samym mniejszą dokładnością modelu sQ, wyniki uzyskane za pomocą modelu sQ są tendencyjne, zgodnie z oczekiwaniami (Rys. 6a po prawej i S6). Podczas gdy takich błędów nie obserwuje się w oszacowaniach uzyskanych za pomocą modelu tQ, precyzja oszacowań K M maleje wraz ze wzrostem E T, podobnie jak w estymacji jednoparametrowej (Rys. 2 i Eq. 6).
Optymalne projektowanie eksperymentów dla dokładnej i efektywnej estymacji za pomocą modelu tQ
Gdy używana jest krzywa postępu uzyskana z pojedynczego eksperymentu, wykresy rozrzutu posteryzmu modelu tQ mogą być skategoryzowane jako typ skorelowany (Rys. 4a,b,d,e) i typ poziomy (Rys. 4c,f,g-i). Przecięcia tych dwóch różnych typów wykresów rozrzutu mają tendencję do wąskiego rozkładu w pobliżu wartości rzeczywistej (Rys. 5b i 6b). Zatem połączenie dwóch takich zestawów danych pozwala na dokładne oszacowanie zarówno k cat, jak i K M (Rys. 5a i 6a). W szczególności, krzywa postępu mierzona w warunkach \({E}_{T}ll {K}_{M}} i \({S}_{T}}ll {K}_{M}}) (Rys. 4a,b,d,e) oraz krzywa mierzona w warunkach \({E}_{T}}g {K}_{M}}) lub \({S}_{T}}g {K}_{M}}) (Rys. 4c,f,g-i). 4c,f,g-i) dostarczają różnego rodzaju informacji do estymacji parametrów, więc użycie obu zestawów danych prowadzi do udanej estymacji. Jednak w praktyce trudno jest porównać wartości S T , E T , i K M , ponieważ wartość K M jest zazwyczaj nieznana a priori. Problem ten można łatwo rozwiązać za pomocą wykresu rozrzutu. Oznacza to, że jeśli wykres rozrzutu uzyskany z pierwszego eksperymentu jest poziomy, to w następnym eksperymencie należy zmniejszyć zarówno E T jak i S T, tak aby uzyskać niehoryzontalny wykres rozrzutu (Rys. 7a). Z drugiej strony, jeżeli wykres rozrzutu z pierwszego eksperymentu wykazuje silną korelację pomiędzy K M i k cat , to w następnym eksperymencie należy zwiększyć S T lub E T (Rys. 7b). Zasadniczo, bez wcześniejszej informacji o wartości K M i k cat , kształt wykresów rozrzutu bieżących oszacowań wyznacza następny optymalny projekt eksperymentu, co zapewnia dokładną i precyzyjną estymację. Podejście to nie może być jednak stosowane w przypadku modelu sQ, ponieważ estymacja za pomocą modelu sQ może być nieobiektywna, w zależności od nieznanej a priori relacji pomiędzy E T lub S T a K M . Oznacza to, że w przeciwieństwie do modelu tQ, precyzyjna estymacja nie zawsze gwarantuje dokładną estymację z modelem sQ, jak widać powyżej (np. Rys. 5a po prawej).
Sprawdziliśmy, czy proponowane podejście z modelem tQ może dokładnie oszacować k cat i K M dla katalizy estru etylowego N-acetyloglicyny, fumaranu i mocznika przez enzymy, odpowiednio, chymotrypsynę, ureazę i fumarazę (Rys. 7c). Te trzy enzymy zostały wybrane, ponieważ mają różne wydajności katalityczne (k cat /K M )1: 0,12, 4 – 105 i 1,6 – 108 s -1 M -1, odpowiednio. Dla każdego enzymu wygenerowano 102 zestawy zaszumionych danych przebiegu czasowego, stosując symulacje stochastyczne oparte na znanych parametrach kinetycznych enzymów1. Kiedy użyto krzywych postępu uzyskanych przy niskim E T i niskim S T, zgodnie z oczekiwaniami, uzyskano niehoryzontalne wykresy rozrzutu próbek potomnych dla wszystkich trzech enzymów (Rys. 7c). Wskazuje to, że w następnym eksperymencie należy zwiększyć E T lub S T, aby uzyskać poziomy wykres rozrzutu. Rzeczywiście, kiedy użyto krzywej postępu ze 100-krotnym wzrostem E T, uzyskano poziome wykresy rozrzutu dla wszystkich enzymów (Rys. 7c). Dlatego też, gdy te dwie krzywe postępu są używane razem, zarówno k cat jak i K M mogą być dokładnie oszacowane (Rys. 7c czerwone kropki). Wyniki te potwierdzają, że takie dwuetapowe zoptymalizowane projektowanie eksperymentu (Rys. 7a,b) w celu uzyskania dwóch różnych typów wykresów rozrzutu pozwala na dokładne i wydajne oszacowanie kinetyki enzymów za pomocą modelu tQ. Pakiet obliczeniowy wykonujący taką estymację jest dostarczony (szczegóły w Metodzie).