- Zwei Arten von Modellen zur Beschreibung der Enzymkinetik: Das sQ- und das tQ-Modell
- Die Schätzung mit dem tQ-Modell ist für jede Kombination von Enzym- und Substratkonzentrationen unverzerrt
- Die gleichzeitige Schätzung von k cat und K M leidet unter dem Mangel an Identifizierbarkeit
- Kombinierte Daten aus verschiedenen Experimenten ermöglichen eine genaue und präzise Schätzung mit dem tQ-Modell
- Optimale Versuchsplanung für eine genaue und effiziente Schätzung mit dem tQ-Modell
Zwei Arten von Modellen zur Beschreibung der Enzymkinetik: Das sQ- und das tQ-Modell
Eine grundlegende Enzymreaktion besteht aus einem einzelnen Enzym und einem einzelnen Substrat, wobei sich das freie Enzym (E) reversibel mit dem Substrat (S) verbindet, um den Komplex (C) zu bilden, und der Komplex irreversibel in das Produkt (P) und das freie Enzym dissoziiert:
wobei die gesamte Enzymkonzentration (E T ≡ C + E) und die gesamte Substrat- und Produktkonzentration (S T ≡ S + C + P) erhalten bleiben. Ein populäres Modell, das die Akkumulation des Produkts im Laufe der Zeit beschreibt, basiert auf der MM-Gleichung, wie folgt (detaillierte Herleitung siehe Supplementary Method):
wobei K M = (k b + k cat )/k f die Michaelis-Menten-Konstante und k cat die katalytische Konstante ist. Dieses mit der Standard-QSSA abgeleitete sQ-Modell wurde häufig verwendet, um die kinetischen Parameter K M und k cat anhand der Verlaufskurve des Produkts zu schätzen8,9,10,11,23,25. Ein anderes Modell, das die Akkumulation des Produkts beschreibt, wird mit dem Gesamt-QSSA abgeleitet; es wurde später als das sQ-Modell entwickelt und hat daher weniger Aufmerksamkeit für die Parameterschätzung erhalten26,27,28,29:
Obwohl dieses tQ-Modell komplizierter ist als das sQ-Modell, ist es über größere Bereiche genau als das sQ-Modell. Insbesondere ist das sQ-Modell genau, wenn
was eine niedrige Enzymkonzentration erfordert7,14. Andererseits ist das tQ-Modell genau, wenn
wobei K = k b /k f die Dissoziationskonstante ist27,28,29. Wichtig ist, dass diese Bedingung allgemein gültig ist und somit das tQ-Modell im Gegensatz zum sQ-Modell auch dann genau ist, wenn das Enzym im Überschuss vorhanden ist. Siehe14,30 für weitere Einzelheiten.
Als nächstes untersuchten wir die Genauigkeit der stochastischen Simulationen, die mit beiden Modellen durchgeführt wurden. Insbesondere verglichen wir die stochastischen Simulationen mit dem Gillespie-Algorithmus auf der Grundlage der Propensity-Funktionen entweder des ursprünglichen vollständigen Modells (beschrieben in Tabelle S1), des sQ-Modells (Tabelle S2) oder des tQ-Modells (Tabelle S3) für 9 verschiedene Bedingungen31,32,33,34,35,36: E T ist entweder niedriger als, ähnlich oder höher als K M , und S T ist ebenfalls entweder niedriger als, ähnlich oder höher als K M (Abb. 1). Die stochastischen Simulationen des sQ-Modells nähern sich nicht denjenigen des ursprünglichen vollständigen Modells an, wenn E T nicht niedrig ist (d. h. E T ist weder niedriger als S T noch K M ). Andererseits sind stochastische Simulationen mit dem tQ-Modell unter allen Bedingungen genau (Abb. 1), was mit einer neueren Studie übereinstimmt, die zeigt, dass stochastische Simulationen mit dem sQ- und dem tQ-Modell genau sind, wenn ihre deterministischen Gültigkeitsbedingungen erfüllt sind (Gleichungen (3) und (4))37,38. Zusammengenommen ist das tQ-Modell für einen größeren Bereich von Bedingungen gültig als das sQ-Modell, sowohl im deterministischen als auch im stochastischen Sinne.
Die Schätzung mit dem tQ-Modell ist für jede Kombination von Enzym- und Substratkonzentrationen unverzerrt
Da das tQ-Modell für einen größeren Bereich von Bedingungen genau ist als das sQ-Modell (Abb. 1), stellten wir die Hypothese auf, dass die auf dem tQ-Modell basierende Parameterschätzung auch für allgemeinere Bedingungen genau ist. Um diese Hypothese zu untersuchen, erzeugten wir zunächst 102 verrauschte Fortschrittskurven von P aus den stochastischen Simulationen des ursprünglichen vollständigen Modells (Abb. S1). Anschließend leiteten wir die Parameter (k cat und K M ) aus diesen simulierten Datensätzen ab, indem wir die Bayes’sche Inferenz mit den Likelihood-Funktionen anwandten, die entweder auf dem sQ- oder dem tQ-Modell basieren, und zwar unter schwach informativen Gamma-Prioren (Abb. S2) (siehe Methoden für Details). Beachten Sie, dass wir in der gesamten Studie die simulierten Produktfortschrittskurven (z. B. Abb. S1) verwendet haben, da wir die wahren Werte der Parameter für den genauen Vergleich der Schätzungen auf der Grundlage des sQ-Modells und des tQ-Modells kennen müssen.
Wir konzentrierten uns zunächst auf die Schätzung von k cat unter der Annahme, dass der Wert von K M bekannt ist. Wenn E T niedrig ist, so dass sowohl das sQ- als auch das tQ-Modell genau sind (Abb. 1 links), sind die mit beiden Modellen erhaltenen Posteriorproben ähnlich und erfassen erfolgreich den wahren Wert von k cat (Abb. 2a links). Die mit den beiden Modellen erhaltenen posterioren Stichproben sind ähnlich, denn wenn E T niedrig ist und somit \({E}_{T}\ll {S}_{T}+{K}_{M}\), sind beide Modelle (Gleichungen 1 und 2) annähernd gleichwertig wie folgt:
wobei die erste Näherung aus der Taylor-Erweiterung in Form von \({E}_{T}({S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)\ll 1\) stammt (siehe27,28,29 für Einzelheiten). Wenn also \({E}_{T}\ll {S}_{T}+{K}_{M}\) und damit das sQ-Modell genau ist, sollten die Schätzungen mit dem sQ- und dem tQ-Modell ähnlich sein. Ist E T hingegen hoch, zeigen sie deutliche Unterschiede (Abb. 2a rechts): die mit dem sQ-Modell erhaltenen posterioren Stichproben weisen große Fehler auf, während die mit dem tQ-Modell erhaltenen den wahren Wert von k cat genau erfassen.
Ähnliche Ergebnisse werden auch in den Boxplots der posterioren Mittelwerte und der posterioren Variationskoeffizienten (CVs) beobachtet (Abb. S3a,b). Während die mit dem sQ-Modell erhaltenen posterioren Mittelwerte verzerrt sind, wenn E T hoch ist, sind die mit dem tQ-Modell erhaltenen Mittelwerte für alle Bedingungen genau (Abb. S3a). Insbesondere deuten die engen Verteilungen der posterioren Mittelwerte darauf hin, dass die Schätzung von k cat mit dem tQ-Modell robust gegenüber dem Rauschen in den Daten ist (Abb. S1). Darüber hinaus sind die posterioren CVs viel kleiner als die prioren CVs (Abb. S3b), was auf eine präzise Schätzung von k cat mit dem tQ-Modell hinweist.
Als nächstes wurde K M unter der Annahme geschätzt, dass der Wert von k cat bekannt ist (Abb. 2b). Die mit dem sQ-Modell erhaltenen posterioren Stichproben von K M zeigen wiederum Fehler, die mit zunehmendem E T wachsen. Man beachte, dass die Schätzungen von K M nach oben verzerrt sind, was bedeutet, dass die Verwendung der posterioren Schätzungen von K M zur Validierung der MM-Gleichung (\({K}_{M}\gg {E}_{T}\)) irreführend sein kann. Andererseits sind die mit dem tQ-Modell erhaltenen Schätzungen von K M für alle Bedingungen wenig verzerrt. Im Gegensatz zu den engen posterioren Verteilungen von k cat (Abb. 2a) werden die mit dem tQ-Modell erhaltenen Verteilungen von K M jedoch breiter, so dass die Genauigkeit mit zunehmendem E T oder S T abnimmt (Abb. 2b). Diese Muster sind auch in den Boxplots der posterioren Mittelwerte und der posterioren CVs zu beobachten (Abb. S3c,d). Das Problem der Identifizierbarkeit entsteht, wenn \({E}_{T}\gg {K}_{M}\) oder \({S}_{T}\gg {K}_{M}\) und damit \({E}_{T}+{S}_{T}\gg {K}_{M}\) im tQ-Modell vernachlässigbar ist (Gl. 2), wie folgt:
Speziell, wenn K M zu niedrig ist, hat der Wert von K M wenig Einfluss auf die Dynamik des tQ-Modells und somit ist K M strukturell nicht identifizierbar. Insgesamt sind die Schätzungen von K M sowohl mit dem sQ- als auch mit dem tQ-Modell nicht zufriedenstellend, wenn auch aus unterschiedlichen Gründen: Die Schätzungen mit dem sQ-Modell können verzerrt sein und die mit dem tQ-Modell können strukturell nicht identifizierbar sein (Abb. 2b). Ähnliche Muster wurden auch beobachtet, wenn ein informativerer Prior gegeben wurde (Abb. S4). Insbesondere weisen die mit dem sQ-Modell erhaltenen Schätzungen selbst mit dem informativen Prior immer noch einen beträchtlichen Fehler auf, wenn E T zunimmt.
Die gleichzeitige Schätzung von k cat und K M leidet unter dem Mangel an Identifizierbarkeit
Als nächstes betrachteten wir die gleichzeitige Schätzung von zwei Parametern, k cat und K M , was das typische Ziel der Enzymkinetik ist. Für dieselben Gamma-Prioren, die bei der Schätzung für einen Parameter verwendet wurden (Abb. 2), wurden die Verteilungen der mit beiden Modellen erhaltenen Posterior-Stichproben insgesamt breiter (Abb. 3). Um den Grund für diese ungenaue Schätzung zu finden, analysierten wir die Streudiagramme der posterioren k cat- und K M-Stichproben (Abb. 4). Wenn \({S}_{T}\ll {K}_{M}\) (Abb. 4a-c), wiesen die mit dem sQ-Modell erhaltenen posterioren Stichproben von k cat und K M eine starke Korrelation auf, da die Dynamik des sQ-Modells nur vom Verhältnis k cat /K M abhängt, wie in der folgenden Näherung zu sehen ist:
wobei \({K}_{M}\gg {S}_{T}\ge {S}_{T}-P\) verwendet wird. Wird dagegen \({S}_{T}\gg {K}_{M}\) (Abb. 4g-i) verwendet, wird die Streuung des sQ-Modells horizontal, was auf die Unbestimmbarkeit der Struktur von K M hinweist. In der Tat hat der Wert von K M fast keinen Einfluss auf die Dynamik des sQ-Modells, wie in der folgenden Näherung zu sehen ist:
wobei K M + S T ≈ S T als \({S}_{T}\gg {K}_{M}\) verwendet wird. Diese mangelnde Identifizierbarkeit der Parameter bei Verwendung von \({S}_{T}\ll {K}_{M}\) oder \({S}_{T}\gg {K}_{M}\) steht im Einklang mit früheren Studien, die die Verwendung von S T ≈ K M für eine genauere Schätzung empfehlen22,23. Doch selbst wenn S T ≈ K M ist, sind die Schätzungen noch ungenau (Abb. 3a und b Mitte). Darüber hinaus sind die mit dem sQ-Modell erhaltenen Schätzungen mit zunehmendem E T verzerrt (Abb. 3), wie bei der Ein-Parameter-Schätzung (Abb. 2). Aus dieser Analyse geht hervor, dass die gleichzeitige Schätzung von k cat und K M mit dem sQ-Modell aufgrund von Identifizierungs- und Verzerrungsproblemen eine Herausforderung darstellt.
Wenn \({E}_{T}\gg {K}_{M}\) oder \({S}_{T}\gg {K}_{M}\), hat K M eine vernachlässigbare Auswirkung auf die Dynamik des tQ-Modells (Gl. 6), und daher war nur k cat in der Einzelparameterschätzung identifizierbar (Abb. 2a und b rechts oder unten). Wenn sowohl k cat als auch K M gleichzeitig mit dem tQ-Modell abgeleitet werden, ist nur die Schätzung von k cat genau und präzise (Abb. 3a und b rechts oder unten), wie aus den horizontalen Streudiagrammen entlang des wahren Wertes von k cat hervorgeht (Abb. 4c, f, g-i). In anderen Fällen (wenn weder \({E}_{T}\gg {K}_{M}\) noch \({S}_{T}\gg {K}_{M}\)), steigt die posteriore Varianz beider Parameter im Vergleich zur Schätzung mit nur einem Parameter dramatisch an (Abb. 2 und 3 links und oben). Diese ungenaue Schätzung hat zwei Ursachen, wie die Streudiagramme zeigen (Abb. 4a,b,d,e). Wenn k cat und K M zusammen abnehmen, ändert sich das Verhalten des tQ-Modells nur wenig im Vergleich zum SQ-Modell (Gl. 5), was zu einer starken Korrelation zwischen den posterioren Stichproben von k cat und K M führt. Wenn die Schätzungen von K M zusammen mit denen von k cat weiter abnehmen, so dass sie viel kleiner werden als E T + S T (gestrichelte vertikale Linie in Abb. 4), hängt das tQ-Modell nicht mehr vom Wert von K M ab, wie in Gl. 6 gezeigt, und somit werden die Streudiagramme horizontal.
Kombinierte Daten aus verschiedenen Experimenten ermöglichen eine genaue und präzise Schätzung mit dem tQ-Modell
Wie oben gezeigt, leidet die Schätzung sowohl von k cat als auch von K M unter Verwendung einer einzelnen Verlaufskurve unter erheblicher Verzerrung und mangelnder Identifizierbarkeit (Abb. 3 und 4), was mit früheren Studien übereinstimmt, die berichten, dass eine Verlaufskurve aus einem einzigen Experiment nicht ausreicht, um beide Parameter gleichzeitig zu identifizieren19. Daher untersuchen wir hier, ob die Verwendung mehrerer Zeitverlaufsdatensätze, die unter verschiedenen Versuchsbedingungen gewonnen wurden, die Schätzung verbessern kann.
In typischen In-vitro-Tests werden Verlaufskurven entweder mit einem festen S T und variiertem E T oder einem festen E T und variiertem S T gemessen 8,9,10,11,39. Wir betrachten zunächst den Fall, dass die Fortschrittskurven mit einem festen S T und einem variierten E T gemessen werden. Konkret werden Fortschrittskurven von niedrigem und hohem E T verwendet, um Parameter für ein festes S T auf verschiedenen Ebenen zu schätzen (Abb. S1 oben und unten). In diesem Fall weisen die mit dem sQ-Modell erhaltenen posterioren Stichproben erhebliche Fehler auf, da die Daten von hohem E T verwendet werden (Abb. 5a und S5). Andererseits erfassen die mit dem tQ-Modell erhaltenen posterioren Stichproben genau die wahren Werte von k cat und K M mit geringer Varianz (Abb. 5a und S5). Diese Verbesserung ergibt sich aus der Tatsache, dass die Daten, die bei niedrigem und hohem E T gewonnen wurden, unterschiedliche Arten von Informationen für die Parameterschätzung liefern. Insbesondere kann aus den Daten mit hohem E T, obwohl K M nicht identifizierbar ist, das k cat mit dem tQ-Modell genau geschätzt werden (Abb. 4c,f,i). Diese genaue Schätzung von k cat aus den hohen E T-Daten kann die Korrelation zwischen k cat und K M verhindern, wenn sie aus den niedrigen E T-Daten geschätzt werden (Abb. 4a,d). In der Tat sind die schmalen Streudiagramme des tQ-Modells (Abb. 5b links und Mitte) der Schnittpunkt zweier Streudiagramme, eines horizontalen, das mit den hohen E T-Daten (Abb. 4c,f) erhalten wurde, und eines nicht-horizontalen, das mit den niedrigen E T-Daten (Abb. 4a,d) erhalten wurde. Wenn S T jedoch hoch ist, wird das Streudiagramm aus den niedrigen E T-Daten ebenfalls horizontal (Abb. 4c), und somit nimmt der Synergieeffekt der Verwendung kombinierter Daten ab (Abb. 5a,b rechts). Zusammengenommen kann das tQ-Modell beide Parameter aus der Kombination von Daten mit niedrigem E T und hohem E T genau schätzen, wenn S T nicht viel größer als K M ist. Man beachte, dass ein solch niedriges S T bei In-vitro-Experimenten bevorzugt wird24,39,40,41 und bei den meisten physiologischen Bedingungen der Fall ist24.
Als Nächstes betrachten wir den Fall, dass Fortschrittskurven mit einem festen E T und einem variierten S T gemessen werden. Konkret wird die Kombination von zwei Fortschrittskurven bei niedrigem und hohem S T verwendet, um Parameter für ein festes E T auf verschiedenen Ebenen abzuleiten (Abb. S1 links und rechts). Wenn E T niedrig ist und sich daher die Modelle sQ und tQ ähnlich verhalten (Gl. 5), erfassen die mit beiden Modellen erhaltenen posterioren Stichproben genau die wahren Werte von k cat und K M (Abb. 6a links und S6). Auch hier ergibt sich das schmale Streudiagramm (Abb. 6b links) als Schnittpunkt eines nicht-horizontalen Streudiagramms von niedrigem S T (Abb. 4a) und eines horizontalen Streudiagramms von hohem S T (Abb. 4g). Mit zunehmendem E T und damit abnehmender Genauigkeit des sQ-Modells werden die mit dem sQ-Modell erhaltenen Werte jedoch erwartungsgemäß verzerrt (Abb. 6a rechts und S6). Während solche Verzerrungen bei den mit dem tQ-Modell erhaltenen Werten nicht zu beobachten sind, nimmt die Genauigkeit der K M-Schätzungen mit zunehmendem E T ab, wie bei der Ein-Parameter-Schätzung (Abb. 2 und Gl. 6).
Optimale Versuchsplanung für eine genaue und effiziente Schätzung mit dem tQ-Modell
Wenn eine aus einem einzigen Experiment gewonnene Verlaufskurve verwendet wird, können die posterioren Streudiagramme des tQ-Modells in einen korrelierten Typ (Abb. 4a,b,d,e) und einen horizontalen Typ (Abb. 4c,f,g-i) eingeteilt werden. Die Schnittpunkte dieser beiden verschiedenen Arten von Streudiagrammen sind in der Regel eng um den wahren Wert verteilt (Abb. 5b und 6b). Die Kombination zweier solcher Datensätze ermöglicht also eine genaue Schätzung sowohl von k cat als auch von K M (Abb. 5a und 6a). Genauer gesagt, eine unter \({E}_{T}\ll {K}_{M}\) und \({S}_{T}\ll {K}_{M}\) gemessene Verlaufskurve (Abb. 4a,b,d,e) und eine unter \({E}_{T}\gg {K}_{M}\) oder \({S}_{T}\gg {K}_{M}\) gemessene (Abb. 4c,f,g-i) 4c,f,g-i) liefern unterschiedliche Arten von Informationen für die Parameterschätzung; daher führt die Verwendung beider Datensätze zu einer erfolgreichen Schätzung. In der Praxis ist es jedoch schwierig, die Werte von S T , E T und K M zu vergleichen, da der Wert von K M in der Regel a priori unbekannt ist. Dieses Problem lässt sich leicht mit Hilfe des Streudiagramms lösen. Das heißt, wenn das aus dem ersten Experiment gewonnene posteriore Streudiagramm horizontal ist, dann sollten sowohl E T als auch S T für das nächste Experiment verringert werden, so dass ein nicht-horizontales Streudiagramm erhalten werden kann (Abb. 7a). Zeigt das Streudiagramm des ersten Versuchs hingegen eine starke Korrelation zwischen K M und k cat , dann sollte entweder S T oder E T im nächsten Versuch erhöht werden (Abb. 7b). Im Grunde genommen bestimmt die Form der Streudiagramme der aktuellen Schätzungen ohne vorherige Information über den Wert von K M und k cat den nächsten optimalen Versuchsplan, was eine genaue und präzise Schätzung gewährleistet. Dieser Ansatz kann jedoch nicht mit dem sQ-Modell verwendet werden, da die Schätzung mit dem sQ-Modell je nach der Beziehung zwischen E T oder S T und K M , die a priori unbekannt ist, verzerrt sein kann. Das heißt, im Gegensatz zum tQ-Modell garantiert eine präzise Schätzung nicht immer eine genaue Schätzung mit dem sQ-Modell, wie oben gesehen (z. B. Abb. 5a rechts).
Wir testen, ob der vorgeschlagene Ansatz mit dem tQ-Modell k cat und K M für die Katalyse von N-Acetylglycin-Ethylester, Fumarat und Harnstoff durch die Enzyme Chymotrypsin, Urease bzw. Fumarase genau schätzen kann (Abb. 7c). Diese drei Enzyme wurden ausgewählt, weil sie unterschiedliche katalytische Effizienzen (k cat /K M )1 aufweisen: 0,12, 4 – 105 bzw. 1,6 – 108 s -1 M -1. Für jedes Enzym wurden 102 verrauschte Zeitverlaufsdatensätze durch stochastische Simulationen auf der Grundlage bekannter kinetischer Enzymparameter1 erzeugt. Bei der Verwendung von Verlaufskurven, die mit niedrigem E T und niedrigem S T erhalten wurden, ergaben sich erwartungsgemäß für alle drei Enzyme nicht-horizontale Streudiagramme der posterioren Proben (Abb. 7c). Dies deutet darauf hin, dass entweder E T oder S T im nächsten Experiment erhöht werden sollte, um eine horizontale Streuung zu erhalten. Bei Verwendung einer Verlaufskurve mit einer 100-fachen Erhöhung von E T wurden in der Tat für alle Enzyme horizontale Streuungsdiagramme erhalten (Abb. 7c). Wenn diese beiden Verlaufskurven zusammen verwendet werden, können sowohl k cat als auch K M genau geschätzt werden (Abb. 7c, rote Punkte). Diese Ergebnisse belegen, dass ein solcher zweistufiger optimierter Versuchsplan (Abb. 7a,b), der zwei verschiedene Arten von Streudiagrammen liefert, eine genaue und effiziente Schätzung der Enzymkinetik mit dem tQ-Modell ermöglicht. Das Berechnungspaket, das eine solche Schätzung durchführt, wird zur Verfügung gestellt (siehe Methode für Details).