- Due tipi di modelli che descrivono la cinetica enzimatica: I modelli sQ e tQ
- La stima con il modello tQ è imparziale per qualsiasi combinazione di concentrazioni di enzima e substrato
- La stima simultanea di k cat e K M soffre della mancanza di identificabilità
- Dati combinati da diversi esperimenti consentono una stima accurata e precisa con il modello tQ
- Progettazione ottimale degli esperimenti per una stima accurata ed efficiente con il modello tQ
Due tipi di modelli che descrivono la cinetica enzimatica: I modelli sQ e tQ
Una reazione enzimatica fondamentale consiste in un singolo enzima e un singolo substrato, dove l’enzima libero (E) si lega reversibilmente con il substrato (S) per formare il complesso (C), e il complesso si dissocia irreversibilmente nel prodotto (P) e l’enzima libero:
dove la concentrazione totale dell’enzima (E T ≡ C + E) e la concentrazione totale di substrato e prodotto (S T ≡ S + C + P) sono conservate. Un modello popolare che descrive l’accumulo del prodotto nel tempo è basato sull’equazione MM, come segue (vedi metodo supplementare per la derivazione dettagliata):
dove K M = (k b + k cat )/k f è la costante di Michaelis-Menten e k cat è la costante catalitica. Questo modello sQ derivato con il QSSA standard è stato ampiamente utilizzato per stimare i parametri cinetici, K M e k cat dalla curva di progresso del prodotto8,9,10,11,23,25. Un altro modello che descrive l’accumulo del prodotto è derivato con il QSSA totale; è stato sviluppato più tardi rispetto al modello sQ e quindi ha ricevuto meno attenzione per la stima dei parametri26,27,28,29:
Anche se questo modello tQ è più complicato del modello sQ, è accurato su intervalli più ampi del modello sQ. In particolare, il modello sQ è accurato quando
che richiede una bassa concentrazione enzimatica7,14. D’altra parte, il modello tQ è accurato quando
dove K = k b /k f è la costante di dissociazione27,28,29. È importante notare che questa condizione è generalmente valida e quindi il modello tQ, a differenza del modello sQ, è accurato anche quando l’enzima è in eccesso. Vedere14,30 per maggiori dettagli.
Successivamente, abbiamo studiato la precisione delle simulazioni stocastiche eseguite con entrambi i modelli. In particolare, abbiamo confrontato le simulazioni stocastiche utilizzando l’algoritmo di Gillespie basato sulle funzioni di propensione dal modello completo originale (descritto nella Tabella S1), il modello sQ (Tabella S2), o il modello tQ (Tabella S3) per 9 diverse condizioni31,32,33,34,35,36: E T è inferiore, simile o superiore a K M, e S T è anche inferiore, simile o superiore a K M (Fig. 1). Le simulazioni stocastiche del modello sQ non riescono ad approssimare quelle del modello completo originale quando E T non è basso (cioè, E T non è inferiore né a S T né a K M ). D’altra parte, le simulazioni stocastiche che utilizzano il modello tQ sono accurate per tutte le condizioni (Fig. 1), come è coerente con un recente studio che mostra che le simulazioni stocastiche con i modelli sQ e tQ sono accurate quando le loro condizioni di validità deterministiche tengono (Eqs (3) e (4))37,38. Nel complesso, il modello tQ è valido per una gamma più ampia di condizioni rispetto al modello sQ sia in senso deterministico che stocastico.
La stima con il modello tQ è imparziale per qualsiasi combinazione di concentrazioni di enzima e substrato
Perché il modello tQ è accurato per una gamma più ampia di condizioni rispetto al modello sQ (Fig. 1), abbiamo ipotizzato che la stima dei parametri basata sul modello tQ sia accurata anche per condizioni più generali. Per indagare questa ipotesi, abbiamo prima generato 102 curve di avanzamento rumorose di P dalle simulazioni stocastiche del modello completo originale (Fig. S1). Poi, abbiamo dedotto i parametri (k cat e K M ) da questi set di dati simulati applicando l’inferenza bayesiana con le funzioni di verosimiglianza basate sul modello sQ o tQ, sotto priori gamma debolmente informativi (Fig. S2) (vedi metodi per i dettagli). Si noti che in tutto questo studio, abbiamo usato le curve di avanzamento del prodotto simulate (ad esempio Fig. S1) perché abbiamo bisogno di conoscere i veri valori dei parametri per il confronto accurato delle stime basate sul modello sQ e il modello tQ.
Prima ci siamo concentrati sulla stima del gatto k sotto l’ipotesi che il valore di K M è noto. Quando E T è basso, in modo che entrambi i modelli sQ e tQ siano accurati (Fig. 1 a sinistra), i campioni posteriori ottenuti con entrambi i modelli sono simili e catturano con successo il vero valore di k cat (Fig. 2a sinistra). I campioni posteriori ottenuti con i due modelli sono simili perché, quando E T è basso e quindi \({E}_{T}\ll {S}_{T}+{K}_{M}}), entrambi i modelli (Eqs 1 e 2) sono approssimativamente equivalenti come segue:
dove la prima approssimazione deriva dall’espansione di Taylor in termini di \({E}_{T}({S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)\ll 1\) (vedi27,28,29 per i dettagli). Perciò, quando \({E}_{T}{S}_{T}+{K}_{M}}) e quindi il modello sQ è accurato, le stime con i modelli sQ e tQ dovrebbero essere simili. D’altra parte, quando E T è alto, mostrano chiare differenze (Fig. 2a a destra): i campioni posteriori ottenuti con il modello sQ mostrano grandi errori, mentre quelli ottenuti con il modello tQ catturano accuratamente il vero valore di k cat.
Risultati simili si osservano anche nei diagrammi in scatola di mezzi posteriori e coefficienti di variazione posteriori (CV) (Fig. S3a,b). Mentre i mezzi posteriori ottenuti con il modello sQ sono distorti quando E T è alto, quelli ottenuti con il modello tQ sono accurati per tutte le condizioni (Fig. S3a). In particolare, strette distribuzioni di mezzi posteriori indicano che la stima di k cat con il modello tQ è robusto contro il rumore nei dati (Fig. S1). Inoltre, i CV posteriori sono molto più piccoli dei CV precedenti (Fig. S3b), indicando una stima precisa di k cat con il modello tQ.
Poi, K M è stato stimato sotto il presupposto che il valore di k cat è noto (Fig. 2b). I campioni posteriori del K M ottenuti con il modello sQ mostrano di nuovo errori che crescono con l’aumentare di E T . Si noti che le stime del K M sono distorte verso l’alto, il che implica che l’uso delle stime posteriori del K M per convalidare l’equazione MM (\({K}_{M}_{T}_gg {E}_{T})) può essere fuorviante. D’altra parte, le stime di K M ottenute con il modello tQ sono poco distorte per tutte le condizioni. Tuttavia, a differenza delle strette distribuzioni posteriori di k cat (Fig. 2a), quelle di K M ottenute con il modello tQ diventano più ampie; quindi la precisione diminuisce all’aumentare di E T o S T (Fig. 2b). Questi modelli sono anche osservati nei diagrammi a scatola di mezzi posteriori e CV posteriori (Fig. S3c,d). Il problema dell’identificabilità sorge perché, quando \({E}_{T}\gg {K}_{M}) o \({S}_{T}\gg {K}_{M}) e quindi \({E}_{T}+{S}_{T}\gg {K}_{M}), il K M è trascurabile nel modello tQ (Eq. 2), come segue:
Specificamente, quando K M è troppo basso, il valore di K M ha poco effetto sulla dinamica del modello tQ e quindi il K M è strutturalmente non identificabile. Nel complesso, le stime di K M con entrambi i modelli sQ e tQ non sono soddisfacenti, anche se per ragioni diverse: le stime con il modello sQ possono essere distorte e quelle con il modello tQ possono essere strutturalmente non identificabili (Fig. 2b). Modelli simili sono stati osservati anche quando è stato dato un priore più informativo (Fig. S4). In particolare, anche con il priore informativo, le stime ottenute con il modello sQ mostrano ancora un errore considerevole all’aumentare di E T.
La stima simultanea di k cat e K M soffre della mancanza di identificabilità
In seguito, abbiamo considerato la stima simultanea di due parametri, k cat e K M , che è il tipico obiettivo della cinetica enzimatica. Per gli stessi priori gamma usati nella stima del singolo parametro (Fig. 2), le distribuzioni dei campioni posteriori ottenute con entrambi i modelli sono diventate complessivamente più ampie (Fig. 3). Per trovare la ragione di tale stima imprecisa, abbiamo analizzato i diagrammi di dispersione dei campioni posteriori di k cat e K M (Fig. 4). Quando \({S}_{T} \({K}_{M}}) (Fig. 4a-c), i campioni posteriori di k gatto e K M ottenuti con il modello sQ hanno mostrato una forte correlazione, perché la dinamica del modello sQ dipende solo dal rapporto k gatto /K M , come si vede nella seguente approssimazione:
dove viene usato \({K}_{M}\gg {S}_{T}\ge {S}_{T}-P\). D’altra parte, quando \({S}_{T}\gg {K}_{M}}) (Fig. 4g-i), lo scatter plot del modello sQ diventa orizzontale, indicando la non identificabilità della struttura del K M . Infatti, il valore di K M non ha quasi nessun effetto sulla dinamica del modello sQ, come si vede nella seguente approssimazione:
dove K M + S T ≈ S T è usato come \({S}_{T}\gg {K}_{M}). Tale mancanza di identificabilità del parametro quando si usa \({S}_{T}}ll {K}_{M}}) o \({S}_{T}gg {K}_{M}) è coerente con studi precedenti, che raccomandano di usare S T ≈ K M per una stima più precisa22,23. Tuttavia, anche quando S T ≈ K M , le stime sono ancora imprecise (Fig. 3a e b centrale). Inoltre, quando E T aumenta, le stime ottenute con il modello sQ sono distorte (Fig. 3) come nella stima a singolo parametro (Fig. 2). Sulla base di questa analisi sembra che la stima simultanea di k cat e K M con il modello sQ sia impegnativa a causa dei problemi di identificabilità e di distorsione.
Quando \({E}_{T}\gg {K}_{M}) o \({S}_{T}\gg {K}_{M}), il K M ha un effetto trascurabile sulla dinamica del modello tQ (Eq. 6), e quindi solo k cat era identificabile nella stima singolo parametro (Fig. 2a e b destra o inferiore). Allo stesso modo, quando sia k cat che K M sono dedotti simultaneamente con il modello tQ, la stima di solo k cat è accurata e precisa (Fig. 3a e b a destra o in basso), come è mostrato dai plot di dispersione orizzontali lungo il valore reale di k cat (Fig. 4c,f,g-i). In altri casi (quando né \({E}_{T}\gg {K}_{M}) né \({S}_{T}\gg {K}_{M})), la varianza posteriore di entrambi i parametri aumenta drammaticamente rispetto alla stima del singolo parametro (Figg. 2 e 3 a sinistra e in alto). Tale stima imprecisa deriva da due fonti, secondo i diagrammi di dispersione (Fig. 4a,b,d,e). Quando k cat e K M diminuiscono insieme, il comportamento del modello tQ cambia poco rispetto al modello SQ (Eq. 5), il che porta alla forte correlazione tra i campioni posteriori di k cat e K M . Quando le stime di K M continuano a diminuire insieme a quelle di k cat , in modo da diventare molto meno di E T + S T (linea verticale tratteggiata di Fig. 4), il modello tQ non dipende più dal valore di K M , come mostrato nell’Eq. 6, e quindi i grafici di dispersione diventano orizzontali.
Dati combinati da diversi esperimenti consentono una stima accurata e precisa con il modello tQ
Come mostrato sopra, la stima di entrambi k cat e K M utilizzando una singola curva di progresso soffre di distorsioni notevoli e la mancanza di identificabilità (Figg. 3 e 4), che è coerente con studi precedenti che riportano che una curva di progresso ottenuto da un singolo esperimento non è sufficiente per identificare entrambi i parametri contemporaneamente19. Così, qui, indaghiamo se l’utilizzo di più serie di dati timecourse ottenuti in diverse condizioni sperimentali può migliorare la stima.
Nei tipici saggi in vitro, le curve di progresso sono misurate con una T S fissa e una T E variata o una T E fissa e una T S variata 8,9,10,11,39. Consideriamo prima il caso in cui le curve di progresso sono misurate con un S T fisso e un E T variato. In particolare, le curve di progresso sia da basso e alto E T sono utilizzati per stimare i parametri per un S T fisso a diversi livelli (Fig. S1 superiore e inferiore). In questo caso, i campioni posteriori ottenuti con il modello sQ mostrano errori considerevoli in quanto vengono utilizzati i dati da alta E T (Figg. 5a e S5). D’altra parte, i campioni posteriori ottenuti con il modello tQ catturano accuratamente i veri valori sia di k cat che di K M con bassa varianza (Figg. 5a e S5). Tale miglioramento deriva dal fatto che i dati ottenuti sotto il basso e alto E T forniscono diversi tipi di informazioni per la stima dei parametri. In particolare, dai dati ad alta E T, anche se il K M non è identificabile, il k cat può essere accuratamente stimato con il modello tQ (Fig. 4c,f,i). Tale stima accurata di k cat dai dati ad alta E T può impedire la correlazione tra il k cat e il K M quando sono stimati dai dati a bassa E T (Fig. 4a,d). Infatti, gli stretti diagrammi di dispersione del modello tQ (Fig. 5b a sinistra e al centro) sono l’intersezione di due diagrammi di dispersione, uno orizzontale ottenuto con i dati E T alti (Fig. 4c,f) e uno non orizzontale ottenuto con i dati E T bassi (Fig. 4a,d). Tuttavia, quando S T è alta, il grafico di dispersione dalla bassa E T diventa anche orizzontale (Fig. 4c), e quindi l’effetto sinergico dell’uso di dati combinati diminuisce (Fig. 5a,b destra). Nel complesso, il modello tQ può stimare con precisione entrambi i parametri dalla combinazione di dati E T bassa e alta E T quando S T non è molto più grande di K M . Si noti che tale basso S T è preferito per gli esperimenti in vitro24,39,40,41 ed è il caso per la maggior parte delle condizioni fisiologiche24.
In seguito, consideriamo il caso in cui le curve di progresso sono misurate con un E T fisso e un S T vario. In particolare, la combinazione di due curve di progresso da basso e alto S T viene utilizzata per dedurre i parametri per un E T fisso a diversi livelli (Fig. S1 sinistra e destra). Quando E T è bassa, e quindi i modelli sQ e tQ si comportano in modo simile (Eq. 5), i campioni posteriori ottenuti con entrambi i modelli catturano accuratamente i veri valori di k cat e K M (Figg. 6a sinistra e S6). Ancora una volta, il grafico di dispersione stretto (Fig. 6b a sinistra) è ottenuto come l’intersezione di un grafico di dispersione non orizzontale di basso S T (Fig. 4a) e un grafico di dispersione orizzontale di alto S T (Fig. 4g). Tuttavia, come E T aumenta, e quindi il modello sQ diventa meno preciso, quelli ottenuti con il modello sQ sono distorti, come previsto (Figg. 6a destra e S6). Mentre tali distorsioni non sono osservate in quelle ottenute con il modello tQ, la precisione delle stime di K M diminuisce all’aumentare di E T, come nella stima a singolo parametro (Fig. 2 e Eq. 6).
Progettazione ottimale degli esperimenti per una stima accurata ed efficiente con il modello tQ
Quando si usa una curva di progresso ottenuta da un singolo esperimento, i diagrammi di dispersione posteriore del modello tQ possono essere classificati come un tipo correlato (Fig. 4a,b,d,e) e un tipo orizzontale (Fig. 4c,f,g-i). Le intersezioni di questi due diversi tipi di diagrammi di dispersione tendono ad essere strettamente distribuite vicino al valore vero (Figg. 5b e 6b). Pertanto, la combinazione di due tali set di dati permette una stima accurata di entrambi k cat e K M (Figg. 5a e 6a). In particolare, una curva di progresso misurata sotto \({E}_{T}{ll {K}_{M}) e \({S}_{T}{ll {K}_{M}) (Fig. 4a,b,d,e) e una misurata sotto \({E}_{T}gg {K}_{M}) o \({S}_{T}\gg {K}_{M}) (Fig. 4c,f,g-i) forniscono diversi tipi di informazioni per la stima dei parametri; quindi l’utilizzo di entrambi i set di dati porta ad una stima di successo. Tuttavia, è difficile confrontare i valori di S T , E T , e K M in pratica, perché il valore di K M è solitamente sconosciuto a priori. Questo problema può essere facilmente risolto utilizzando il grafico di dispersione. Cioè, se il plot di dispersione posteriore ottenuto dal primo esperimento è orizzontale, allora sia E T che S T dovrebbero essere diminuiti per l’esperimento successivo, in modo che il plot di dispersione non orizzontale possa essere ottenuto (Fig. 7a). D’altra parte, se il grafico di dispersione del primo esperimento mostra una forte correlazione tra K M e k cat, allora S T o E T dovrebbe essere aumentato nell’esperimento successivo (Fig. 7b). Fondamentalmente, senza alcuna informazione preliminare sul valore di K M e k cat, la forma dei diagrammi di dispersione delle stime attuali determina il prossimo disegno sperimentale ottimale, che assicura una stima accurata e precisa. Tuttavia, questo approccio non può essere utilizzato con il modello sQ, perché la stima con il modello sQ può essere distorta, a seconda della relazione tra E T o S T e K M , che è sconosciuta a priori. Cioè, a differenza del modello tQ, la stima precisa non garantisce sempre una stima accurata con il modello sQ, come si è visto sopra (per esempio la Fig. 5a a destra).
Testiamo se l’approccio proposto con il modello tQ può stimare con precisione k cat e K M per la catalisi della N-acetilglicina etil estere, fumarato, e urea dagli enzimi la chimotripsina, ureasi, e fumarasi, rispettivamente (Fig. 7c). Questi tre enzimi sono stati scelti perché hanno efficienze catalitiche disparate (k cat /K M )1: 0.12, 4 – 105, e 1.6 – 108 s -1 M -1, rispettivamente. Per ogni enzima, 102 set di dati rumorosi timecourse sono stati generati utilizzando simulazioni stocastiche basate su parametri cinetici enzimatici noti1. Quando le curve di progressione ottenute con basso E T e basso S T sono utilizzati, come previsto, non orizzontale diagrammi di dispersione dei campioni posteriori sono stati ottenuti per tutti e tre gli enzimi (Fig. 7c). Ciò indica che o E T o S T dovrebbe essere aumentato nel prossimo esperimento per ottenere un grafico di dispersione orizzontale. Infatti, quando una curva di progresso con un aumento di 100 volte di E T è stato utilizzato, plot di dispersione orizzontale sono stati ottenuti per tutti gli enzimi (Fig. 7c). Pertanto, quando queste due curve di progresso vengono utilizzati insieme, sia k cat e K M può essere accuratamente stimato (Fig. 7c punti rossi). Questi risultati supportano che tale disegno sperimentale ottimizzato in due fasi (Fig. 7a,b) per ottenere due diversi tipi di diagrammi di dispersione consente una stima accurata ed efficiente della cinetica enzimatica con il modello tQ. Il pacchetto di calcolo che esegue tale stima è fornito (vedi Metodo per i dettagli).