- Două tipuri de modele care descriu cinetica enzimatică: Modelele sQ și tQ
- Stimarea cu modelul tQ este lipsită de distorsiuni pentru orice combinație de concentrații ale enzimei și substratului
- Stimarea simultană a k cat și K M suferă de lipsa de identificabilitate
- Datele combinate de la diferite experimente permit o estimare exactă și precisă cu modelul tQ
- Proiectarea optimă a experimentelor pentru o estimare precisă și eficientă cu modelul tQ
Două tipuri de modele care descriu cinetica enzimatică: Modelele sQ și tQ
O reacție enzimatică fundamentală constă într-o singură enzimă și un singur substrat, în care enzima liberă (E) se leagă în mod reversibil cu substratul (S) pentru a forma complexul (C), iar complexul se disociază ireversibil în produs (P) și enzima liberă:
unde concentrația totală a enzimei (E T ≡ C + E) și concentrația totală a substratului și a produsului (S T ≡ S + C + P) sunt conservate. Un model popular care descrie acumularea produsului în timp se bazează pe ecuația MM, după cum urmează (a se vedea Metoda suplimentară pentru o derivare detaliată):
unde K M = (k b + k cat )/k f este constanta Michaelis-Menten și k cat este constanta catalitică. Acest model sQ derivat cu QSSA standard a fost utilizat pe scară largă pentru a estima parametrii cinetici, K M și k cat din curba de progresie a produsului8,9,10,10,11,23,25. Un alt model care descrie acumularea produsului este derivat cu QSSA total; acesta a fost dezvoltat mai târziu decât modelul sQ și, prin urmare, a primit mai puțină atenție pentru estimarea parametrilor26,27,28,29:
Deși acest model tQ este mai complicat decât modelul sQ, el este precis pe intervale mai largi decât modelul sQ. Mai exact, modelul sQ este precis atunci când
care necesită o concentrație scăzută a enzimei7,14. Pe de altă parte, modelul tQ este precis când
unde K = k b /k f este constanta de disociere27,28,29. Este important faptul că această condiție este în general valabilă și, astfel, modelul tQ, spre deosebire de modelul sQ, este precis chiar și atunci când enzima este în exces. A se vedea14,30 pentru mai multe detalii.
În continuare, am investigat acuratețea simulărilor stocastice efectuate cu ambele modele. În mod specific, am comparat simulările stocastice utilizând algoritmul Gillespie pe baza funcțiilor de propensiune fie din modelul complet original (descris în tabelul S1), fie din modelul sQ (tabelul S2), fie din modelul tQ (tabelul S3) pentru 9 condiții diferite31,32,33,33,34,35,36: E T este fie mai mică, fie similară, fie mai mare decât K M , iar S T este, de asemenea, fie mai mică, fie similară, fie mai mare decât K M (Fig. 1). Simulările stocastice ale modelului sQ nu reușesc să se apropie de cele ale modelului complet original atunci când E T nu este scăzut (adică E T nu este mai mic decât S T sau K M ). Pe de altă parte, simulările stocastice care utilizează modelul tQ sunt precise pentru toate condițiile (Fig. 1), ceea ce este în concordanță cu un studiu recent care arată că simulările stocastice cu modelele sQ și tQ sunt precise atunci când condițiile lor de validitate deterministă sunt valabile (ecuațiile (3) și (4))37,38. Luat împreună, modelul tQ este valabil pentru o gamă mai largă de condiții decât este modelul sQ, atât în sens determinist, cât și stocastic.
Stimarea cu modelul tQ este lipsită de distorsiuni pentru orice combinație de concentrații ale enzimei și substratului
Pentru că modelul tQ este precis pentru o gamă mai largă de condiții decât este modelul sQ (Fig. 1), am emis ipoteza că estimarea parametrilor bazată pe modelul tQ este, de asemenea, precisă pentru condiții mai generale. Pentru a investiga această ipoteză, am generat mai întâi 102 curbe de progres zgomotoase ale lui P din simulările stocastice ale modelului complet original (Fig. S1). Apoi, am dedus parametrii (k cat și K M ) din aceste seturi de date simulate prin aplicarea inferenței bayesiene cu funcțiile de verosimilitate bazate fie pe modelul sQ, fie pe modelul tQ, în condițiile unor priori gamma slab informative (Fig. S2) (a se vedea Metode pentru detalii). Rețineți că, pe parcursul acestui studiu, am utilizat curbele simulate de progresie a produsului (de exemplu, Fig. S1), deoarece trebuie să cunoaștem adevăratele valori ale parametrilor pentru compararea precisă a estimărilor bazate pe modelul sQ și modelul tQ.
Ne-am concentrat mai întâi asupra estimării lui k cat în ipoteza în care valoarea lui K M este cunoscută. Atunci când E T este scăzută, astfel încât atât modelul sQ, cât și modelul tQ sunt precise (Fig. 1 stânga), eșantioanele posterioare obținute cu ambele modele sunt similare și captează cu succes adevărata valoare a lui k cat (Fig. 2a stânga). Eșantioanele posterioare obținute cu cele două modele sunt similare deoarece, atunci când E T este scăzută și, prin urmare, \({E}_{T}\ll {S}_{T}+{K}_{M}\), ambele modele (ecuațiile 1 și 2) sunt aproximativ echivalente, după cum urmează:
unde prima aproximație provine din expansiunea Taylor în termeni de \({E}_{T}({S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)\ll 1\) (a se vedea27,28,29 pentru detalii). Prin urmare, atunci când \({E}_{T}\ll {S}_{T}+{K}_{M}\) și, astfel, modelul sQ este precis, estimările cu modelele sQ și tQ ar trebui să fie similare. Pe de altă parte, atunci când E T este mare, acestea prezintă diferențe clare (Fig. 2a dreapta): eșantioanele posterioare obținute cu modelul sQ prezintă erori mari, în timp ce cele obținute cu modelul tQ captează cu precizie valoarea reală a lui k cat .
Rezultate similare se observă, de asemenea, în diagramele de cutie ale mediilor posterioare și ale coeficienților de variație (CV) posterioare (Fig. S3a,b). În timp ce mediile posterioare obținute cu modelul sQ sunt distorsionate atunci când E T este ridicat, cele obținute cu modelul tQ sunt exacte pentru toate condițiile (Fig. S3a). În special, distribuțiile înguste ale mediilor posterioare indică faptul că estimarea lui k cat cu modelul tQ este robustă în fața zgomotului din date (Fig. S1). Mai mult, CV-urile posterioare sunt mult mai mici decât CV-urile anterioare (Fig. S3b), ceea ce indică o estimare precisă a lui k cat cu modelul tQ.
În continuare, K M a fost estimat în ipoteza în care valoarea lui k cat este cunoscută (Fig. 2b). Eșantioanele posterioare ale lui K M obținute cu modelul sQ prezintă din nou erori care cresc odată cu creșterea E T . Rețineți că estimările lui K M sunt denaturate în sus, ceea ce implică faptul că utilizarea estimărilor posterioare ale lui K M pentru a valida ecuația MM (\({K}_{M}\gg {E}_{T}\)) poate fi înșelătoare. Pe de altă parte, estimările lui K M obținute cu modelul tQ sunt puțin distorsionate pentru toate condițiile. Cu toate acestea, spre deosebire de distribuțiile posterioare înguste ale lui k cat (Fig. 2a), cele ale lui K M obținute cu modelul tQ devin mai largi; astfel, precizia scade odată cu creșterea E T sau S T (Fig. 2b). Aceste modele sunt, de asemenea, observate în diagramele de cutie ale mediilor posterioare și ale CV-urilor posterioare (Fig. S3c,d). Problema de identificabilitate apare deoarece, atunci când \({E}_{T}\gg {K}_{M}\) sau \({S}_{T}\gg {K}_{M}\) și, prin urmare, \({E}_{T}+{S}_{T}\gg {K}_{M}\), K M este neglijabil în modelul tQ (Ec. 2), după cum urmează:
În mod specific, atunci când K M este prea mic, valoarea lui K M are un efect redus asupra dinamicii modelului tQ și, astfel, K M este structural neidentificabil. Luate împreună, estimările lui K M atât cu modelul sQ, cât și cu modelul tQ nu sunt satisfăcătoare, deși din motive diferite: estimările cu modelul sQ pot fi distorsionate, iar cele cu modelul tQ pot fi neidentificabile din punct de vedere structural (Fig. 2b). Modele similare au fost, de asemenea, observate atunci când a fost acordat un prior mai informativ (Fig. S4). În special, chiar și cu priorul informativ, estimările obținute cu modelul sQ prezintă încă o eroare considerabilă pe măsură ce E T crește.
Stimarea simultană a k cat și K M suferă de lipsa de identificabilitate
În continuare, am luat în considerare estimarea simultană a doi parametri, k cat și K M , care este obiectivul tipic al cineticii enzimatice. Pentru aceleași priori gamma utilizate în estimarea cu un singur parametru (Fig. 2), distribuțiile eșantioanelor posterioare obținute cu ambele modele au devenit în general mai largi (Fig. 3). Pentru a găsi motivul unei astfel de estimări imprecise, am analizat diagramele de dispersie ale eșantioanelor posterioare k cat și K M (Fig. 4). Atunci când \({S}_{T}\ll {K}_{M}\) (Fig. 4a-c), eșantioanele posterioare de k cat și K M obținute cu modelul sQ au prezentat o corelație puternică, deoarece dinamica modelului sQ depinde numai de raportul k cat /K M , așa cum se observă în următoarea aproximare:
unde se folosește \({K}_{M}\gg {S}_{T}\ge {S}_{T}-P\). Pe de altă parte, atunci când \({S}_{T}\gg {K}_{M}\) (Fig. 4g-i), diagrama de dispersie a modelului sQ devine orizontală, ceea ce indică neidentificabilitatea structurii K M . Într-adevăr, valoarea lui K M M nu are aproape niciun efect asupra dinamicii modelului sQ, după cum se observă în următoarea aproximare:
unde K M + S T ≈ S T este folosit ca \({S}_{T}\gg {K}_{M}\). Această lipsă de identificabilitate a parametrilor atunci când se utilizează \({S}_{T}\ll {K}_{M}\) sau \({S}_{T}\gg {K}_{M}\) este în concordanță cu studiile anterioare, care recomandă utilizarea S T ≈ K M pentru o estimare mai precisă22,23. Cu toate acestea, chiar și atunci când S T ≈ K M , estimările sunt în continuare imprecise (Fig. 3a și b mijloc). Mai mult, pe măsură ce E T crește, estimările obținute cu modelul sQ sunt distorsionate (Fig. 3), la fel ca în cazul estimării cu un singur parametru (Fig. 2). Pe baza acestei analize, se pare că estimarea simultană a lui k cat și K M cu modelul sQ este o provocare din cauza problemelor de identificabilitate și de părtinire.
Când \({E}_{T}\gg {K}_{M}\) sau \({S}_{T}\gg {K}_{M}\), K M are un efect neglijabil asupra dinamicii modelului tQ (Ecuația 6) și, astfel, doar k cat a fost identificabil în estimarea cu un singur parametru (Fig. 2a și b dreapta sau jos). În mod similar, atunci când atât k cat, cât și K M sunt deduse simultan cu modelul tQ, estimarea doar a lui k cat este exactă și precisă (Fig. 3a și b dreapta sau jos), după cum arată diagramele de dispersie orizontală de-a lungul valorii reale a lui k cat (Fig. 4c,f,g-i). În alte cazuri (când nici \({E}_{T}\gg {K}_{M}\), nici \({S}_{T}\gg {K}_{M}\)), varianța posterioară a ambilor parametri crește dramatic în comparație cu estimarea cu un singur parametru (Fig. 2 și 3 stânga și sus). O astfel de estimare imprecisă provine din două surse, în conformitate cu diagramele de dispersie (Fig. 4a,b,d,e). Atunci când k cat și K M scad împreună, comportamentul modelului tQ se schimbă puțin ca modelul SQ (Ecuația 5), ceea ce duce la corelația puternică dintre eșantioanele posterioare ale lui k cat și K M . Pe măsură ce estimările lui K M continuă să scadă împreună cu cele ale lui k cat , astfel încât acestea devin mult mai mici decât E T + S T (linia verticală punctată din Fig. 4), modelul tQ nu mai depinde de valoarea lui K M , așa cum se arată în Ecuația 6, și astfel diagramele de dispersie devin orizontale.
Datele combinate de la diferite experimente permit o estimare exactă și precisă cu modelul tQ
După cum s-a arătat mai sus, estimarea atât a lui k cat, cât și a lui K M folosind o singură curbă de progresie suferă de o distorsiune considerabilă și de lipsă de identificabilitate (figurile 3 și 4), ceea ce este în concordanță cu studiile anterioare care raportează că o curbă de progresie obținută dintr-un singur experiment nu este suficientă pentru a identifica ambii parametri simultan19. Astfel, aici, investigăm dacă utilizarea mai multor seturi de date de evoluție temporală obținute în condiții experimentale diferite poate îmbunătăți estimarea.
În testele tipice in vitro, curbele de progresie sunt măsurate fie cu o S T fixă și o E T variată, fie cu o E T fixă și o S T variată 8,9,10,10,11,39. Considerăm mai întâi cazul în care curbele de progresie sunt măsurate cu un S T fix și un E T variat. Mai exact, curbele de progres atât de la un E T scăzut, cât și de la un E T ridicat sunt utilizate pentru a estima parametrii pentru un S T fix la diferite niveluri (Fig. S1 sus și jos). În acest caz, eșantioanele posterioare obținute cu modelul sQ prezintă erori considerabile pe măsură ce se utilizează datele de la E T ridicată (Fig. 5a și S5). Pe de altă parte, eșantioanele posterioare obținute cu modelul tQ captează cu exactitate adevăratele valori atât ale lui k cat, cât și ale lui K M, cu o variație redusă (Figurile 5a și S5). O astfel de îmbunătățire provine din faptul că datele obținute în condițiile unui E T scăzut și ridicat furnizează diferite tipuri de informații pentru estimarea parametrilor. În mod specific, din datele cu E T ridicată, deși K M nu este identificabil, k cat poate fi estimat cu precizie cu modelul tQ (Fig. 4c,f,i). O astfel de estimare precisă a lui k cat din datele E T ridicate poate preveni corelația dintre k cat și K M atunci când acestea sunt estimate din datele E T scăzute (Fig. 4a,d). Într-adevăr, diagramele de împrăștiere înguste ale modelului tQ (Fig. 5b stânga și mijloc) sunt intersecția a două diagrame de împrăștiere, una orizontală obținută cu datele E T ridicate (Fig. 4c,f) și una neorizontală obținută cu datele E T scăzute (Fig. 4a,d). Cu toate acestea, atunci când S T este ridicat, diagrama de dispersie obținută de la E T scăzută devine, de asemenea, orizontală (Fig. 4c) și, astfel, efectul sinergic al utilizării datelor combinate scade (Fig. 5a,b dreapta). Împreună, modelul tQ poate estima cu precizie ambii parametri din combinația de date E T scăzută și E T ridicată atunci când S T nu este mult mai mare decât K M . Rețineți că o astfel de S T scăzută este preferată pentru experimentele in vitro24,39,40,41 și este cazul pentru majoritatea condițiilor fiziologice24.
În continuare, luăm în considerare cazul în care curbele de progres sunt măsurate cu un E T fix și un S T variat. Mai exact, combinația a două curbe de progres de la S T scăzut și ridicat este utilizată pentru a deduce parametrii pentru un E T fix la diferite niveluri (Fig. S1 stânga și dreapta). Atunci când E T este scăzută și, prin urmare, modelele sQ și tQ se comportă în mod similar (Ecuația 5), eșantioanele posterioare obținute cu ambele modele captează cu exactitate adevăratele valori ale lui k cat și K M (Fig. 6a stânga și S6). Din nou, diagrama de împrăștiere îngustă (Fig. 6b stânga) este obținută ca intersecție a unei diagrame de împrăștiere neorizontale a S T scăzute (Fig. 4a) și a unei diagrame de împrăștiere orizontale a S T ridicate (Fig. 4g). Cu toate acestea, pe măsură ce E T crește și, astfel, modelul sQ devine mai puțin precis, cele obținute cu modelul sQ sunt distorsionate, așa cum era de așteptat (Fig. 6a dreapta și S6). În timp ce astfel de denaturări nu se observă în cele obținute cu modelul tQ, precizia estimărilor K M scade pe măsură ce E T crește, la fel ca în cazul estimării cu un singur parametru (Fig. 2 și Ecuația 6).
Proiectarea optimă a experimentelor pentru o estimare precisă și eficientă cu modelul tQ
Când se utilizează o curbă de progresie obținută dintr-un singur experiment, diagramele de dispersie posterioare ale modelului tQ pot fi clasificate ca fiind de tip corelat (Fig. 4a,b,d,e) și de tip orizontal (Fig. 4c,f,g-i). Intersecțiile acestor două tipuri diferite de diagrame de dispersie tind să fie distribuite în mod îngust în apropierea valorii reale (Fig. 5b și 6b). Astfel, combinarea a două astfel de seturi de date permite o estimare precisă atât a lui k cat, cât și a lui K M (figurile 5a și 6a). Mai exact, o curbă de progresie măsurată sub \({E}_{T}\ll {K}_{M}\) și \({S}_{T}\ll {K}_{M}\) (Fig. 4a,b,d,e) și una măsurată sub \({E}_{T}\gg {K}_{M}\) sau \({S}_{T}\gg {K}_{M}\) (Fig. 4c,f,g-i) furnizează diferite tipuri de informații pentru estimarea parametrilor; astfel, utilizarea ambelor seturi de date conduce la o estimare reușită. Cu toate acestea, este dificil de comparat valorile S T , E T , și K M în practică, deoarece valoarea lui K M este de obicei necunoscută a priori. Această problemă poate fi rezolvată cu ușurință prin utilizarea graficului de dispersie. Adică, dacă diagrama de dispersie posterioară obținută din primul experiment este orizontală, atunci atât E T, cât și S T ar trebui să fie reduse pentru următorul experiment, astfel încât să se poată obține o diagramă de dispersie neorizontală (Fig. 7a). Pe de altă parte, în cazul în care diagrama de dispersie obținută în urma primului experiment arată o corelație puternică între K M și k cat , atunci fie S T, fie E T ar trebui să fie mărită în următorul experiment (Fig. 7b). Practic, fără nicio informație prealabilă privind valoarea lui K M și k cat , forma diagramelor de dispersie ale estimărilor curente determină următorul design experimental optim, care asigură o estimare exactă și precisă. Cu toate acestea, această abordare nu poate fi utilizată cu modelul sQ, deoarece estimarea cu modelul sQ poate fi distorsionată, în funcție de relația dintre E T sau S T și K M , care este necunoscută a priori. Adică, spre deosebire de modelul tQ, estimarea precisă nu garantează întotdeauna o estimare precisă cu modelul sQ, așa cum s-a văzut mai sus (de exemplu, Fig. 5a dreapta).
Am testat dacă abordarea propusă cu modelul tQ poate estima cu exactitate k cat și K M pentru cataliza esterului etilic al N-acetilglicinei, fumaratului și ureei de către enzimele chimotripsină, urează și, respectiv, fumarază (Fig. 7c). Aceste trei enzime au fost alese deoarece au eficiențe catalitice disparate (k cat /K M )1: 0,12, 4 – 105 și, respectiv, 1,6 – 108 s -1 M -1 . Pentru fiecare enzimă, au fost generate 102 seturi de date cu timecourse zgomotoase folosind simulări stocastice bazate pe parametrii cinetici cunoscuți ai enzimei1. Atunci când se utilizează curbele de progresie obținute cu E T scăzută și S T scăzută, așa cum era de așteptat, s-au obținut diagrame de dispersie neorizontale ale eșantioanelor posterioare pentru toate cele trei enzime (Fig. 7c). Acest lucru indică faptul că fie E T, fie S T ar trebui să fie crescut în următorul experiment pentru a obține un grafic de dispersie orizontal. Într-adevăr, atunci când a fost utilizată o curbă de progresie cu o creștere de 100 de ori a E T, s-au obținut diagrame de dispersie orizontale pentru toate enzimele (Fig. 7c). Prin urmare, atunci când aceste două curbe de progresie sunt utilizate împreună, atât k cat, cât și K M pot fi estimate cu exactitate (Fig. 7c puncte roșii). Aceste rezultate susțin faptul că un astfel de design experimental optimizat în două etape (Fig. 7a,b) pentru a obține două tipuri diferite de diagrame de dispersie permite o estimare precisă și eficientă a cineticii enzimatice cu modelul tQ. Pachetul de calcul care realizează o astfel de estimare este furnizat (a se vedea Metoda pentru detalii).