Beyond the Michaelis-Menten equation: 酵素動力学パラメータの正確かつ効率的な推定

酵素動力学を記述する2つのタイプのモデル。 遊離酵素(E)が基質(S)と可逆的に結合して複合体(C)を形成し、複合体は生成物(P)と遊離酵素に不可逆的に解離する。

$$E+S\underset{{k}_{b}}{\overset{{k}_{f}}{\rightleftharpoons }}C\mathop{\to }\limits^{{k}_{cat}}E+P,$$

ここで、全酵素濃度(E T≡C + E)と全基質・生成物濃度(S T≡S + C + P)は保存される。 生成物の経時的な蓄積を記述する一般的なモデルは、以下のようなMM式に基づいている(詳細な導出はSupplement Methodを参照)。

$$dot{P}={k}_{cat} {{E}_{T}({S}_{T}-P)}{{K}_{M}+{S}_{T}-P},$$
(1)

ここでK M = (k b + k cat )/k fはミカエリス-メンテン定数、k catは触媒定数である。 この標準的なQSSAで導かれるsQモデルは、生成物の進行曲線から速度論的パラメータであるK Mとk catを推定するのに広く用いられてきた8,9,10,11,23,25。 また、生成物の蓄積を記述する別のモデルとして、total QSSAを用いたモデルがありますが、sQモデルより後に開発されたため、パラメータ推定にはあまり注目されていません26,27,28,29。

$$\dot{P}={k}_{cat}\tfrac{{E}_{T}+{K}_{M}+{S}_{T}-P-\sqrt{{({E}_{T}+{K}_{M}+{S}_{T}-P)}^{2}-4{E}_{T}({S}_{T}-P)}}{2}.$$
(2)

このtQモデルはsQモデルより複雑であるが、sQモデルより広い範囲で正確である。 具体的には、sQモデルは

$$frac{{E}_{T}}{{K}_{M}+{S}_{T}}ll 1,$$
(3)

のとき正確で、これは低い酵素濃度であることが必要である7、14。 一方、tQモデルは$$

$$frac{K}{2{S}_{T}}{{E}_{T}+{K}_{M}+{S}_{T}}{sqrt{({E}_{T}+{K}_{M}+{S}_{T}-P)}^{2}-4{E}_{T} ({S}_{T}-P)}}ll 1で正確であった。$$
(4)

ここで、K = k b /k fは解離定数27,28,29である。 重要なことは、この条件が一般に有効であるため、tQモデルはsQモデルとは異なり、酵素が過剰であっても正確であることである。 詳細は14,30を参照されたい。

次に、両モデルを用いて行った確率的シミュレーションの精度を検討した。 具体的には,元の完全モデル(表S1),sQモデル(表S2),tQモデル(表S3)の傾向関数に基づいて,Gillespieアルゴリズムを用いて,E TがK Mより低いか,同じか,それより高い,またS TがK Mより低いか,同じか,それより高い9種類の条件31,32,33,34,35,36の確率的シミュレーションを比較した(図1). E T が S T と K M のいずれよりも低い場合、sQ モデルの確率論的シミュレーションは、オリジナルのフルモデルと近似することができない。 一方,tQ モデルによる確率論的シミュレーションは,sQ モデルと tQ モデルの決定論的有効条件(式(3),(4))37,38 が成立すれば,すべての条件で正確であることが最近の研究で示されている(図1). 7033>

図1

sQモデルはE Tが増加すると元のフルモデルを近似できないが、tQモデルはE Tに関わらず正確な値であることがわかる。 元のフルモデル(表S1)、sQモデル(表S2)、およびtQモデル(表S3)の確率的シミュレーションは、S T = 0.2、2、または80 nM、およびE T = 0.2、2、または40 nMで実行された。 これらの濃度は、K M ≈ 2 nM よりも低いか、同程度か、または高いことに注意されたい。 ここで、線と色のついた範囲は、104回の確率的シミュレーションの平均軌道と変動範囲(平均値から±2σ)を表している。

tQモデルによる推定は、酵素と基質濃度のどの組み合わせでも不偏である

tQモデルはsQモデルよりも広い範囲の条件に対して正確なので(図1)、我々はtQモデルに基づくパラメータ推定もより一般的な条件に対して正確だと仮定した。 この仮説を検証するために、まず、オリジナルのフルモデルの確率的シミュレーションから、102本のノイズの多いPの進行曲線を生成した(図S1)。 次に、これらのシミュレーションデータから、弱情報量ガンマプリオアの下、sQモデルまたはtQモデルに基づく尤度関数によるベイズ推定を行い、パラメータ(k cat と K M )を推定した(図S2)(詳細は、Methods 参照)。 なお、本研究では、sQモデルとtQモデルに基づく推定値の正確な比較のためには、パラメータの真の値を知る必要があるため、シミュレーションした製品進捗曲線(例えば、図S1)を用いた。

まず、K Mの値が分かっているという仮定で、k catの推定に注目した。 E Tが低く、sQモデルとtQモデルの両方が正確な場合(図1左)、両モデルで得られる事後標本は似ており、k catの真の値をうまく捉えている(図2a左)。 両モデルで得られる事後標本が似ているのは、E Tが低く、したがって、 \({E}_{T}ll {S}_{T}+{K}_{M}) のとき、両モデル(式1、2)は次のようにほぼ等価であるためである。

$$\tfrac{{E}_{T}+{K}_{M}+{S}_{T}-P-\sqrt{{({E}_{T}+{K}_{M}+{S}_{T}-P)}^{2}-4{E}_{T}({S}_{T}-P)}}{2}\approx \tfrac{{E}_{T}({S}_{T}-P)}{{K}_{M}+{E}_{T}+{S}_{T}-P}\approx \tfrac{{E}_{T}({S}_{T}-P)}{{K}_{M}+{S}_{T}-P},$$
(5)

ここで、第一の近似は \({E}_{T}({S}_{T}-P)/({E}_{T}+{K}_{M}+{S}_{T}-P)\ll 1) によるテイラー展開からきている。 (詳細は27,28,29を参照)。 従って,sQモデルが正確である場合,sQモデルとtQモデルによる推定は類似しているはずである. 図2

sQモデルとtQモデルによる単一パラメータ(k catまたはK M)の推定値です。 各条件(S T = 0.2, 2, または 80 nM, および E T = 0.2, 2, または 40 nM)について、102 個のノイズの多いデータセット(図 S1)にベイズ推論を適用して k cat (a) または K M (b) のいずれかの事後標本を 105 個得た(詳細は Methods を参照)。 k catをサンプリングした場合、K Mはその真値で固定され(a)、その逆(b)である。 ここで、緑の三角形はパラメータの真値を示す。 sQモデルで得られたk catとK Mの推定値はE Tの増加とともに偏りが生じるが、tQモデルで得られた推定値は条件によらずほとんど偏りがない(推定値の箱ひげ図は図S3参照)。 E TやS Tが増加すると、tQモデルを用いた場合のK Mの事後分散は増加する。

同様の結果は、事後平均と事後変動係数(CV)の箱ひげ図にも見られる(図S3a、b)。 sQモデルで得られた事後平均はE Tが高いときに偏るが、tQモデルで得られたものはすべての条件において正確である(図S3a)。 特に、事後平均の分布が狭いことから、tQモデルによるk猫の推定はデータのノイズに対してロバストであることがわかる(Fig.S1)。 さらに、事後CVは事前CVよりもはるかに小さく(図S3b)、tQモデルによるk catの推定が正確であることがわかる。

次に、k catの値がわかっているとの仮定で、K Mを推定した(図2b)。 sQモデルで得られたK Mの事後標本では、やはりE Tが大きくなるにつれて誤差が大きくなっている。 このようにK Mの推定値が上方に偏っていることから,MM式( \({K}_{M}gg {E}_{T} ) の検証にK Mの事後推定値を用いると誤解を招く可能性があることがわかる. 一方、tQモデルで得られたK Mの推定値は、どの条件でもほとんど偏りがない。 しかし、k catの狭い事後分布(図2a)とは異なり、tQモデルで得られたK Mの分布は広くなり、E TやS Tが増加すると精度が低下する(図2b)。 このようなパターンは、事後平均と事後CVの箱ひげ図(図S3c、d)でも観察される。 この識別可能性の問題は、(1) Ⓐ({E}_{T} ◇gg {K}_{M}) Ⓑ({S}_{T} ◇gg {K}_{M}) の場合、tQモデル(式)ではK Mが無視できるので発生したものである。 2)では、以下のようになる。

$$\tfrac{{E}_{T}+{K}_{M}+{S}_{T}-P-\sqrt{{({E}_{T}+{K}_{M}+{S}_{T}-P)}^{2}-4{E}_{T}({S}_{T}-P)}}{2}\approx \tfrac{{E}_{T}+{S}_{T}-P-\sqrt{{({E}_{T}+{S}_{T}-P)}^{2}-4{E}_{T}({S}_{T}-P)}}{2}.$$
(6)

具体的には、K Mの値が低すぎると、tQモデルのダイナミクスにほとんど影響を与えないので、K Mは構造的に特定できないことになる。 このように、sQモデルとtQモデルでK Mを推定すると、sQモデルでは推定に偏りが生じ、tQモデルでは構造的に同定できない、という異なる理由ではあるが、満足できるものではない(図2b)。 また、より情報量の多い事前分布を与えた場合にも同様のパターンが観察された(Fig.S4)。 特に、情報量の多い事前分布を与えても、sQモデルで得られた推定値はE Tが増加するにつれてかなりの誤差を示す。

Simultaneous estimation of k cat and K M suffer from the lack of identifiability

次に、酵素動力学で典型的に目標となる二つのパラメータ、k catとK Mの同時推定について考えた。 単パラメータ推定で用いたのと同じガンマプライヤーを用いた場合(図2)、両モデルで得られた事後サンプルの分布は全体的に広くなった(図3)。 このような不正確な推定の原因を探るため、k catとK Mの事後サンプルの散布図を分析した(図4)。 図4)。 4a-c)の場合、sQモデルのダイナミクスはk cat /K Mの比にのみ依存するため、sQモデルで得られたk catとK Mの事後標本は強い相関を示した(以下の近似式で見られるように)。

${k}_{cat}frac{E}_{T}({S}_{T}-P)}{K}_{M}+{S}_{T}-P}approx {k}_{cat}frac{E}_{T}({S}_{T}-P)}{K}_{M},$$

ここで({K}_{M}gg {S}_{T}ge {S}_{T}-P}) が使われている。 一方、(Fig. 4g-i) では、sQモデルの散布図が水平になり、K Mの構造同定不可能性を示している。 実際、以下の近似式で見られるように、K Mの値はsQモデルのダイナミクスにほとんど影響を与えない。

${k}_{cat}}frac{E}_{T}({S}_{T}-P)}{{K}_{M}+{S}_{T}-P}approx {k}_{cat}{E}_{T},$$

ここでK M + S T≈S Tは({S}_{T}_gg {K}_{M} {})として使用されています。 このような \({S}_{T}}ll {K}_{M}} または \({S}_{T}}gg {K}_{M}}) の場合のパラメータ識別性の欠如は、より正確な推定のために S T≈K M を用いることを推奨する先行研究22、23 と一致する。 しかし、S T≈K Mの場合でも、推定値はまだ不正確である(図3a、b中)。 さらに、E Tが大きくなると、sQモデルで得られた推定値は、単一パラメータ推定(図2)と同様に偏りが生じている(図3)。 7033>

図3

sQモデルまたはtQモデルによる2パラメータ(k catとK M)の同時推定。 単一パラメータ推定(図2)で用いたのと同じ102個のデータセット(図S1)から、k cat(a)とK M(b)の事後標本105個を一緒に求めた。 同じ事前分布を与えているにもかかわらず、単一パラメータ推定(図2)よりも事後分布が広くなっている。 ここで、緑の三角形はk catまたはK Mの真の値を示す。

図4

2パラメータ推定で得られた事後サンプルの散布図(図3)である。 この散布図は、k cat と K M の間に強い相関がある場合と、K M の同定不可能性の2種類の構造未同定性を意味し、水平プロットで表されている。 K M が S T + E T よりもはるかに小さい場合(灰色の破線),tQ モデルの正相関の散布図は水平の散布図に変更される. ここで、緑の三角形はパラメータの真値を表す。

When \({E}_{T}gg {K}_{M}) or \({S}_{T}gg {K}_{M}), the K M has a negligible effect on the dynamics of the tQ model (Eq. 6), thus only k cat were identified in the single parameter estimation (Fig. 2a and b right or bottom).また、({E}_{M}と(I)の間の)2つのパラメータも、(II.1.)と(II.3.の間の)2つのパラメータも、(I.1.の間の)2つのパラメータも同様であった。 同様に、k catとK Mの両方をtQモデルで同時に推定した場合、k catの真値に沿った水平散布図(図4c、f、g-i)が示すように、k catのみの推定は正確で精度が高い(図3a、bの右または下)。 また、他の場合( \({E}_{T}gg {K}_{M}) も \({S}_{T}gg {K}_{M}) もない場合)には、単一パラメータ推定に比べて両パラメータの事後分散が劇的に増加します(図2、3左、上段)。 散布図によると、このような不正確な推定は2つの原因に起因しています(図4a、b、d、e)。 k cat と K M が共に減少する場合、tQ モデルの挙動は SQ モデルとほとんど変わらない(式 5)ため、k cat と K M の事後サンプルの間に強い相関が生じる。 K M の推定値が k cat の推定値とともに減少を続け、E T + S T(図4の破線縦線)よりもはるかに小さくなると、式6に示すように tQ モデルが K M の値に依存しなくなり、散布図が水平となる。

異なる実験のデータを組み合わせることで、tQモデルによる正確な推定が可能になる

以上のように、単一の進行曲線を用いたk catとK Mの両方の推定は、かなりの偏りと識別性の欠如に悩まされており(図3、4)、このことは、単一の実験から得られた進行曲線だけでは両方のパラメータを同時に識別するには不十分であるとの先行研究報告19とも一致するものである。 そこで、ここでは、異なる実験条件で得られた複数のタイムコースデータセットを用いることで、推定が改善されるかどうかを検討した。

一般的なin vitroアッセイでは、S Tを固定してE Tを変化させるか、E Tを固定してS Tを変化させて進行曲線を測定する8,9,10,11,39。 まず、S Tを固定し、E Tを変化させて進行曲線を測定した場合について考察する。 具体的には、低い E T と高い E T の両方から得られた進行曲線を用いて、S T を固定した場合のパラメータを異なるレベルで推定する(図 S1 上・下)。 この場合、sQモデルで得られた事後標本は、高いE Tのデータを用いているため、かなりの誤差が見られる(図5a、S5)。 一方、tQモデルで得られた事後標本は、k catとK Mの両方の真の値を低い分散で正確に捉えている(図5a、S5)。 これは、E Tが低い場合と高い場合では、パラメータ推定に必要な情報が異なることに起因しています。 具体的には、高E Tのデータでは、K Mは特定できないものの、k catはtQモデルで正確に推定できる(図4c,f,i)。 このように高E Tデータからk catを正確に推定することで、低E TデータからK Mを推定する際にk catとK Mの相関を防ぐことができる(Fig.4a、d)。 実際、tQモデルの狭い散布図(図5b左と中央)は、高いE Tのデータで得られた水平な散布図(図4c、f)と低いE Tのデータで得られた水平でない散布図(図4a、d)の2つの交点である。 しかし、S Tが高い場合には、低いE Tからの散布図も水平になるため(Fig. 4c)、複合データを用いることによる相乗効果は減少する(Fig. 5a,b 右)。 以上のことから、S T が K M よりもあまり大きくない場合には、tQ モデルは低 E T と高 E T の組み合わせから両方のパラメータを正確に推定することができる。 図5

低E Tと高E Tのデータを併用すると、sQモデルではなくtQモデルで得られた推定値の精度と正確さが向上することがわかる。 (a) E T = 0.2 nM(図S1上)とE T = 40 nM(図S1下)のデータセットを用いて、S T = 0.2, 2, 80 nMのいずれかの場合の事後標本を推定したものである。 tQモデルの事後分散は、単一パラメータによる推定のレベルまで劇的に減少した(図2)。 しかし、sQモデルの推定値にはかなりのバイアスが見られる。 ここで、緑色の三角形は、k cat または K M の真の値を表す。 (b)事後サンプルの散布図である。 緑色の三角形、青色の丸、赤色の四角形はそれぞれ真の値、sQモデルの事後平均、tQモデルの事後平均を表す。

次に、E Tを固定しS Tを変化させて進行曲線を測定した場合について考える。 具体的には、S Tが低い場合と高い場合の2つの進行曲線の組み合わせから、E Tを固定した場合のパラメータを様々なレベルで推定する(図S1左、右)。 E Tが低い場合、つまりsQモデルとtQモデルが同様の振る舞いをする場合(式5)、両モデルで得られた事後標本はk catとK Mの真の値を正確に捉えている(図6a左、図S6)。 ここでも、狭い散布図(図6b左)は、低いS Tの非水平散布図(図4a)と高いS Tの水平散布図(図4g)の交点として得られている。 しかし、E Tが増加し、その結果sQモデルの精度が低下すると、予想通り、sQモデルで得られたものに偏りが生じる(図6a右、S6)。 一方、tQモデルではそのような偏りは見られないが、シングルパラメータ推定と同様に、E Tが大きくなるとK M推定値の精度は低下する(図2、式6)

図6

低S Tと高S Tで得たデータを一緒に用いた推定。 (a)ET=0.2、2、40nMのいずれかについて、S T=0.2nM(図S1左)とS T=80nM(図S1右)のデータセットを一緒に用いて事後サンプルを推論する。 E Tが低い場合は、sQとtQのどちらのモデルも正確で精度の高い推定が可能です。 E Tが増加すると、sQモデルで得られた推定値は不正確になり、tQモデルで得られたK Mの推定値は、単一パラメータ推定と同様に、精度が低くなる(図2)。 ここで、緑色の三角形は、k cat または K M の真の値を表す。 (b)事後サンプルの散布図。 緑色の三角形、青色の丸、赤色の四角形はそれぞれ、真の値、sQモデルの事後平均、tQモデルの事後平均を表している。

tQモデルによる高精度・高効率推定のための最適な実験計画

単一の実験から得られた経過曲線を用いた場合、tQモデルの事後散布図は相関型(図4a,b,d,e)と水平型(図4c,f,g-i)に分類することができる。 これら2つの異なるタイプの散布図の交点は、真値付近に狭く分布する傾向がある(Fig.5b,6b)。 したがって、このような2つのデータセットを組み合わせることで、k catとK Mの両方を正確に推定することができる(Fig.5a、6a)。 具体的には、(Fig. 4a,b,d,e) のような進捗曲線と、(Fig. 4a,b,d,e) のような進捗曲線と、(Fig. 4a,b) のような進捗曲線を、(Fig. 4a,b) のような計測条件で計測した場合では、(Fig. 4a,b) のように、(図5b) と(図5b) で示したように、(図5b) と (図5b) が、”K” のような進捗曲線を、”K” と (図5b) が “K” のような進捗曲線を示している。 4c,f,g-i)はパラメータ推定に必要な情報の種類が異なるため,両方のデータセットを使用するとうまく推定できる。 しかし、K Mの値は通常先験的に不明であるため、実際にはS T、E T、K Mの値を比較することは困難である。 この問題は、散布図を使って簡単に解決することができる。 すなわち,最初の実験で得られた事後散布図が水平であれば,次の実験では E T と S T の両方を小さくして,水平でない散布図を得ることができる(図 7a). 一方、最初の実験の散布図が K M と k cat の間に強い相関を示した場合、次の実験では S T と E T のどちらかを増やす必要がある(Fig.7b)。 基本的には,K M と k cat の値の事前情報がなくても,現在の推定値の散布図 の形状から次の最適な実験計画を決定し,正確で精度の高い推定を行うことができる. しかし、sQ モデルでは、E T や S T と K M の関係が先験的に不明であるため、推定に偏りが生じる可能性があり、このアプローチは使用できない。 つまり、tQモデルとは異なり、sQモデルでは上記のように精密な推定が必ずしも保証されない(例えば図5a右)。

図7

tQモデルで精密かつ正確に推定するための最適実験デザイン。 (a)最初の実験の事後サンプルの散布図が水平であるとき、次の実験では水平でない散布図を得るためにE TとS Tを減少させる必要がある。 そこで,2つの実験の組み合わせにより,高精度な推定を行う(赤の散布図). (b) 最初の実験の散布図が非水平の場合、次の実験では E T や S T を大きくして水平の散布図を得る必要がある。 (c) 低 E T (0.1 K M ) と高 E T (10 K M ) から単一の進行曲線を用いて推論すると、キモトリプシン、ウレアーゼ、フマラーゼについて、それぞれ非水平および水平散布図になる(灰色の散布図)。 両データセットを併用した場合、すべての酵素で正確な推定値が得られた(赤の散布図)。 ここでは、低 S T(0.1 K M)を使用した。 7033>

キモトリプシン、ウレアーゼ、フマラーゼによるN-アセチルグリシンエチルエステル、フマル酸、尿素の触媒作用について、tQモデルによる提案手法がk catとK Mをそれぞれ正確に推定できるかを検証した(図7c)。 この 3 種類の酵素は、触媒効率 (k cat /K M )1 がそれぞれ 0.12, 4 – 105, 1.6 – 108 s -1 M -1 と異なることから選択されたものである。 各酵素について、既知の酵素動力学パラメータ1 に基づく確率シミュレーショ ンにより、102 のノイズを含むタイムコースデータセットを作成した。 低 E T と低 S T で得られた進行曲線を使用すると、予想通り、3 種類の酵素すべてにおいて、事後サンプルの非水平散布図が得られた(Fig. 7c)。 このことは、水平方向の散布図を得るためには、次の実験では E T か S T のどちらかを大きくする必要があることを示している。 実際、E T を 100 倍にした進行曲線を用いると、すべての酵素で水平散布図が得られた(Fig.7c)。 したがって、これら 2 つの進行曲線を併用すれば、k cat と K M の両方を正確に推定することができる(Fig.7c 赤い点)。 これらの結果は、このように 2 種類の散布図を得るための 2 段階の最適化実験計画(Fig. 7a、b)により、tQ モデルによる酵素動力学の正確かつ効率的な推定が可能になることを裏付けている。 このような推定を行うための計算パッケージが提供されている(詳細はMethodを参照)。

コメントを残す

メールアドレスが公開されることはありません。