Zagadnienia

1. Stochastyczne modele ekspresji genów

1.1. Krótki wstęp biologiczny

Jednym z podstawowych procesów biochemicznych zachodzących w komórkach żywych organizmów jest produkcja różnych białek. Jest to bardzo skomplikowany wieloetapowy proces. Każda cząsteczka białka składa się z połączonych w liniowy sposób odpowiednich aminokwasów. Opiszemy teraz w niezwykle uproszczony sposób jak dochodzi do połączenia aminokwasów w cząsteczkę białka (por. Rys. 1.1). Informacja genetyczna umieszczona jest na nici kwasu DNA o strukturze podwójnej helisy. Wzdłuż nici DNA rozłożone są komplementarne zasady, odpowiednio ATCG. Kod genetyczny jest kodem trójkowym, trzy następujące po sobie zasady kodują odpowiedni aminokwas. Zauważmy, że mamy 4^{3} możliwości a tylko 23 aminokwasy, a więc mamy pewną nadmiarowość. W procesie transkrypcji tworzona jest cząsteczka mRNA z komplementarnym ciągiem zasad, która zawiera plan na utworzenie białka. W komórkach eukariotycznych musi się ona wydostać z jądra komórkowego do otaczającej go cytoplazmy, gdzie przyłącza się do niej rybosom. W procesie translacji rybosom odczytując genetyczny kod trójkowy porusza się wzdłuż cząsteczki mRNA i przyłącza po kolei odpowiednie cząsteczki aminokwasu tworzące łańcuch białkowy. Wszystkie procesy składające się na produkcję białka nazwane są łącznie ekspresją białka.

Uproszczony schemat ekspresji białka ({\em Źródło: http://pmj.bmj.com/}).
Rys. 1.1. Uproszczony schemat ekspresji białka (Źródło: http://pmj.bmj.com/).

Uzyskane białko może pełnić bardzo różne funkcje: budulcowe, transportowe, regulatorowe. Regulacja białkowa może polegać na wzmacnianiu (aktywacji) lub osłabianiu (represji) produkcji innych białek lub też samego siebie (autoregulacja). Ostatnio odkryto, że podobne funkcje regulacyjne mogą również pełnić cząsteczki RNA.

1.2. Matematyczny model ekspresji genu

1.2.1. Opis deterministyczny na poziomie makro

Stan komórki jest opisany przez zależne od czasu koncentracje mRNA \rho _{{r}} i białka \rho _{{p}}. Ewolucję czasowa stanu komórki opisujemy równaniami kinetyki chemicznej - układem równań różniczkowych zwyczajnych

\begin{cases}\frac{d\rho _{{r}}}{dt}=k_{{r}}-\gamma _{{r}}\rho _{{r}}\,,\\
\frac{d\rho _{{p}}}{dt}=k_{{p}}\rho _{{r}}-\gamma _{{p}}\rho _{{p}}\,,\end{cases} (1.1)

gdzie k_{{r}} i k_{{p}} są odpowiednio intensywnościami tworzenia mRNA (transkrypcja) i białka (translacja), natomiast \gamma _{{r}} i \gamma _{{p}} intensywnościami degradacji odpowiednio mRNA i białka. W stanie stacjonarnym pochodne czasowe są równe zero, z (1) otrzymujemy układ równań algebraicznych, którego rozwiązanie daje nam stacjonarne wartości koncentracji mRNA i białka:

\begin{cases}\rho _{{r}}=\frac{k_{{r}}}{\gamma{r}},\\
\rho _{{p}}=\frac{k_{{r}}k_{{p}}}{\gamma _{{r}}\gamma _{{p}}}\end{cases} (1.2)

1.2.2. Opis stochastyczny na poziomie mikro

W wielu komórkach, zwłaszcza prokariotycznych, liczba cząsteczek mRNA i białek może być niewielka i w związku z tym mówienie o koncentracji traci sens. Mamy do czynienia ze skończonym układem czasami nawet kilku cząsteczek danego białka i w związku z tym bardzo duża rolę odgrywają fluktuacje stochastyczne związane z losowymi czasami zajścia odpowiednich reakcji biochemicznych. Na poziomie mikroskopowym stan komórki opisujemy zależną od czasu liczbą cząsteczek mRNA r i białka p. Są to zmienne losowe. Stanem układu formalnie nazywamy zależną od czasu funkcję rozkładu prawdopodobieństwa f(r,p,t) tych zmiennych losowych czyli prawdopodobieństwo, że w komórce będzie r cząsteczek mRNA i p cząsteczek białka. Ewolucja czasowa stanu układu jest więc procesem stochastycznym. W naszej modelowej komórce zachodzą cztery typy reakcji biochemicznych (por. Rys 1.2): transkrypcja, translacja oraz degradacja mRNA i białka, w wyniku których zmieniają się liczby odpowiednich cząsteczek.

Schematyczne przedstawienie rozpatrywanych reakcji biochemicznych, które zachodzą w komórce.
Rys. 1.2. Schematyczne przedstawienie rozpatrywanych reakcji biochemicznych, które zachodzą w komórc.

Reakcje te opisywać będziemy przy pomocy procesu urodzin i śmierci (patrz Dodatek 1).

Przyjmujemy następujące prawdopodobieństwa zajścia reakcji w odcinku czasowym (t,t+h):

  • transkrypcji, czyli przejście r\rightarrow r+1 - k_{{r}}h+o(h)

  • translacji, czyli przejście p\rightarrow p+1 - k_{{p}}rh+o(h)

  • degradacji mRNA, czyli przejście r\rightarrow r-1 - \gamma _{{r}}rh+o(h)

  • degradacji białka, czyli przejście p\rightarrow p-1 - \gamma _{{p}}ph+o(h) prawdopodobieństwo zajścia więcej niż jednej reakcji - o(h)

Naszym celem jest znalezienie wyrażenia na wariancje, var(p), liczby cząsteczek białka w stanie stacjonarnym.

Ćwiczenie 1.1

Skonstruuj nieskończony układ równań różniczkowych zwyczajnych dla f(r,p,t).

Wskazówka: 

Zastosuj procedurę z Dodatku!

Rozwiązanie: 
\begin{split}\frac{df(r,p,t)}{dt}&=k_{{r}}f(r-1,p,t)+\gamma _{{r}}(r+1)f(r+1,p,t)+k_{{p}}rf(r,p-1,t)+\\
&+\gamma _{{p}}(p+1)f(r,p+1,t)-(k_{{r}}+\gamma _{{r}}r+k_{{p}}r+\gamma _{{p}}p)f(r,p,t)\end{split}

Definiujemy funkcję tworzącą dla prawdopodobieństw f(r,p,t),\  r\,,\  p\geq 0,

F(z,w,t)=\sum _{{z,w=0}}^{{\infty}}f(r,p,t)z^{{r}}w^{{p}}
Ćwiczenie 1.2

Skonstruuj równanie różniczkowe cząstkowe dla F(z,w,t) wraz z warunkami brzegowymi i początkowymi.

Wskazówka: 

Zastosuj procedurę z Dodatku 2.

Rozwiązanie: 
\begin{split}\frac{\partial F(z,w,t)}{\partial t}=&k_{{r}}(1-z)F(z,w,t)+\gamma _{{r}}(1-z)\frac{\partial F(z,w,t)}{\partial z}+\\
&+k_{{p}}z(w-1)\frac{\partial F(z,w,t)}{\partial z}+\gamma _{{p}}(1-w)\frac{\partial F(z,w,t)}{\partial w}\end{split}

Oznaczmy przez <x> wartość oczekiwaną x. Mamy wtedy,

\frac{\partial F(z,w,t)}{\partial z}\Big|_{{z=w=1}}=<r>\,,\quad\frac{\partial F(z,w,t)}{\partial w}\Big|_{{z=w=1}}=<p>\,,
\frac{\partial^{{2}}F(z,w,t)}{\partial^{{2}}z}\Big|_{{z=w=1}}=<r(r-1)>\,,\quad\frac{\partial^{{2}}F(z,w,t)}{\partial^{{2}}w}\Big|_{{z=w=1}}=<p(p-1>\,,
\frac{\partial^{{2}}F(z,w,t)}{\partial z\partial w}\Big|_{{z=w=1}}=<rp>
Ćwiczenie 1.3

Zróżniczkuj powyższe równania ze względu na t i otrzymaj układ równań różniczkowych zwyczajnych dla następujących momentów: <r>,<p>,<r^{{2}}>,<rp>,<p^{{2}}>

Rozwiązanie: 
\begin{cases}\frac{d<r>}{dt}=k_{{r}}-\gamma _{{r}}<r>,\\
\frac{d<p>}{dt}=k_{{p}}<r>-\gamma _{{p}}<p>,\\
\frac{d<r^{{2}}>}{dt}=k_{{r}}+(2k_{{r}}+\gamma _{{r}})<r>-2\gamma _{{r}}<r^{{2}}>,\\
\frac{d<rp>}{dt}=k_{{r}}<p>+k_{{p}}<r^{{2}}>-(\gamma _{{r}}+\gamma _{{p}}<rp>,\\
\frac{d<p^{{2}}>}{dt}=k_{{p}}<r>+\gamma _{{p}}<p>-2\gamma _{{p}}<p^{{2}}>+2k_{{p}}<rp>.\end{cases}

Zauważmy, że powyższy układ równań różniczkowych jest zamknięty, w równaniach dla danego momentu nie występują momenty wyższych rzędów - macierz układu równań jest trójkątna. Możemy więc po kolei rozwiązywać równania różniczkowe (porównaj (?)) i dostać wyrażenia na ewolucję czasową momentów. Zauważmy, że dwa pierwsze równania są takie same jak w układzie równań różniczkowych na koncentracje mRNA i białka w modelu deterministycznym (1.1).

Ćwiczenie 1.4

Znajdź wyrażenie na wariancję liczby cząsteczek białka w stanie stacjonarnym.

Rozwiązanie: 
var(p)=<p>(1+\frac{k_{{p}}}{\gamma _{{r}}+\gamma _{{p}}})

1.3. Proces Poissona

Proces Poissona to rodzina zmiennych losowych X(t) przyjmujących wartości całkowite (na przykład liczba bakterii, cząstek lub ogólnie liczba zdarzeń) w czasie ciągłym.

Założenia

  • Prawdopodobieństwo wystąpienia zmiany (urodzenia się jednej dodatkowej cząsteczki lub ogólnie wystąpienie pewnego zdarzenia) w odcinku czasowym (t,t+h) wynosi \lambda h+o(h) gdzie o(h) jest wielkością mniejszego rzędu niż h, to znaczy \displaystyle\lim _{{h\rightarrow 0}}o(h)/h=0;

  • Prawdopodobieństwo wystąpienia więcej niż jednej zmiany w odcinku czasowym (t,t+h) wynosi o(h).

Zauważmy, że z powyższych założeń wynikają następujące własności:

  • Prawdopodobieństwo wystąpienia zdarzeń w rozłącznych odcinkach czasowych jest równe iloczynowi odpowiednich prawdopodobieństw (niezależność);

  • Prawdopodobieństwo wystąpienia zdarzenia nie zależy od czasu t (jednorodność).

Oznaczmy przez f(n,t) prawdopodobieństwo, że nasz układ w chwili t jest w stanie n, to znaczy zmienna losowa X(t) przyjmuje wartość n (liczba cząstek w czasie t lub liczba zdarzeń do czasu t wynosi n).

Naszym celem jest znalezienie wzoru na f(n,t).

Ćwiczenie 1.5

Skonstruuj równanie różniczkowe zwyczajne na f(n,t).

Wskazówka: 

Napisz wyrażenie na prawdopodobieństwo całkowite.

Rozwiązanie: 

Wartość zmiennej losowej X(t+h) zależy od wartości X(t) i od tego co się zdarzyło w czasie (t,t+h).

Możemy napisać wyrażenie na prawdopodobieństwo całkowite:

\begin{cases}f(n,t+h)=\lambda hf(n-1,t)+(1-\lambda h)f(n,t)+o(h),\; dla\; n\geq 1,\\
f(0,t+h)=\lambda hf(n-1,t)+(1-\lambda h)f(0,t)+o(h).\end{cases}

Przenosimy f(n,t) na lewą stronę, dzielimy przez h, przechodzimy do granicy h\rightarrow 0 i otrzymujemy nieskończony układ równań różniczkowych zwyczajnych:

\begin{cases}\frac{df(n,t)}{dt}=\lambda f(n-1,t)-\lambda f(n,t),\; n\geq 1,\\
\frac{df(0,t)}{dt}=-\lambda f(0,t)\end{cases} (1.3)

z warunkiem początkowym f(0,0)=1.

Rozwiązujemy równanie różniczkowe na f(0,t) i otrzymujemy

f(0,t)=e^{{-\lambda t}}\,. (1.4)

f(0,t) jest prawdopodobieństwem, że czas oczekiwania na następne zdarzenie będzie większy od t, czyli prawdopodobieństwem, że czas oczekiwania na następne zdarzenie będzie mniejszy niż t jest równy 1-e^{{-\lambda t}}. Jest to dystrybuanta rozkładu wykładniczego. Oznacza to, że czas między zdarzeniami ma rozkład wykładniczy g(t)=\lambda e^{{-\lambda t}}.

Rozwiązanie równania dla n=0, czyli (1.4), wstawiamy do równania (1.3) dla n=1, rozwiązanie wstawiamy do równania dla n=2. Iterując tą procedurę otrzymujemy wyrażenia dla f(n,t) dla kolejnych n.

Ćwiczenie 1.6

Sprawdzić, że

f(n,t)=e^{{-\lambda t}}\frac{(\lambda t)^{{n}}}{n!}\,,

jest rozwiązaniem układu (1.3), to znaczy, że X(t) jest zmienną losową Poissona z parametrem \lambda t czyli z wartością oczekiwaną i wariancją równą \lambda t.

1.4. Proces urodzin i śmierci

Tak jak i w procesie Poissona X(t) jest zmienną losową przyjmującą wartości całkowite. Oprócz urodzin - zdarzeń podwyższających stan układu o 1, dopuszczamy możliwość śmierci - zdarzeń obniżających stan układu o 1.

Zakładamy, że

  • Prawdopodobieństwo urodzenia się cząsteczki w odcinku czasowym (t,t+h) wynosi \lambda _{{n}}h+o(h)

  • Prawdopodobieństwo śmierci cząsteczki w odcinku czasowym (t,t+h) wynosi \mu _{{n}}h+o(h)

Przyjmiemy teraz, że \lambda _{{n}}=\lambda i \mu _{{n}}=\mu n. Powtarzając procedurę zastosowaną dla procesu Poissona dostajemy następujący układ równań różniczkowych zwyczajnych:

\begin{cases}\frac{df(n,t)}{dt}=\lambda f(n-1,t)+\mu(n+1)f(n+1,t)-(\lambda+\mu n)f(n,t),\; n\geq 1,\\
\frac{df(0,t)}{dt}=\mu f(1,t)-\lambda f(0,t)\end{cases} (1.5)

Nie będziemy rozwiązywać tego układu równań różniczkowych. Interesować natomiast nas będzie stan stacjonarny, f(n), który jest rozwiązaniem układu równań algebraicznych uzyskanych z (1.5) przy przyrównaniu do zera pochodnych czasowych. Można wykazać, że f(n)=\displaystyle\lim _{{t\rightarrow\infty}}f(n,t), to znaczy f(n) jest globalnie asymptotycznie stabilnym punktem stacjonarnym układu (1.5).

1.4.1. Błądzenie przypadkowe na kracie jednowymiarowej z czasem ciągłym

Jest to proces urodzin i śmierci, dla którego \lambda _{{n}}=1 oraz \mu _{{n}}=1. Rozszerzamy jednocześnie zbiór wartości zmiennej losowej X(t) do zbioru liczb całkowitych.

Układ (1.5) możemy wtedy przepisać jako

\frac{df(n,t)}{dt}=f(n-1,t)+f(n+1,t)-2f(n,t) (1.6)

z warunkiem początkowym f(0,0)=1. Rozwiążemy powyższy układ przy pomocy funkcji tworzących. Definiujemy funkcję tworzącą dla dwustronnego ciągu prawdopodobieństw f(n),-\infty<n<\infty,

F(z,t)=\sum _{{n=-\infty}}^{{\infty}}f(n,t)z^{{n}}

Różniczkując funkcję tworzącą ze względu na z dostajemy momenty rozkładu prawdopodobieństwa f. W szczególności mamy:

F(1,t)=1\,,\quad\frac{\partial F(z,t)}{\partial z}\Big|_{{z=1}}=E(X(t))\,,\quad\frac{\partial^{{2}}F(z,t)}{\partial^{{2}}z}\Big|_{{z=1}}=E(X(t)(X(t)-1))\,,

gdzie E(X(t)) oznacza wartość oczekiwaną X(t). Różniczkując F(z,t) względem czasu dostajemy

\frac{\partial F(z,t)}{\partial t}=(z+\frac{1}{z}-2)F(z,t),

warunek początkowy F(z,0)=1 wynika bezpośrednio z definicji F i warunku początkowego dla f(n,t).

Rozwiązaniem powyższego równania różniczkowego jest

F(z,t)=e^{{(z+\frac{1}{z}-2)t}}\,. (1.7)
Ćwiczenie 1.7

Znajdź wartość oczekiwaną oraz wariancję X(t).

Ćwiczenie 1.8

Znajdź f(n,t).

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.