Zagadnienia

1. Stochastyczne modele ekspresji genów

1.1. Krótki wstęp biologiczny

Jednym z podstawowych procesów biochemicznych zachodzących w komórkach żywych organizmów jest produkcja różnych białek. Jest to bardzo skomplikowany wieloetapowy proces. Każda cząsteczka białka składa się z połączonych w liniowy sposób odpowiednich aminokwasów. Opiszemy teraz w niezwykle uproszczony sposób jak dochodzi do połączenia aminokwasów w cząsteczkę białka (por. Rys. 1.1). Informacja genetyczna umieszczona jest na nici kwasu DNA o strukturze podwójnej helisy. Wzdłuż nici DNA rozłożone są komplementarne zasady, odpowiednio ATCG. Kod genetyczny jest kodem trójkowym, trzy następujące po sobie zasady kodują odpowiedni aminokwas. Zauważmy, że mamy 43 możliwości a tylko 23 aminokwasy, a więc mamy pewną nadmiarowość. W procesie transkrypcji tworzona jest cząsteczka mRNA z komplementarnym ciągiem zasad, która zawiera plan na utworzenie białka. W komórkach eukariotycznych musi się ona wydostać z jądra komórkowego do otaczającej go cytoplazmy, gdzie przyłącza się do niej rybosom. W procesie translacji rybosom odczytując genetyczny kod trójkowy porusza się wzdłuż cząsteczki mRNA i przyłącza po kolei odpowiednie cząsteczki aminokwasu tworzące łańcuch białkowy. Wszystkie procesy składające się na produkcję białka nazwane są łącznie ekspresją białka.

Rys. 1.1. Uproszczony schemat ekspresji białka (Źródło: http://pmj.bmj.com/).

Uzyskane białko może pełnić bardzo różne funkcje: budulcowe, transportowe, regulatorowe. Regulacja białkowa może polegać na wzmacnianiu (aktywacji) lub osłabianiu (represji) produkcji innych białek lub też samego siebie (autoregulacja). Ostatnio odkryto, że podobne funkcje regulacyjne mogą również pełnić cząsteczki RNA.

1.2. Matematyczny model ekspresji genu

1.2.1. Opis deterministyczny na poziomie makro

Stan komórki jest opisany przez zależne od czasu koncentracje mRNA ρr i białka ρp. Ewolucję czasowa stanu komórki opisujemy równaniami kinetyki chemicznej - układem równań różniczkowych zwyczajnych

dρrdt=kr-γrρr,dρpdt=kpρr-γpρp,(1.1)

gdzie kr i kp są odpowiednio intensywnościami tworzenia mRNA (transkrypcja) i białka (translacja), natomiast γr i γp intensywnościami degradacji odpowiednio mRNA i białka. W stanie stacjonarnym pochodne czasowe są równe zero, z (1) otrzymujemy układ równań algebraicznych, którego rozwiązanie daje nam stacjonarne wartości koncentracji mRNA i białka:

ρr=krγr,ρp=krkpγrγp(1.2)

1.2.2. Opis stochastyczny na poziomie mikro

W wielu komórkach, zwłaszcza prokariotycznych, liczba cząsteczek mRNA i białek może być niewielka i w związku z tym mówienie o koncentracji traci sens. Mamy do czynienia ze skończonym układem czasami nawet kilku cząsteczek danego białka i w związku z tym bardzo duża rolę odgrywają fluktuacje stochastyczne związane z losowymi czasami zajścia odpowiednich reakcji biochemicznych. Na poziomie mikroskopowym stan komórki opisujemy zależną od czasu liczbą cząsteczek mRNA r i białka p. Są to zmienne losowe. Stanem układu formalnie nazywamy zależną od czasu funkcję rozkładu prawdopodobieństwa fr,p,t tych zmiennych losowych czyli prawdopodobieństwo, że w komórce będzie r cząsteczek mRNA i p cząsteczek białka. Ewolucja czasowa stanu układu jest więc procesem stochastycznym. W naszej modelowej komórce zachodzą cztery typy reakcji biochemicznych (por. Rys 1.2): transkrypcja, translacja oraz degradacja mRNA i białka, w wyniku których zmieniają się liczby odpowiednich cząsteczek.

Rys. 1.2. Schematyczne przedstawienie rozpatrywanych reakcji biochemicznych, które zachodzą w komórc.

Reakcje te opisywać będziemy przy pomocy procesu urodzin i śmierci (patrz Dodatek 1).

Przyjmujemy następujące prawdopodobieństwa zajścia reakcji w odcinku czasowym t,t+h:

  • transkrypcji, czyli przejście rr+1 - krh+oh

  • translacji, czyli przejście pp+1 - kprh+oh

  • degradacji mRNA, czyli przejście rr-1 - γrrh+oh

  • degradacji białka, czyli przejście pp-1 - γpph+oh prawdopodobieństwo zajścia więcej niż jednej reakcji - oh

Naszym celem jest znalezienie wyrażenia na wariancje, varp, liczby cząsteczek białka w stanie stacjonarnym.

Ćwiczenie 1.1

Skonstruuj nieskończony układ równań różniczkowych zwyczajnych dla fr,p,t.

Wskazówka: 

Zastosuj procedurę z Dodatku!

Rozwiązanie: 
dfr,p,tdt=krfr-1,p,t+γrr+1fr+1,p,t+kprfr,p-1,t++γpp+1fr,p+1,t-kr+γrr+kpr+γppfr,p,t

Definiujemy funkcję tworzącą dla prawdopodobieństw fr,p,t,r,p0,

Fz,w,t=z,w=0fr,p,tzrwp
Ćwiczenie 1.2

Skonstruuj równanie różniczkowe cząstkowe dla Fz,w,t wraz z warunkami brzegowymi i początkowymi.

Wskazówka: 

Zastosuj procedurę z Dodatku 2.

Rozwiązanie: 
Fz,w,tt=kr1-zFz,w,t+γr1-zFz,w,tz++kpzw-1Fz,w,tz+γp1-wFz,w,tw

Oznaczmy przez x wartość oczekiwaną x. Mamy wtedy,

Fz,w,tzz=w=1=r,Fz,w,twz=w=1=p,
2Fz,w,t2z|z=w=1=<r(r-1)>,2Fz,w,t2w|z=w=1=<p(p-1>,
2Fz,w,tzwz=w=1=rp
Ćwiczenie 1.3

Zróżniczkuj powyższe równania ze względu na t i otrzymaj układ równań różniczkowych zwyczajnych dla następujących momentów: r,p,r2,rp,p2

Rozwiązanie: 
drdt=kr-γrr,dpdt=kpr-γpp,dr2dt=kr+2kr+γrr-2γrr2,drpdt=kr<p>+kp<r2>-(γr+γp<rp>,dp2dt=kpr+γpp-2γpp2+2kprp.

Zauważmy, że powyższy układ równań różniczkowych jest zamknięty, w równaniach dla danego momentu nie występują momenty wyższych rzędów - macierz układu równań jest trójkątna. Możemy więc po kolei rozwiązywać równania różniczkowe (porównaj (?)) i dostać wyrażenia na ewolucję czasową momentów. Zauważmy, że dwa pierwsze równania są takie same jak w układzie równań różniczkowych na koncentracje mRNA i białka w modelu deterministycznym (1.1).

Ćwiczenie 1.4

Znajdź wyrażenie na wariancję liczby cząsteczek białka w stanie stacjonarnym.

Rozwiązanie: 
varp=p1+kpγr+γp

1.3. Proces Poissona

Proces Poissona to rodzina zmiennych losowych Xt przyjmujących wartości całkowite (na przykład liczba bakterii, cząstek lub ogólnie liczba zdarzeń) w czasie ciągłym.

Założenia

  • Prawdopodobieństwo wystąpienia zmiany (urodzenia się jednej dodatkowej cząsteczki lub ogólnie wystąpienie pewnego zdarzenia) w odcinku czasowym t,t+h wynosi λh+oh gdzie oh jest wielkością mniejszego rzędu niż h, to znaczy limh0oh/h=0;

  • Prawdopodobieństwo wystąpienia więcej niż jednej zmiany w odcinku czasowym t,t+h wynosi oh.

Zauważmy, że z powyższych założeń wynikają następujące własności:

  • Prawdopodobieństwo wystąpienia zdarzeń w rozłącznych odcinkach czasowych jest równe iloczynowi odpowiednich prawdopodobieństw (niezależność);

  • Prawdopodobieństwo wystąpienia zdarzenia nie zależy od czasu t (jednorodność).

Oznaczmy przez fn,t prawdopodobieństwo, że nasz układ w chwili t jest w stanie n, to znaczy zmienna losowa Xt przyjmuje wartość n (liczba cząstek w czasie t lub liczba zdarzeń do czasu t wynosi n).

Naszym celem jest znalezienie wzoru na fn,t.

Ćwiczenie 1.5

Skonstruuj równanie różniczkowe zwyczajne na fn,t.

Wskazówka: 

Napisz wyrażenie na prawdopodobieństwo całkowite.

Rozwiązanie: 

Wartość zmiennej losowej Xt+h zależy od wartości Xt i od tego co się zdarzyło w czasie t,t+h.

Możemy napisać wyrażenie na prawdopodobieństwo całkowite:

fn,t+h=λhfn-1,t+1-λhfn,t+oh,dlan1,f0,t+h=λhfn-1,t+1-λhf0,t+oh.

Przenosimy fn,t na lewą stronę, dzielimy przez h, przechodzimy do granicy h0 i otrzymujemy nieskończony układ równań różniczkowych zwyczajnych:

dfn,tdt=λfn-1,t-λfn,t,n1,df0,tdt=-λf0,t(1.3)

z warunkiem początkowym f0,0=1.

Rozwiązujemy równanie różniczkowe na f0,t i otrzymujemy

f0,t=e-λt.(1.4)

f0,t jest prawdopodobieństwem, że czas oczekiwania na następne zdarzenie będzie większy od t, czyli prawdopodobieństwem, że czas oczekiwania na następne zdarzenie będzie mniejszy niż t jest równy 1-e-λt. Jest to dystrybuanta rozkładu wykładniczego. Oznacza to, że czas między zdarzeniami ma rozkład wykładniczy gt=λe-λt.

Rozwiązanie równania dla n=0, czyli (1.4), wstawiamy do równania (1.3) dla n=1, rozwiązanie wstawiamy do równania dla n=2. Iterując tą procedurę otrzymujemy wyrażenia dla fn,t dla kolejnych n.

Ćwiczenie 1.6

Sprawdzić, że

fn,t=e-λtλtnn!,

jest rozwiązaniem układu (1.3), to znaczy, że Xt jest zmienną losową Poissona z parametrem λt czyli z wartością oczekiwaną i wariancją równą λt.

1.4. Proces urodzin i śmierci

Tak jak i w procesie Poissona Xt jest zmienną losową przyjmującą wartości całkowite. Oprócz urodzin - zdarzeń podwyższających stan układu o 1, dopuszczamy możliwość śmierci - zdarzeń obniżających stan układu o 1.

Zakładamy, że

  • Prawdopodobieństwo urodzenia się cząsteczki w odcinku czasowym t,t+h wynosi λnh+oh

  • Prawdopodobieństwo śmierci cząsteczki w odcinku czasowym t,t+h wynosi μnh+oh

Przyjmiemy teraz, że λn=λ i μn=μn. Powtarzając procedurę zastosowaną dla procesu Poissona dostajemy następujący układ równań różniczkowych zwyczajnych:

dfn,tdt=λfn-1,t+μn+1fn+1,t-λ+μnfn,t,n1,df0,tdt=μf1,t-λf0,t(1.5)

Nie będziemy rozwiązywać tego układu równań różniczkowych. Interesować natomiast nas będzie stan stacjonarny, fn, który jest rozwiązaniem układu równań algebraicznych uzyskanych z (1.5) przy przyrównaniu do zera pochodnych czasowych. Można wykazać, że fn=limtfn,t, to znaczy fn jest globalnie asymptotycznie stabilnym punktem stacjonarnym układu (1.5).

1.4.1. Błądzenie przypadkowe na kracie jednowymiarowej z czasem ciągłym

Jest to proces urodzin i śmierci, dla którego λn=1 oraz μn=1. Rozszerzamy jednocześnie zbiór wartości zmiennej losowej Xt do zbioru liczb całkowitych.

Układ (1.5) możemy wtedy przepisać jako

dfn,tdt=fn-1,t+fn+1,t-2fn,t(1.6)

z warunkiem początkowym f0,0=1. Rozwiążemy powyższy układ przy pomocy funkcji tworzących. Definiujemy funkcję tworzącą dla dwustronnego ciągu prawdopodobieństw fn,-<n<,

Fz,t=n=-fn,tzn

Różniczkując funkcję tworzącą ze względu na z dostajemy momenty rozkładu prawdopodobieństwa f. W szczególności mamy:

F1,t=1,Fz,tzz=1=EXt,2Fz,t2zz=1=EXtXt-1,

gdzie EXt oznacza wartość oczekiwaną Xt. Różniczkując Fz,t względem czasu dostajemy

Fz,tt=z+1z-2Fz,t,

warunek początkowy Fz,0=1 wynika bezpośrednio z definicji F i warunku początkowego dla fn,t.

Rozwiązaniem powyższego równania różniczkowego jest

Fz,t=ez+1z-2t.(1.7)
Ćwiczenie 1.7

Znajdź wartość oczekiwaną oraz wariancję Xt.

Ćwiczenie 1.8

Znajdź fn,t.

Treść automatycznie generowana z plików źródłowych LaTeXa za pomocą oprogramowania wykorzystującego LaTeXML.

Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.

Projekt współfinansowany przez Ministerstwo Nauki i Szkolnictwa Wyższego i przez Uniwersytet Warszawski.