生物网络
生物网络是描述生物系统中各种分子、细胞或组织之间相互作用的复杂系统模型。它们通过节点(如分子、基因、蛋白质)和边(相互作用关系)来揭示生命活动的组织原则。一般使用图结构来表示。
基因调控网络-乳糖操纵子
基因通过DNA转录成RNA,然后翻译成蛋白质来表达,其中起重要作用的步骤是RNA聚合酶与操纵基因的结合。存在两种调控机制:
- 阻遏蛋白结合在启动子上,阻止RNA聚合酶结合。
- 激活蛋白促进RNA聚合酶与启动子结合。
考虑聚合酶的配分函数$Z(P;N_{NS})$,其中P是聚合酶的数目,$N_{NS}$是非特异位点的数目。假设聚合酶结合在启动子上,能量为$\epsilon_{pd}^S$,结合在非特异位点上,能量为$\epsilon_{pd}^{NS}$。假设最多结合一个位点,则配分函数可以表示为:
其中$Z_{NS}(P,N_{NS})$是聚合酶结合在非特异位点上的配分函数:
所以,总的配分函数为:
利用$\dfrac{(N_{NS})!}{(N_{NS}-P)!}\approx N_{NS}^P(P\ll N_{NS})$,结合概率为:
其中,$\Delta\epsilon_{pd}=\epsilon_{pd}^{S}-\epsilon_{pd}^{NS}$是结合能差。
激活蛋白
考虑激活蛋白的结合位点与启动子两个特异位点,共计四种状态:
- 两个位点都没有结合
- 激活蛋白结合在特异位点上
- 启动子结合在特异位点上
- 激活蛋白和启动子都结合在特异位点上
设配分函数$Z(P,A;N_{NS})$是P个聚合酶和A个激活蛋白在N个非特异位点上的配分函数,可以推出如下关系:
同样的道理,单个配分函数为:
结合概率为:
其中:
是调控因子。
考虑到$\Delta \epsilon_{ad}<0,\delta \epsilon_{pd}<0$,所以$f_{reg}(a)>1$,这启发我们,当激活蛋白存在的时候,等效存在$F_{reg}(A)P$个聚合酶。0,\delta>
阻遏蛋白
同样的道理,考虑以下三种情况:
- 启动子未被占据;
- 启动子被聚合酶占据;
- 启动子被阻遏蛋白占据。
考虑P个聚合酶和R个阻遏蛋白在$N_{NS}$个非特异位点上的配分函数$Z(P,R;N_{NS})$:
总的配分函数为:
结合概率为:
其中:
显然,$F_{reg}(R)<1$,这启发我们,当阻遏蛋白存在的时候,等效存在$PF_{reg}(R)$个聚合酶。
正负调控机制的结合
从上述讨论可以直接得到:
其中:
乳糖操纵子是一个典型的具有正负调控机制的例子。
基因调控网络-果蝇胚胎
单态模型
果蝇胚胎的颜色条纹是由基因调控网络决定的。基因的表达程度可以由mRNA的表达和降解来表示:
不受其他因素调控的启动子能一直表达mRNA。记m个mRNA的概率为$p(m,t)$,则满足以下方程:
变换得到:
即:
达到平衡态的时候,满足:
使用递推法:
所以:
是一个泊松分布。
二态模型
一些启动子是受到调控的,否则无法解释其时间相关性。在上述基础上考虑失活状态:
其主方程变为:
经过激烈的计算,可以得到:
对于$k_-\gg \gamma$,即可以近似为:
该负二项分布只和两个参量有关:burst frequency $k_+/\gamma$和burst size $k/k_-$。
基因开关
假设两端基因的启动子附近有对方蛋白的抑制结合位点(即基因1生成的蛋白1可以抑制基因2的表达,反之亦然),则存在以下四种状态:
- 基因1/2未被抑制,表达速率为$r$;
- 基因1/2被抑制,表达速率为0;
根据蛋白质结合位点章节的讨论,结合概率为:
表达速率为:
所以,蛋白质的微分方程为:
这是一个非线性微分方程组,可以简化为:
平衡态时,满足:
考虑$n=2$的情况,可得以下五次方程:
对其进行解与稳定性分析,可得:
- 当$\alpha<2$时,三次方程的唯一解稳定。此时两种蛋白质均处于低表达状态。
- 当$2<\alpha$时,二次方程的唯二解稳定。此时两种蛋白质有任意一种处于高表达状态。
在$\alpha>2$的时候,系统会出现双稳态现象,即两种蛋白质可以依次处于高表达状态或低表达状态。这个现象在生物学中被称为基因开关。