生物网络是描述生物系统中各种分子、细胞或组织之间相互作用的复杂系统模型。它们通过节点(如分子、基因、蛋白质)和边(相互作用关系)来揭示生命活动的组织原则。一般使用图结构来表示。

基因调控网络-乳糖操纵子

基因通过DNA转录成RNA,然后翻译成蛋白质来表达,其中起重要作用的步骤是RNA聚合酶与操纵基因的结合。存在两种调控机制:

  • 阻遏蛋白结合在启动子上,阻止RNA聚合酶结合。
  • 激活蛋白促进RNA聚合酶与启动子结合。

考虑聚合酶的配分函数$Z(P;N_{NS})$,其中P是聚合酶的数目,$N_{NS}$是非特异位点的数目。假设聚合酶结合在启动子上,能量为$\epsilon_{pd}^S$,结合在非特异位点上,能量为$\epsilon_{pd}^{NS}$。假设最多结合一个位点,则配分函数可以表示为:

其中$Z_{NS}(P,N_{NS})$是聚合酶结合在非特异位点上的配分函数:

所以,总的配分函数为:

利用$\dfrac{(N_{NS})!}{(N_{NS}-P)!}\approx N_{NS}^P(P\ll N_{NS})$,结合概率为:

其中,$\Delta\epsilon_{pd}=\epsilon_{pd}^{S}-\epsilon_{pd}^{NS}$是结合能差。

激活蛋白

考虑激活蛋白的结合位点与启动子两个特异位点,共计四种状态:

  • 两个位点都没有结合
  • 激活蛋白结合在特异位点上
  • 启动子结合在特异位点上
  • 激活蛋白和启动子都结合在特异位点上

设配分函数$Z(P,A;N_{NS})$是P个聚合酶和A个激活蛋白在N个非特异位点上的配分函数,可以推出如下关系:

同样的道理,单个配分函数为:

结合概率为:

其中:

是调控因子。

考虑到$\Delta \epsilon_{ad}<0,\delta \epsilon_{pd}<0$,所以$f_{reg}(a)>1$,这启发我们,当激活蛋白存在的时候,等效存在$F_{reg}(A)P$个聚合酶。

阻遏蛋白

同样的道理,考虑以下三种情况:

  • 启动子未被占据;
  • 启动子被聚合酶占据;
  • 启动子被阻遏蛋白占据。

考虑P个聚合酶和R个阻遏蛋白在$N_{NS}$个非特异位点上的配分函数$Z(P,R;N_{NS})$:

总的配分函数为:

结合概率为:

其中:

显然,$F_{reg}(R)<1$,这启发我们,当阻遏蛋白存在的时候,等效存在$PF_{reg}(R)$个聚合酶。

正负调控机制的结合

从上述讨论可以直接得到:

其中:

乳糖操纵子是一个典型的具有正负调控机制的例子。

基因调控网络-果蝇胚胎

单态模型

果蝇胚胎的颜色条纹是由基因调控网络决定的。基因的表达程度可以由mRNA的表达和降解来表示:

不受其他因素调控的启动子能一直表达mRNA。记m个mRNA的概率为$p(m,t)$,则满足以下方程:

变换得到:

即:

达到平衡态的时候,满足:

使用递推法:

所以:

是一个泊松分布。

二态模型

一些启动子是受到调控的,否则无法解释其时间相关性。在上述基础上考虑失活状态:

其主方程变为:

经过激烈的计算,可以得到:

对于$k_-\gg \gamma$,即可以近似为:

该负二项分布只和两个参量有关:burst frequency $k_+/\gamma$和burst size $k/k_-$。

基因开关

假设两端基因的启动子附近有对方蛋白的抑制结合位点(即基因1生成的蛋白1可以抑制基因2的表达,反之亦然),则存在以下四种状态:

  • 基因1/2未被抑制,表达速率为$r$;
  • 基因1/2被抑制,表达速率为0;

根据蛋白质结合位点章节的讨论,结合概率为:

表达速率为:

所以,蛋白质的微分方程为:

这是一个非线性微分方程组,可以简化为:

平衡态时,满足:

考虑$n=2$的情况,可得以下五次方程:

对其进行解与稳定性分析,可得:

  • 当$\alpha<2$时,三次方程的唯一解稳定。此时两种蛋白质均处于低表达状态。
  • 当$2<\alpha$时,二次方程的唯二解稳定。此时两种蛋白质有任意一种处于高表达状态。

在$\alpha>2$的时候,系统会出现双稳态现象,即两种蛋白质可以依次处于高表达状态或低表达状态。这个现象在生物学中被称为基因开关。