$ remains high.
# - Hence in the range $0.001
# # In summary
# - we find that the random network model does not capture the clustering of real networks.
# - Instead real networks have a **much higher clustering coefficient** than expected for a random network of similar N and L.
# - An extension of the random network model proposed by Watts and Strogatz [1998] addresses the coexistence of high and the small world property.
# - It fails to explain, however, **why high-degree nodes have a smaller clustering coefficient than low-degree nodes**.
#
# # REAL NETWORKS ARE NOT POISSON
# # BA模型 (1999)
#
# Barabasi (1999) Emergence of scaling in random networks.Science-509-12
#
# ### Scaling-Free
#
#
#
# ### The Preferential Attachment Model
#
#
# # 无标度的意义
# 度分布的n阶矩被定义为:
#
# $ = \sum_{k_{min}}^{k_{max}}k^np_k = \int_{k_{min}}^{k_{max}}k^np_kdk $ (1)
#
# 低阶矩具有明确的统计意义:
#
# * n = 1的时候,一阶矩是$$,即平均度。
# * n = 2的时候,二阶矩是$$,可以帮助计算方差 $ \delta^2 = - ^{2} $,测量了度的离散程度(the spread in the degrees)。
# * n = 3的时候,三阶矩是$$, 决定了度分布的偏度(skewness),测量了$p_k$围绕着$$的对称性。
#
# 对于无标度网络而言,满足幂律分布:
#
# $p(k) = Ck^{-\gamma}$ (2)
#
# 由公式(1)和(2)可以得到:
#
# $ = \int_{k_{min}}^{k_{max}}k^np_kdk = C \frac{k_{max}^{n- \gamma +1} - k_{min}^{n - \gamma +1}}{n - \gamma + 1} $ (3)
#
# 可以使用wolframalpha的积分计算器积分来进行简单验证,例如x^(n-r)dx从10到100积分 网页链接:http://www.wolframalpha.com/input/?i=integrate+x%5E%28n-r%29+dx+from+10+to+100
# 显然:
#
# * 当$n - \gamma +1 <= 0$时,随着$k_{max}增加,$$k_{max}^{n- \gamma +1} \rightarrow 0$。所有满足$n <= \gamma -1$的n阶矩都是有限的。
# * 当$n - \gamma +1 >0 $时,随着$k_{max}增加,$$k_{max}^{n- \gamma +1} \rightarrow \infty$。所有满足$n > \gamma -1$的n阶矩都是无极限的。
#
# 对于无标度网络而言,一般幂参数$2 < \gamma < 3$,所以:
#
# * 对于n = 1的情况,即一阶矩平均度$$是有限的。
#
# * 但对于n >= 2的情况,即$k^2$或$k^3$是无极限的。二阶和高阶矩无穷大是“无标度”的来源
#
# # 无标度的意义
# > ### 在网络中随机抽取一个节点的度可以显著的不同于平均度$$
#
# 上图最为直接的描绘出了这种特点,即与正态分布等相比,`无标度网络下降的慢`。
#
# * 对于任何指数类型的分布,如泊松分布或高斯分布,随机选取一个节点的度在平均度附近,因此平均度就是这些网络的`尺度`。
#
# * 对于一个幂律分布而言,因为二阶矩发散,在网络中随机抽取一个节点的度可以显著的不同于平均度$$, 因此平均度不再是网络的尺度,称之为无标度。
#
#
# 对于不同的网络,平均度与标准差的取值
#
#
# 英国的天才 第一集 Genius of Britain: The Scientists Who Changed the World (2010) https://movie.douban.com/subject/4887415/
# # 1. 连续平均场"Continuum Mean-Field"
# ### "Mean-Field": many -> one
# The complex interaction between a large number of components can be simplified into a single averaged effect of all the other individuals on any given one.
#
# ### "Continuum": discrete -> Continuous
# A discrete variables that is "smooth enough", i.e. increase by one unit in each period, such as time steps [1], spatial jumps [2-3], and population, can be viewed as a continuous geometric structure. Any measure on this structure, like degree [1], number of unique locations visited [2], and distance [3], can be described by differential equations.
#
# ## 模型设定
# * 初始状态有$m_0$个节点
# * 1. 增长原则:每次加入一个节点i (加入时间记为$t_i$), 每个节点的加入带来m条边,2m个度的增加
# ** 其中老节点分到的度数是m,新加入的那一个节点分到的度数为m
# ** 那么到时间t的时候,网络的总节点数是$m_0 + t$,网络的总度数为$2mt$。
# * 2. 优先链接原则:每一次从m条边中占有一条边的概率正比于节点的度$k_i$
# ** 那么显然,加入的越早($t_i$越小)越容易获得更多的链接数。
# ** 从时间0开始,每一个时间步系统中的节点度$k_i$是不断增加的。
#
#
# ## 度的增长/时间依赖性
# $k_i$在一个时间步获得一个度的概率表示为$\prod (k_i) $, 那么有:
#
# $\prod (k_i) = \frac{k_i}{\sum k_i} = \frac{k_i}{2mt}$
#
# 一个时间步,$k_i$随t的变化率可以表达为:
#
# # $\frac{\partial k_i}{\partial t} = \Delta k \prod (k_i) = m \frac{k_i}{2mt} = \frac{k_i}{2t}$
#
# # $\frac{\partial k_i}{k_i} = \frac{\partial t}{2t}$
#
# # $\int \frac{1}{k_i} d k_i = \int \frac{1}{2t} dt$
# ## 积分结果
#
# # $k_i = C (2t) ^ {-0.5}$ (1)
#
# 此时,根据模型的初始条件,每个新加入节点获得的度是m:
#
# $k_i(t_i) = m $ 代入公式(1)
#
# 可以得到$C = m(2t_i)^{-0.5}$ 公式(2)
#
# 代入公式(1),得到:
#
# $k_i = m (\frac{t}{t_i})^{0.5}$ 公式(3)
#
# 对于一个节点i,其加入网络的时间$t_i$是固定的,我们可以观察其度$k_i$随着时间的幂律关系。
#
# ## 累积概率分布
#
# 当我们思考一个累积概率分布的时候,我们想要的是$k_i(t) < k$的概率:$P(k_i(t) < k) $
#
# 由公式(3),可以知道:
#
# $P(k_i(t) < k) = P( m (\frac{t}{t_i})^{0.5} < k ) = P( t_i > \frac{m^2 t}{k^2} ) = 1 - P(t_i \leqslant \frac{m^2 t}{k^2} )$(4)
#
# 在初始状态$ t = 0$, 有$m_0$个节点,那么$t_{m_0} = 0$
#
# 假设我们将节点加入的时间步是均匀的,那么$t_i$的概率是一个常数:
#
# $P(t_i) = \frac{1}{m_0 + t}$ 公式(5)
#
# ### 均匀分布的性质
# * 设连续型随机变量X的概率密度函数为 $f(x)=1/(b-a),a≤x≤b $, 则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b]。若[x1,x2]是[a,b]的任一子区间,则 $P{x_1≤x≤x_2}=(x_2-x_1) \frac{1}{b-a}$
#
# 根据均匀分布的性质,将公式(5)代入公式(4)得到:
#
# $P(k_i(t) < k) = 1- \frac{m^2 t}{k^2} P(t_i) = 1 - \frac{m^2 t}{k^2 (m_0 + t)} $ 公式(6)
#
#
# 对累积概率函数求微分,就可以到达概率密度函数:
#
# $P( k ) = \frac{\partial P(k_i(t) < k)}{\partial k} = \frac{2m^2 t}{m_0 + t} \frac{1}{k^3}$ 公式(7)
#
# 也就是说:$\gamma = 3$, 与m无关。
#
#
# # 参考文献
# - Barabasi 2016 Network Science. Cambridge
# - Barabasi (1999) Emergence of scaling in random networks.Science-509-12.pdf
# - Barabasi (1999) Mean-field theory for scale-free random networks. PA.pdf
# - Albert & Barabasi (2002) Statistical mechanics of complex networks. RMP.pdf
# - BA Model 计算传播百科 http://computational-communication.com/wiki/index.php?title=Mean_field_method#BA_Model
# - Principle of Locality I: Hacking the Continuum Mean-Field Technique in Network Modeling http://www.jianshu.com/p/97f674267d3e
#
# In[ ]: