目录
9网络科学导论第9章网络传播
9.1 关注SI,SIR,SIS传播模型中各种疾病状态人数比例跟传播时间关系
9.2 考虑传播模型在几类网络(均匀平均网络,非均匀网络(无限规模网络,有限规模网络,淬火网络分析,)) 研究其传播临界值。
9.2.1 SIR模型在均匀平均网络的传播公式临界值
9.3 还有免疫(随机,熟人免疫)方面
9.4 节点传播影响力方面
影响力最大化问题,k-壳节点
9.5 还有行为传播研究等。
17 再来看下网络科学引论 17章的内容
17.2到5 也在完全混合假设下,讨论SI,SIR,SEIR模型各种状态人数和时间关系.
17.6 讨论了以上完全混合假设和传播概率的不合理性
17.7 讨论了网络传播的最新特性
17.8 讨论了SIR模型的最新特性,
17.8.1 将SIR模型(传播模型)和配置模型(网络结构)放在一起讨论
17.10,11,12还讨论了SI,SIR和SIS模型的时间依赖性,
17.10 SI模型的时间依赖性
17.10.1 配对近似
9网络科学导论第9章网络传播
对了解节点在网络中传播是有帮助的。
这样其实就有两部分影响因素,一个是构建传播模型,另一个是构建网络模型。(也就是传播中每条边的指数分布传播和 RC中的常规树d,参数为1. )
9.1 关注SI,SIR,SIS传播模型中各种疾病状态人数比例跟传播时间关系
以SI模型为例
- 假设:网络中感染人数和易感人数完全混合的,也就是说一个个体在单位时间里与网络中任一其他个体接触的机会都是均等的。一个易染个体在单位时间里与感染个体接触并被感染的概率是贝塔确定的。
- 推导: 关注网络中易感人数以及感染人数比例和时间的关系,其中SI模型公式如下
其他模型的就不列举了。
9.2 考虑传播模型在几类网络(均匀平均网络,非均匀网络(无限规模网络,有限规模网络,淬火网络分析,)) 研究其传播临界值。
9.2.1 SIR模型在均匀平均网络的传播公式临界值
- 假设:完全混合假设,在SIR模型中,均匀网络每个节点近似度为k,网络规模无限大,忽略不同节点之间度相关性
- 推导:推导SIR模型在这个网络中感染个体稳态密度p和时间关系。公式如下
基于这个公式,让右端为0,可以得到
一旦传播率超过图中这个值,就会传播直到感染人数稳定,一般低于这个值,就传播不起来。
这里SIR,或者SIS模型在均匀网络上传播是有趣的,因为均匀网络可以近似每个节点度相等,从而有点类似规则树上的SIR模型,不知道能不能套波利亚罐子模型。
其他的没有推导了。
9.3 还有免疫(随机,熟人免疫)方面
暂时没有兴趣,只有当传播出现某些免疫节点导致传播分支残缺时,这种情况觉得有点意思。有点类似高数里面补全某个曲面使其类似传播圆形。
9.4 节点传播影响力方面
影响力最大化问题,k-壳节点
9.5 还有行为传播研究等。
没什么兴趣。
17 再来看下网络科学引论 17章的内容
17.1 网络中的疾病
在现实网络中,不同的传播有不同样的特性,比如利用本章的标准、普适性理论结合自己的问题特性,创造出适合自己问题的方法比较重要。这一章的重点也在于研究者们给传播过程建模,进而拟合、预测传播人数比例(t)和一些因素的关系。比如度分布、邻接矩阵特征值、传播模型本身参数。可以说,从不同的假设、条件出发,建模的结果都不太一样。
17.2到5 也在完全混合假设下,讨论SI,SIR,SEIR模型各种状态人数和时间关系.
我们应该重点关注研究者为什么会关注感染人数比例和时间的关系和它做的假设和公式来源?而不是其它。重视别人提出问题的过程,试问自己能不能想到。
17.6 讨论了以上完全混合假设和传播概率的不合理性
- 每个用户一般有固定的朋友,还有传播概率不应该一致。
'''其实也就给了一些可以挖的方向,能够数学建模它吗?比如传播概率不一致的感染人数比例和时间关系
17.7 讨论了网络传播的最新特性
- 传播可以用在本书介绍的任何网络上,讨论了网络是全连通的假设不合理性
可能有些网络是有好几个巨片的,我们不知道源在哪里,所以前面的推导可能不适用。
17.8 讨论了SIR模型的最新特性
这是不是可以像SI模型和规则树结构一样呢?有一些推导到波利亚罐子模型或者其他?
那我们肯定就有必要了解这个SIR模型推导过程,SIR模型的节点保持感染状态或者恢复易感状态所需要的时间是符合指数分布的。
实际上并不符合,时间一般在某个平均值附近,而不是指数分布,当我们说 某个随机变量符合某个分布,其实这个随机变量当成x,而y是概率。
2 由SIR模型的指数分布传播,推导出易感节点在时间段t内被感染的概率a,再假设每个节点保持感染状态是相同时间,有了这个假设(和完全混合假设就不同了),每个易感节点就有相同的a,我们在网络中每条边就有感染概率是a,不感染是1-a。
我们可以将其和前面的渗透理论关联起来,因为渗透的边感染概率p也是一致的,我们就可以关心网络结构对传播的影响。但我们的理论无法对疾病的结果做出准确的预测。 我们能做的最好的就是计算概率或平均行为。 例如,我们可以计算将受到爆发影响的预期人数(期望),但是我们无法预测任何给定爆发的确切人数。
17.8.1 将SIR模型(传播模型)和配置模型(网络结构)放在一起讨论
因为在16章就已经就网络渗透和配置模型一起讨论了('''渗透模型的p大于临界值,就会大规模传播,小于p就可能传播特别慢,或者停止传播 '''),所以这里几乎是一模一样的推导。基于17.8所做的完全混合以及每条边的感染概率一致假设,我们有 想要研究其平均行为,重点关注SIR模型在配置模型上扩散人数分布和时间关系。其配置模型的理论依据超度分布, 它是通过跟随一条边到达的顶点与该顶点相连的其他边的数量的概率分布。
它通过计算某节点不属于巨簇的概率,然后推导出感染概率和t的乘积与配置模型度k的关系,一旦感染概率和t的乘积超越某个包含度的公式,就会形成巨簇,就是形成感染传播,不然形不成。
这引导我们思考给定某传播模型和某个网络模型,是否可以推导出某些有趣的性质?这里它仅仅关注的SIR模型在配置模型上的传播临界值。 而RC的SI模型和规则树网络模型,直接套波利亚罐子模型牛逼。
17.10,11,12还讨论了SI,SIR和SIS模型的时间依赖性
只讲SI模型的时间依赖性。
17.10 SI模型的时间依赖性
为什么研究每种模型节点状态转换和时间的关系呢?注意其假设是平均场和完全混合假设。跟前面的不同之处在于其关心是邻居节点被感染情况(更细节推导感染人数比例和时间的关系),并且还有些近似。而前面是关注整个网络感染节点的比例(预期感染比例期望)和易感(易感染比例期望)比例影响 和时间的关系。也叫做网络上动力学研究。
- 假设:这个假设是在完全混合假设1 和每条边感染概率一致2之上的。那么在1和2假设下,考虑所有易感节点在t和dt之间疾病状态跟邻居节点疾病状态的转换是更细节的。也是17.10的理论假设基础。
其实就是研究这种状态转换有多快以及跟什么有关。结果发现感染比例差不多的情况下,有高特征值的网络传播更快。 ''' ''' 感觉天然的跟平均场有关系,或者置信传播。将一个节点邻居节点对其影响扩展到整个网络。''' ''' 那可不可以仿照这个写出以某点进行BFS的树(或者规则树)的感染节点数目和时间关系,以它为标准y,构建目标函数为标准传播-实际传播范式。
就是从研究单个感染点在某个时间段被感染跟它的邻居节点感染有关的情况。扩展到整个网络,研究感染节点占总节点比例跟所有邻居有关,并和时间的关系。从而推导出这个比例不仅跟传播概率a有关,还跟邻居矩阵的特征值 有关,特征值越大, 感染越快。这也算是比之前的推导更加细节的工作的吧,不过,假设真多。
1 这跟特征向量中心(一个节点的重要性跟邻居节点的重要性和邻居节点个数相关)非常类似。重点关注SI模型时间依赖性和特征向量中心公式推导之间关系,
2 '''感觉跟置信传播有关系,把一个节点附近邻居节点对其状态转换影响扩展到整个网络对易感节点数目的影响。
' 研究者还发现这样的理论和实际在高聚类系数网络上有很多区别,研究为什么出现这种情况。结果发现自己的公式推导中有隐含假设('''我们隐式地假设平均值的乘积等于其乘积的平均值。在完全混合模型中,由于混合本身,这是正确的(对于较大的n),但在当前情况下,通常不是,因为概率不是独立的。数量si度量顶点易受影响的概率,而xj度量其邻域被感染的概率。毫无疑问,这些量通常会在相邻顶点之间相关。 ''') 而导致,所以配对近似或矩闭合法来解决这种问题,。
'''这个地方是有疑问的,就是为什么理论和实践有差距, '''
为了解决这种隐含假设问题,本文提出两种方法。
17.10.1 配对近似
为了解除在17.10中的隐含假设,我们必须用配对近似去获取较为精确的结果。结合贝叶斯理论和配对近似,但这种配对近似在树上是较精确的解,在有环的情况下就不是非常精确的解了。
这其实就是置信传播的理论基础,因为这种配对近似利用到了条件独立性和贝叶斯准则来计算每个节点i在t时刻其状态处于S状态的可能性,直接通过其邻居节点j相关联起来,而其邻居节点又关联其领域节点k,而i和k是条件独立的。自然就可以利用置信传播计算,跟DMP一样。
其公式核心在于
17.56 给出了i节点在t时刻处于s状态的概率,在这里唯一变的就是pij,而pij来自于17.52,而j的节点也有同样类似17.56的公式,所以每个节点都有这种条件独立性之下的概率公式,那么为了得到这种概率,这也是DMP提出的初衷。
17.10.2 基于度的SI模型近似方法
现在我们考虑第二种近似方法,之所以提出这种方法的原因是配对近似难以被一般化分析解决,所以基于度的近似方法核心在于:一个点在t时刻被感染的概率依赖于其一阶邻域中节点excess 度,类似于特征向量中心概念。
qk为网络的度分布,而xk表示某个邻居节点B被感染的概率,k是其excess度。任何符合某种度分布的图,都可以用这种方法取近似得到感染者感染概率和时间的关系。
上图就可以表示sk节点跟k的关系,跟其所有邻居节点u的变化都有关系,可以推导出17.59公式,包括v(t)这么一个邻域中变量,感觉还是条件独立性的利用,还是可以用置信传播代替得到。
其实这可以作为一个使用方法的,就是利用DMP的基础上换成SI模型来做消息传播,无论是配对近似还是基于度的近似,都可以得到某点在t时刻的感染概率,理论基础还行。但其实不是一个好方向,因为还是基于经典方法做的。
17.11 SIR模型对时间的依赖性
应该重点关注其与DMP动态消息传递之间的关系。其实它利用的理论跟贝叶斯网络非常的像,不过贝叶斯网络是有向无环图,而它不是。