作者: | 来源:互联网 | 2023-09-23 05:44
提出新算法并进行采样优化,共得到三个算法及其理论分析,保证解决问题的效率。后者正是区分真实图与随机图、不同领域图的区别,计算不同networkmotifs的出现次数即可。而寻找独立
hypergraph motifs :概念算法,Algorithms,and Discoveries摘要动机构想概念算法
摘要
) Q1 ) whatarestructuraldesignprinciplesofreal-worldhypergraphs?
) Q2 ) howcanwecomparelocalstructuresofhypergraphsofdifferentsizes?
) Q3 ) howcanweidentifydomainswhichhypergraphsarefrom?
定义h-motifs(hypergraphmotifs )和CP (清澄黑米profile )解决上述三个问题。
提出新算法并进行采样优化,共得到三种算法及其理论分析,保证解决问题的效率。
(h-motifs是相对合理的超图原语,而CP是超图本地模式的直观表示) ) ) ) ) ) ) ) ) ) ) ) ) ) )。
动机Graph在结构方面既有全局模式,也有局部模式。 后者区别实际图表和随机图表、各区域图表的不同,计算不同的network motifs的出现次数即可。 寻找独立于超边缘和超图size的超图局部结构模型,需要一个表示与超边缘相连结构的新概念h-motifs。 想法
超图侧重于超边缘,其本质是点集的非空子集。 如果只把超边的连接关系超边作为集合的二元关系来考虑的话,投影图中反映的只有open和closed这2种,如图c所示超边图中有8种(未解)。 但是,考虑到作为集合的超边的三元关系,投影图中相同的局部结构模式如图d右侧的两个子图所示是不同的。 因此,使用投影图计算h-motifs,但不应停留在投影图上
figure2:(a ) example : co-authorship relations.(b ) hypergraph : thehypergraphrepresentationof (a ) ) )。 projected graph : theprojectedgraphof (b ).(d ) hypergraphmotifs : exampleh-motifsandtheirinstancesin (b )。
概念
根据上表,从上到下,逐步求出相邻的超边缘、投影图、h-motifs、CP。
全部26种h-motifs如图3所示。 这是在全部2 ̄7种可能性中,排除了非连通3-超边、对称模、超边重复(图4 )的结果。
这是标准化的th-motifs的出现次数
代替归一化z scores。 因为后者在network motifs中很大程度上取决于图的大小[45]。
进而作为一个成分得到CP的向量的算术公式。
演算法
分别为hyperedge和hyperwedge采样,复杂度分析见附录,两采样均修正了h-motifs值,使之成为无偏估计。
随机图的随机方式在2.3中进行了描述,但具体情况尚不知晓,请参阅G’
显然,逼真超图和随机超图有很大的区别
关于真实超图,区域内存在共性,区域间存在差异。
在超图之间相关性的实验中,h-h-motifs的性能明显优于网络motifs,很好地区分了不同领域的超图。 第三章的开头有方法的记述。
这个还不太清楚
h-motifs还可用于分析超图的细微差异,如多年来合作作者网络的形势变化,使得合作不再那么集中。
A算法的速度、精度分别远大于e、a算法。
降低采样率后,a算法的精度损失不明显。
多线程加速算法效果很好。
存储器——投影图? 大小对效率的影响还不太清楚
疑问:
2.2集合二元、三元关系的具体分析
2.3随机超图的具体方式
3 h-motifs与网络motifs方法的比较
3.2确定3-连接超边是某些h-motifs的复杂度分析(lemma 2)
3.3种采样算法的复杂度分析及有效性比较
3.4并行计算和实时计算——尽量减少投影图开销