Sorry, your browser cannot access this site
This page requires browser support (enable) JavaScript
Learn more >

未看但是可能要看:

  • 2.4 分支限界算法中:多项式近似算法,page 35
  • 2.4 KT index,page 63

1.1 图的基本概念、类型

1.2 幂律分布、图的测度参数、随机图

2.1 顶点及边的中心性计算

n为全图顶点数目

  • 无向图的度中心性:顶点的度(可以通过除以最大可能值n-1来标准化度数)

2.2 可达性&最短路径

  • Dijkstra算法:

    直到所有顶点都加入集合S

  • A*算法:

    直到所有顶点都加入集合S

    其中g(n)的计算:传递计算

2.3 稠密子图搜索

定义和算法

k-core

定义

算法

  • degree(u)>degree(v):即看在order中在v(当前顶点)右边的v邻居

  • 算法举例:page 34-50

k-truss

定义

算法

  • 举例:page 54-63

k-clique

定义

原始算法

  • 举例:page 69-79

算法KCLIST

  • 举例:page 82-86(如果看不懂,建议先看简单算法的举例)

比较

2.4 图关键字搜索

r-clique

分支限界算法

  • 举例:page 20-33

k-NK搜索

二跳标签索引

举例和应用:线性扫描L(v1)和L(v3)

k-Nk查询定义

前向搜索(FS)

其中“查找dist(q,vi)”通过查二跳标签索引L(q)和L(vi)得到

二跳标签后向索引

根据二跳标签索引L构建LB:

前向后向搜索(FBS)

举例:

2.5 图结构差异性搜索

基于连通分量的结构差异性

是一个顶点的性质

基于核心的结构差异性

是一个顶点的性质

问题 CC-TopK Core-TopK

CC-TopK的基于度的简单方法

bound

算法

举例:

2.6 图划分

标签更新过程:

  • 两个扩展:(当多个标签具有相同的最高频率,不再是随机选一个)

    • 定义:

3.1 社区检测 COPRA

重叠社区发现算法COPRA

算法

举例

解:

对于每个顶点:

  • 删除标签:系数>=1/2的标签保留;若所有标签都系数<1/2,则保留其中系数最高的标签;若有多个系数相同的这种标签,则随机保留其中一个;
  • 对于保留的标签,进行系数归一化(所有标签系数之和为1)

传播:对于每个顶点,对于其邻居中的每个标签L,扫描它的所有邻居将该标签的系数求和,再除以邻居数目,得到L的系数

以此类推,见作业答案

3.2 异常检测

评测指标

  • 精确率P,召回率R
  • F-measure(是P和R的一个平均数)
  • ROC 曲线(TPR(即召回率):样本中的正例有多少被预测正确了;FPR:样本中的负例有多少被预测正确了)

SpotLight 算法

图模型

每个Gt是一个有向二部图

算法

  • 如何提取spotlight草图v(G):先选取k个查询子图(分别对应v(G)坐标的k个维度),然后计算每个维度(对应查询子图的边权之和)

举例:

3.3 频繁子图挖掘

定义

子图的支持度:(在输入的多个图中的)出现次数

一个图中出现(不管多少次),计一次

举例:

Apriori算法

AGM 基于Apriori算法的频繁子图挖掘算法

图编码

合并两个含有k个顶点(且共有一个k-1个顶点的子图)的图:如果用编码

算法

3.5 图概要

无损图表示

”超节点映射“:记录每个超节点代表原图中的哪些点

(超点连接的)存储开销

贪婪算法

算法

举例

s(x,y)计算举例 page42和page45

算法举例 page41-48

评论