摘要
图表征学习的目的是:将图中的结点以低维度表征的形式表现出来,同时又改变图原本的结构。
图表征学习介绍
图表征学习的一大困难是:如何有效的表示图,使得一些先进的方法如模式识别、分析、预测,能够被高效的运用在图上,不管是时间还是空间上。
以传统的方式表示图($G=(V,E)$),在main对数百万个结点时,分析起来会有以下问题:
- 计算复杂度高
- 不能并行计算
- 不适用于机器学习方法
要想让图表征学习能够被分析、运算,有以下两个目标
- 图能够被重构到可以被运算的表征空间中去。
- 这个表征空间支持图推断
满足以上两个要求,就意味着可以用图来做:分类、预测等任务了。
有三个方法:传统图嵌入、现代图嵌入、图神经网络
传统图嵌入
传统图嵌入可以看成一种降维技术,它将图重构为一个特征表征数据集(像图片数据集),其目标函数正是完成图的重构。
现代图嵌入
现代图嵌入为了更好的推断,将考虑更多丰富的信息。根据图嵌入保护的信息类型的不同,可做以下分类:
- 图结构和属性保护图嵌入
- 基于边信息的图嵌入
- 高级信息保护图嵌入
用到的方法有:矩阵分解、随机游走、深度神经网络
结构属性保护图嵌入
图的结构和属性很大程度上影响图的推断,所以最基本的是先保护好图的结构和属性。图的结构包括一维结构和高维结构。不同的图有不同的属性/性质,如:有向图有不对称传递性;信号图能用结构平衡理论。。
结构保护图嵌入学习
常用的结构有:结构、高维临近结点、图社区
。。。看不下去了。。。综述一样