发现我现在要看懂一篇论文就得自己把他的理论都梳理一遍才行。
vGraph (nips 2019)
vGraph的建模细节和精神内涵可以说和word2vec如出一辙。同时马大佬的那些观察是如此深远以至于这些东西在vGraph中依然能感受到威力。当然万事万物离不开概率图模型。
随机事件定义
什么方法解决什么问题,我们得定义清楚vGraph是在对什么随机实验进行抽样并拟合之。从vGraph的实验出发,以它所用的Cora和Citeseer数据集为例进行说明。Cora数据集的README文档中对该数据集的描述是:数据集由.content和.cite两个文件组成。其中.content文件每行一个记录,而这条记录由3部分组成:论文ID,向量特征,论文类别。而.cite文件每行一个记录,有两部分组成:被引用文献的ID,主动引用文献的ID。文献间的引用构成了一种graph。那要在这个数据上集定义什么任务呢?