毕业要求,混口饭吃。一定不要代入太多个人情感在里面。
数据集准备
一开始的时候,作者只在github上放了模型的代码和readme.pdf(对是pdf不是md文件)。但是按照readme.pdf上得描述根本搞不下去,因为数据处理部分得代码一点没有(挺难搞的)。经过我的邮件催促(先是发给了第4作者—科大何老师,再发给了第一作者,再由第一作者邮件催促公司员工等等等等抓马过程,搞来搞去搞了一周),他们在github上终于更新所有缺失得文件啦!所以可以开始推进进度了。2019年6月24日10:29分于实验室菜鸟书。
今天按照脚本准备数据集的时候发现可能要写正则表达式?没有准备好,暂时搁置。
正则表达式写好了,还剩一个莫名其妙的用户歌曲关系txt文件需要处理,主要是关系好像只有一个?。然后下面还要搞电影相关的数据集。
代码已经跑通了,这帮人写的对知识图谱的查询真low。就用字典,关系也就那么几个。。。
坑爹,添加关系的语句作者写错了。还得从头整理数据,好在代码写完了,在跑。