CAAI第八届全国大数据与社会计算学术会议 (CAAI-BDSC 2023) 社交图谱链接预测
任务一:社交图谱小样本场景链接预测 基线方法
该仓库提供了基于异质信息网络表征模型的链接预测实现代码,其中数据处理基本流程、提交文件格式等可供参赛队伍参考,所用的CompGCN-DistMult模型并不是专用于小样本问题的模型。
代码参考自CompGCN模型的DGL官方实现。
建议通过Anaconda专门创建一个环境,并安装以下第三方依赖。
python=3.6.10
pytorch=1.10.2
dgl=0.9.1
pandas
json
heapq
ordered_set
collections
若有条件,请安装pytorch
和dgl
的GPU版本。
以初赛为例,报名参赛后,在阿里巴巴天池平台下载初赛数据文件,并放到./data/
文件夹。
event_info.json
user_info.json
source_event_preliminary_train_info.json
target_event_preliminary_train_info.json
target_event_preliminary_test_info.json
在Terminal运行下面的命令:
python main.py --lr 0.003 --num_workers 10 --gpu 0
参赛队伍可以根据机器条件确定gpu
、num_workers
等参数。
模型文件baseline_ckpt.pth
会输出到./checkpoint/
文件夹。
初赛结果文件preliminary_submission.json
会输出到./output/
文件夹,可以直接提交到天池平台。
MRR@5 | HITS@5 | |
---|---|---|
Baseline | 0.24646 | 0.34941 |