KDD Autograph2020 比赛总结

研一下学期和组内同学一同参加了KDD Autograph2020的比赛,最后也拿到了第二名的成绩,下面对本次比赛做个总结。

PASA_NJU代码总结

github代码

  1. 使用GraphNas对数据集搜索最优网络模型。(引自 Gao Y, Yang H, Zhang P, et al. Graphnas: Graph neural architecture search with reinforcement learning[J]. arXiv preprint arXiv:1904.09981, 2019.)
  2. 使用决策树根据数据集元信息进行模型选择,如节点数、边数、平均度等。
  3. 特征工程,我们发现将lpa和对特征的预测概率分布加入到features中对于citation类型图数据集会有性能提升,将边关系矩阵作为特征对于一些图数据集也会有提升。
  4. 加入EarlyStop早停机制以及自适应的集成策略。

JunweiSun代码总结

github代码

  1. 根据标签类别比率平衡loss(平衡的权重是比率开根号的倒数),类别数小于10或最大类别样本数小于最小类别样本数*10不使用(即是否类别平衡)。
  2. 使用microsoft的automl工具nni搜索模型超参,训练过程搜参,搜索空间较小。
  3. 使用0.1比例的验证集,评估指标为F1-score,验证集分值使用指数移动加权平均值来计算。
  4. 复现了多个论文的模型,如ResGCN, GraphSAGE, GIN, ARMA等,模型根据图信息进行选择,如特征维度,平均度,是否为有向图。
  5. 特征工程,实现了one_hot / svd / degree / node2vec / adj等特征,实际上只在原来的节点特征上添加了svd特征。
原文链接:segmentfault.com

上一篇:Windows 服务 创建 安装 卸载 和调试
下一篇:mysql explain key_len计算公式

相关推荐

暂无相关文章