吉林大学学报(理学版) ›› 2022, Vol. 60 ›› Issue (2): 316-320.
刘磊1, 王昊1, 孙凯1, 郜山权1, 刘宣彤2
LIU Lei1, WANG Hao1, SUN Kai1, GAO Shanquan1, LIU Xuantong2
摘要: 针对NPM平台上存在大量的软件包没有标签或标记不完善的问题, 提出一种基于seq2seq模型的深度学习方法为软件包推荐标签. 首先, 利用ECMAScript工具分析软件包的源码构建出包的函数调用图, 遍历函数调用图从而将软件包转换成一组具有包语义信息的函数调用序列; 其次, 训练seq2seq模型, 并将训练好的模型用于软件包的标签推荐工作, 该模型能将包的函数调用序列映射到一组预测的标签序列上, 从而完成软件包的标签推荐. 实验结果表明, 该方法能为软件包推荐一组合理的标签, 准确率达82.6%.
中图分类号: