吉林大学学报(工学版) ›› 2023, Vol. 53 ›› Issue (11): 3246-3252.doi: 10.13229/j.cnki.jdxbgxb.20230111

• 计算机科学与技术 • 上一篇    下一篇

基于改进Apriori算法的学生资助系统精准资助方法

马琨1(),王喆2(),范文波2   

  1. 1.吉林大学 学生工作部,长春 130012
    2.吉林大学 大数据和网络管理中心,长春 130012
  • 收稿日期:2023-02-07 出版日期:2023-11-01 发布日期:2023-12-06
  • 通讯作者: 王喆 E-mail:makun602@jlu.edu.cn;wangzhe@jlu.edu.cn
  • 作者简介:马琨(1982-),男,讲师,博士.研究方向:大学生资助管理及思想政治教育.E-mail:makun602@jlu.edu.cn
  • 基金资助:
    吉林省科技发展计划项目(20180101063JC);吉林大学信息化专项研究项目(XXH2022ZX14)

Accurate funding method for student assistance system based on improved Apriori algorithm

Kun MA1(),Zhe WANG2(),Wen-bo FAN2   

  1. 1.Department of Student Affairs,Jilin University,Changchun 130012,China
    2.Big Data and Network Management Center,Jilin University,Changchun 130012,China
  • Received:2023-02-07 Online:2023-11-01 Published:2023-12-06
  • Contact: Zhe WANG E-mail:makun602@jlu.edu.cn;wangzhe@jlu.edu.cn

摘要:

针对学生资助系统精准资助过程易受冗余数据、虚假数据等问题的影响,导致精准资助准确性较差的问题,提出了基于改进Apriori算法的学生资助系统精准资助方法。首先,采集学生消费数据,并采用扩展树状知识库清洗消费数据中的异常、冗余数据,避免这种数据对精准资助过程产生影响;其次,采用基于正态分布的离群点检测法获得贫困生标签数据;最后,采用改进后的Apriori算法获取学生消费与家庭经济状况之间的关联规则,为贫困学生的认定提供依据,完成学生资助系统的精准资助。实验结果表明:本文方法的贫困学生认定精度高、运行时间短、空间复杂度低。

关键词: 扩展树状知识库, 离群点检测, 贫困生标签数据, 扫描数据库, 关联规则

Abstract:

The precision funding process of the student funding system is susceptible to issues such as redundant data and false data, resulting in poor accuracy of precision funding. Therefore, a study on the precision funding method of the student funding system based on the improved Apriori algorithm is proposed. This method first collects student consumption data and uses an extended tree like knowledge base to clean damaged and redundant data in the consumption data, avoiding the impact of such data on the precise funding process. Secondly, the outlier detection method based on normal distribution is used to obtain the poor students' label data. Finally, the improved Apriori algorithm is used to obtain the association rules between students' consumption and family economic status, which provides the basis for the identification of poor students and completes the precise funding of the student funding system. The experimental results show that the proposed method has high identification accuracy, long running time and low space complexity for poor students.

Key words: extended tree knowledge base, outlier detection, poor student label data, scan database, association rules

中图分类号: 

  • TP311

图1

学生消费数据采集系统架构"

图2

基于改进Apriori算法的精准资助流程"

图3

不同方法的混淆矩阵"

表1

不同方法的运行时间"

实验次数运行时间/s
本文方法文献[3]方法文献[4]方法
120.0640.1454.69
219.1242.1755.64
319.0445.2154.72
419.0945.2957.62
521.0845.1854.66
620.0246.1654.67
719.1345.2154.71
821.0244.2258.54
920.0539.1654.55
1019.0345.2353.47
1120.0343.6556.87
1221.0441.2860.15
1319.8939.8854.55
1420.4141.8960.52
1521.0640.2757.63

图4

不同方法消耗的内存存储"

1 刘额尔敦吐. 中加民族高等教育财政资助政策比较分析[J]. 河北师范大学学报: 教育科学版, 2022, 24(3): 62-68.
Liuerduntu. Financial aid policies for ethnic higher education: a comparative analysis of China and Canada[J]. Journal of Hebei Normal University(Educational Science Edition), 2022, 24 (3): 62-68.
2 邱恬, 邱小健. 我国职业教育学生资助政策的变迁逻辑与优化路径——基于历史制度主义视角的分析[J]. 职教论坛, 2021, 37(10): 78-84.
Qiu Tian, Qiu Xiao-jian. The changing logic and optimizing path of student financial aid policy of Vocational education in China—a perspective of historical institutionalism[J]. Journal of Vocational Education, 2021, 37(10): 78-84.
3 郭佳君, 杨波, 朱剑林, 等. 面向不平衡样本的高校学生资助等级分类模型[J]. 中南民族大学学报: 自然科学版, 2022, 41(1): 101-108.
Guo Jia-jun, Yang Bo, Zhu Jian-lin, et al. A classification model of college students funding level for imbalanced samples[J]. Journal of South-Central University for Nationalities(Natural Science Edition), 2022, 41(1): 101-108.
4 邹琳. 基于BP神经网络的精准资助模型构建——对突发公共卫生事件的影响分析[J]. 东南大学学报:哲学社会科学版, 2021, 23(): 116-119.
Zou Lin. Construction of precise funding model based on BP neural network—analysis of the impact on public health emergencies[J]. Journal of Southeast University (Philosophy and Social Science Edition), 2021, 23(Sup.2): 116-119.
5 郑婷婷. 高职院校学生资助政策体系实施成效与优化对策——基于江苏省3所高职院校的调查[J]. 职业技术教育, 2021, 42(18): 32-36.
Zheng Ting-ting. Implementation effect and optimizing countermeasures of student financial aid policy system in higher vocational colleges—based on a survey of 3 higher vocational colleges in Jiangsu province[J]. Vocational and Technical Education, 2021, 42(18): 32-36.
6 赵鑫, 王然风, 付翔. 基于Hadoop生态圈的选煤数据中台设计[J]. 工矿自动化, 2021, 47(12): 121-127.
Zhao Xin, Wang Ran-feng, Fu Xiang. Design of coal preparation data center platform based on Hadoop ecosystem[J]. Industry and Mine Automation, 2021, 47(12): 121-127.
7 高菲, 宋韶旭, 王建民. 多区间速度约束下的时序数据清洗方法[J]. 软件学报, 2021, 32(3): 689-711.
Gao Fei, Song Shao-xu, Wang Jian-min. Time series data cleaning under multi-speed constraints[J]. Journal of Software, 2021, 32(3): 689-711.
8 丁晓阳, 王兰成. 网络论坛文本特征词权重计算优化方法研究[J]. 情报理论与实践, 2021, 44(5): 187-192.
Ding Xiao-yang, Wang Lan-cheng. Research on optimized calculation method for weight of terms in BBS text[J]. Information Studies: Theory & Application, 2021, 44(5): 187-192.
9 魏正元, 彭天奎, 周晓娅. Alpha偏幂正态分布及其应用[J]. 应用概率统计, 2022, 38(5): 647-658.
Wei Zheng-yuan, Peng Tian-kui, Zhou Xiao-ya. Alpha skew power normal distribution and its application[J]. Chinese Journal of Applied Probability and Statistics, 2022, 38(5): 647-658.
10 孟杰, 沈文静, 杨贵军, 等. 复杂抽样的Bootstrap方差估计方法及应用[J]. 数理统计与管理, 2021, 40(2): 266-278.
Meng Jie, Shen Wen-jing, Yang Gui-jun, et al. Bootstrap variance estimation method and application for complex sampling[J]. Journal of Applied Statistics and Management, 2021, 40(2): 266-278.
11 杨燕燕, 张晓, 李翔宇, 等. 基于样本和特征搜索空间不断缩小的模糊粗糙集特征选择[J]. 重庆邮电大学学报: 自然科学版, 2021, 33(5): 759-768.
Yang Yan-yan, Zhang Xiao, Li Xiang-yu, et al. Fuzzy rough set-based feature selection with the ever-shortening scope of samples and features[J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2021, 33(5): 759-768.
12 黄剑湘, 林铮, 刘可真, 等. 考虑换流站海量事件的关联规则挖掘分析方法[J]. 电力系统保护与控制, 2022, 50(12): 117-125.
Huang Jian-xiang, Lin Zheng, Liu Ke-zhen, et al. Association rule mining analysis method considering massive events in a converter station[J]. Power System Protection and Control, 2022, 50(12): 117-125.
13 任文娟, 杨战鹏, 许光銮, 等. 海上动目标身份置信度融合计算模型[J]. 系统工程与电子技术, 2023, 45(4): 1082-1089.
Ren Wen-juan, Yang Zhan-peng, Xu Guang-luan, et al. Fusion calculation model of sea moving target identity confidence[J]. Systems Engineering and Electronics, 2023, 45(4): 1082-1089.
14 严爱俐, 刘漫丹. 基于动态多最小支持度的用户频繁轨迹挖掘[J]. 计算机工程与设计, 2022, 43(6): 1657-1664.
Yan Ai-li, Liu Man-dan. Users' frequent tracks mining based on dynamic multi-minimum support[J]. Computer Engineering and Design, 2022, 43(6): 1657-1664.
15 苗雷星, 曹洪平. 真子群个数与极小真子群覆盖数相等的群[J]. 西南师范大学学报: 自然科学版, 2021, 46(8): 7-9.
Miao Lei-xing, Cao Hong-ping. Groups with number of proper subgroups equal to minimal number of proper subgroups required to cover the group[J]. Journal of Southwest Normal University (Natural Science Edition), 2021, 46(8): 7-9.
[1] 傅丽芳,陈卓,敖长林. 基于分类和回归树决策树的网络大数据集离群点动态检测算法[J]. 吉林大学学报(工学版), 2023, 53(9): 2620-2625.
[2] 梁泉,翁剑成,周伟,荣建. 基于关联规则的公共交通通勤稳定性人群辨识[J]. 吉林大学学报(工学版), 2019, 49(5): 1484-1491.
[3] 张君维, 杨静, 张健沛, 张乐君. 基于滑动窗口的敏感关联规则隐藏[J]. 吉林大学学报(工学版), 2013, 43(01): 172-178.
[4] 李松生, 赵燕伟, 顾熙仁. 改进的FUP算法在五金产品质量分析系统中的应用[J]. 吉林大学学报(工学版), 2012, 42(增刊1): 251-254.
[5] 张日明,孙大文 . 数 控 装 备 故 障 模 式 分 析[J]. 吉林大学学报(工学版), 2008, 38(增刊): 123-0125.
[6] 段海滨, 王道波, 于秀芬 . 基于云模型的小生境MAX-MIN相遇蚁群算法[J]. 吉林大学学报(工学版), 2006, 36(05): 803-0808.
[7] 程晓青, 苑森淼. 关联规则试验数据的人工合成[J]. 吉林大学学报(工学版), 2000, (3): 47-50.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 李寿涛, 李元春. 在未知环境下基于递阶模糊行为的移动机器人控制算法[J]. 吉林大学学报(工学版), 2005, 35(04): 391 -397 .
[2] 刘庆民,王龙山,陈向伟,李国发. 滚珠螺母的机器视觉检测[J]. 吉林大学学报(工学版), 2006, 36(04): 534 -538 .
[3] 李红英;施伟光;甘树才 .

稀土六方Z型铁氧体Ba3-xLaxCo2Fe24O41的合成及电磁性能与吸波特性

[J]. 吉林大学学报(工学版), 2006, 36(06): 856 -0860 .
[4] 张全发,李明哲,孙刚,葛欣 . 板材多点成形时柔性压边与刚性压边方式的比较[J]. 吉林大学学报(工学版), 2007, 37(01): 25 -30 .
[5] 杨树凯,宋传学,安晓娟,蔡章林 . 用虚拟样机方法分析悬架衬套弹性对
整车转向特性的影响
[J]. 吉林大学学报(工学版), 2007, 37(05): 994 -0999 .
[6] 冯金巧;杨兆升;张林;董升 . 一种自适应指数平滑动态预测模型[J]. 吉林大学学报(工学版), 2007, 37(06): 1284 -1287 .
[7] 刘寒冰,焦玉玲,,梁春雨,秦卫军 . 无网格法中形函数对计算精度的影响[J]. 吉林大学学报(工学版), 2007, 37(03): 715 -0720 .
[8] 杨庆芳,陈林 . 交通控制子区动态划分方法[J]. 吉林大学学报(工学版), 2006, 36(增刊2): 139 -142 .
[9] 李月英,刘勇兵,陈华 . 凸轮材料的表面强化及其摩擦学特性
[J]. 吉林大学学报(工学版), 2007, 37(05): 1064 -1068 .
[10] 张和生,张毅,温慧敏,胡东成 . 利用GPS数据估计路段的平均行程时间[J]. 吉林大学学报(工学版), 2007, 37(03): 533 -0537 .