吉林大学学报(工学版) ›› 2018, Vol. 48 ›› Issue (2): 558-563.doi: 10.13229/j.cnki.jdxbgxb20170015

• • 上一篇    下一篇

基于最大互信息系数的信息推送模型构建

谭泗桥1, 2, 张席2, 3, 李钎2, 艾陈4   

  1. 1.湖南农业大学 信息科学技术学院,长沙 410128;
    2.湖南省农村农业信息化工程技术研究中心,长沙410128;
    3.湖南农业大学 植物保护学院,长沙 410128;
    4.邵阳学院 医学院,湖南 邵阳 422000
  • 收稿日期:2017-01-05 出版日期:2018-03-01 发布日期:2018-03-01
  • 通讯作者: 艾陈(1986-),男,讲师. 研究方向:大数据分析.E-mail:33979639@qq.com
  • 作者简介:谭泗桥(1974-),男,副教授,博士. 研究方向:模式识别及预测. E-mail:tsq@hunau.edu.cn
  • 基金资助:
    国家自然科学基金项目(31772157); 国家星火计划项目(2014GA770015)

Information push model-building based on maximum mutual information coefficient

TAN Si-qiao1, 2, ZHANG Xi2, 3, LI Qian2, AI Chen4   

  1. 1.School of Information Science and Technology, Hunan Agricultural University, Changsha 410128, China;
    2.Hunan Engineer Research Center for Information Technology in Agriculture, Changsha 410128, China;
    3.College of Plant Protection, Hunan Agricultural University, Changsha 410128, China;
    4.College of Medicine, Shaoyang University, Shaoyang 422000, China
  • Received:2017-01-05 Online:2018-03-01 Published:2018-03-01

摘要: 针对目标用户近邻集合选择失准的问题,引入可普适性测度非线性关系的关联指标——最大互信息系数(MIC),并以此测度用户间的相似程度。基于某一给定的阈值,为目标用户选择近邻集合,然后以近邻集合作为训练集,构建支持向量机个性化预测模型,对目标用户的感兴趣项目进行打分预测。仿真结果表明,MIC测度较Pearson等测度选择的近邻集合更为准确,并具有对阈值不敏感的优点。

关键词: 计算机应用, 信息推送, 相似性测度, 模型构建, 最大互信息系数

Abstract: The correlation indicator, Maximum Information Coefficient (MIF), which can pervasively measure the nonlinear relationship, is introduced to solve the problem of inaccurate selection of the near-neighbor set of the target users. The indicator is employed to measure the similarity between users. First, the near-neighbor set target users is selected based on a given threshold. Then, the personalized SVM prediction model is built with the attained near-neighbor set as the training set to carried out scoring prediction for the interesting items of the target users. Simulation results show that the near-neighbor set selected by the MIF Measuring is more accurate than that selected by the Pearson Measuring, and has the merit of insensitive to the threshold.

Key words: computer application, information push, similarity measure, model-building, maximum mutual information coefficient

中图分类号: 

  • TP391
[1] Ahn H J. A new similarity measure for collaborative filtering to alleviate the new user cold-starting problem[J]. Information Sciences, 2008, 178(1): 37-51.
[2] David N R,Yakir A R,Hilary K F, et al. Detecting novel associations in large data sets [J]. Science, 2011, 334:1518-1541.
[3] Sarwar B, Karypis G, Konstan J, et al. Item-based collaborative filtering recommendation algorithms[C]∥Proc of the 10th International Conference on World Wide Web, Hong Kong, China, 2001:285-295.
[4] Hastie T,Tibshirani R, Friedman J H. The Elements of Statistical Learning: Data Mining, Inference, and Prediction [M]. New York: Springer Verlag, 2009.
[5] 陈诚,廖桂平,史晓慧. 个性化信息推送服务的用户模型研究[J]. 情报科学, 2014, 32(11): 71-76.
Chen Cheng, Liao Gui-ping, Shi Xiao-hui. Model of user for personalized information push service [J]. Information Science, 2014, 32(11): 71-76.
[6] Sedgwick P. Pearson's correlation coefficient [J].Bmj, 2012, 345:e4483-e4484.
[7] Mudelsee M. Estimating Pearson's correlation coefficient with bootstrap confidence interval from serially dependent time series [J]. Mathematical Geology, 2003, 35(6): 651-665.
[8] 缪平,陈盛双,何云丽. 基于SVMs的微博信息推送系统用户兴趣模型[J]. 武汉理工大学学报:信息与管理工程版,2013, 35(4): 547-550.
Miao Ping,Chen Sheng-shuang,He Yun-li. User interest model in MICroblog information push system based on SVMs [J]. Journal of Wuhan University of Technology(Information & Management Engineering), 2013, 35(4): 547-550.
[9] Delicado P, Smrekar M. Measuring non-linear dependence for two random variables distributed along a curve[J]. Statistics and Computing, 2009, 19(3): 255-269.
[10] Yuan C, Ying Z, Feng L, et al. A new algorithm to optimize maximal information coefficient[J].Plos One, 2016, 11(6):e0157567.
[11] Chang C C, Lin C J. LIBSVM: a library for support vector machines [J]. ACM Transactions on Intelligent Systems and Technology, 2011,27(2):1-27.
[12] Ji L, Wang X D, Yang X S, et al. Back-propagation network improved by conjugate gradient based on genetic algorithm in QSAR study on endocrine disruptingcheMICals [J]. Chinese Science Bulletin, 2008, 53(1): 33-39.
[1] 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850.
[2] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[3] 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866.
[4] 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872.
[5] 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878.
[6] 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570.
[7] 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599.
[8] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[9] 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613.
[10] 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628.
[11] 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223.
[12] 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230.
[13] 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236.
[14] 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243.
[15] 侯永宏, 王利伟, 邢家明. 基于HTTP的动态自适应流媒体传输算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1244-1253.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王文权, 商延赓, 李秀娟, 王春生, 张桂兰. 激光焊接650 MPa相变诱发塑性钢的组织与性能[J]. , 2012, 42(05): 1203 -1207 .
[2] 黄健康1, 何翠翠1, 2, 石玗1, 樊丁1. 铝/钢异种金属焊接接头界面Al-Fe金属间化合物生成及其热力学分析[J]. 吉林大学学报(工学版), 2014, 44(4): 1037 -1041 .
[3] 徐涛, 刘光洁, 葛海潮, 张炜, 于征磊. 焊接热源局部坐标移动曲线路径建模方法[J]. 吉林大学学报(工学版), 2014, 44(6): 1704 -1709 .
[4] 骆海涛, 周维佳, 王洪光, 武加锋. 搅拌摩擦焊机器人典型工况下的受载分析[J]. 吉林大学学报(工学版), 2015, 45(3): 884 -891 .
[5] 杨悦, 周磊磊. 微弧氧化对铝合金搅拌摩擦焊缝耐蚀性能的影响[J]. 吉林大学学报(工学版), 2016, 46(2): 511 -515 .
[6] 初亮, 孙成伟, 郭建华, 赵迪, 李文惠. 基于轮缸压力的制动能量回收评价方法[J]. 吉林大学学报(工学版), 2018, 48(2): 349 -354 .
[7] 何祥坤, 季学武, 杨恺明, 武健, 刘亚辉. 基于集成式线控液压制动系统的轮胎滑移率控制[J]. 吉林大学学报(工学版), 2018, 48(2): 364 -372 .
[8] 史文库, 刘国政, 宋海生, 陈志勇, 张宝. 纯电动客车振动噪声特性[J]. 吉林大学学报(工学版), 2018, 48(2): 373 -379 .
[9] 张天时, 宋东鉴, 高青, 王国华, 闫振敏, 宋薇. 电动汽车动力电池液体冷却系统构建及其工作过程仿真[J]. 吉林大学学报(工学版), 2018, 48(2): 387 -397 .
[10] 陈吉清, 杜天亚, 兰凤崇. 钝性碰撞中人体肝脏生物力学响应数值分析[J]. 吉林大学学报(工学版), 2018, 48(2): 398 -406 .