吉林大学学报(工学版) ›› 2015, Vol. 45 ›› Issue (2): 583-588.doi: 10.13229/j.cnki.jdxbgxb201502036

• 论文 • 上一篇    下一篇

代价敏感不确定贝叶斯分类器的单批测试算法

张星1,李梅1,张阳1,宁纪峰2   

  1. 1.西北农林科技大学 机械与电子工程学院,陕西 杨凌 712100;
    2.西北农林科技大学 信息工程学院,陕西 杨凌 712100
  • 收稿日期:2014-07-22 出版日期:2015-04-01 发布日期:2015-04-01
  • 作者简介:张星(1986), 男, 博士研究生.研究方向:数据挖掘.E-mail:zhangxing@nwsuaf.edu.cn
  • 基金资助:
    国家自然科学基金项目(61003151).

Single batch test algorithm on cost-sensitive uncertain Nave Bayes for uncertain data

ZHANG Xing1, LI Mei1, ZHANG Yang1,NING Ji-feng2   

  1. 1.College of Mechanical and Electronic Engineering, Northwest A&F University, Yangling 712100, China;
    2.College of Information Engineering, Northwest A&F University, Yangling 712100, China
  • Received:2014-07-22 Online:2015-04-01 Published:2015-04-01

摘要: 提出了一种针对不确定数据的贝叶斯代价敏感分类器算法SBT-CSUNB用来进行单批测试。SBT-CSUNB算法在代价敏感贝叶斯分类器的框架上定义了不确定数据属性对总代价的影响,提出了单批算法的最优属性集合的选择方式。在UCI数据集上的实验表明:SBT-CSUNB有效地降低了总代价,并且在不同的参数设定下表现平稳,甚至在高不确定率的情况下算法仍旧表现良好。

关键词: 人工智能, 不确定单批测试, 不确定数据, 代价敏感

Abstract: In this paper, we propose a single batch test algorithm on Cost-sensitive Uncertain Nave Bayes for Uncertain Data (SBT-CSUNB). We define the influence of an uncertain attribute on the total cost in cost-sensitive Nave Bayes Classifier, and put forward a method to fine an optimal batch test strategy. Experiment results on UCI Database demonstrate that the proposed algorithm can effectively reduce the total cost, and the performance is stable with different parameters and under high uncertain rate.

Key words: artificial intelligence, uncertain single batch, uncertain data, cost sensitive

中图分类号: 

  • TP391
[1] Qin B, Xia Y, Prabhakar S, et al. A rule-based classification algorithm for uncertain data[C]∥25th International Conference on Data Engineering.Shanghai: IEEE, 2009: 1633-1640.
[2] Qi B, Xia Y, Li F. DTU: a Decision Tree for Uncertain Data[M]. Berlin Heidelberg:Springer, 2009: 4-15.
[3] Tsang S, Ben K,Yip K Y,et al. Decision trees for uncertain data[J]. IEEE Transactions on Knowledge and Data Engineering, 2011, 23(1): 64-78.
[4] Bi J, Zhang T. Support vector classification with input data uncertainty[J]. Advances in Neural Information Processing Systems, 2004,17: 161-169.
[5] Yang J, Gunn S. Exploiting uncertain data in support vector classification[C]∥Knowledge Based Intelligent Information and Engineering Systems. Heidelberg.Berlin: Springer, 2007: 148-155.

[6] Yang J, Gunn S. Iterative constraints in support vector classification with uncertain information[J]. Constraint-based Mining and Learning, 2007,1:49-60.
[7] Qin B, Xia Y, Li F. A Bayesian classifier for uncertain data[C]∥Proceedings of the 2010 ACM Symposium on Applied Computing. New York:ACM, 2010: 1010-1014.
[8] Ren J, Lee S D, Chen X, et al. Naive Bayes classification of uncertain data[C]∥Ninth IEEE International Conference on Data Mining.Miami,FL:IEEE, 2009: 944-949.
[9] Ling C X, Yang Q, Wang J, et al. Decision trees with minimal costs[C]∥Proceedings of the Twenty-first International Conference on Machine Learning. New York:ACM, 2004: 69.
[10] Zubek V B, Dietterich T G. Pruning improves heuristic search for cost-sensitive learning[R]. Corvallis, OR: Oregon State University, Dept of Computer Science, 2004.
[11] Turney P. Cost-sensitive classification: empirical evaluation of a hybrid genetic decision tree induction algorithm[J]. Journal of Artificial Intelligence Research (JAIR), 1995, 2:369-409.
[12] Chai X, Deng L, Yang Q, et al. Test-cost sensitive naive bayes classification[C]∥Fourth IEEE International Conference on Data Mining, IEEE, 2004: 51-58.
[13] Turney P. Types of cost in inductive concept learning[C]∥In Workshop on Cost-Sensitive Learning at the Seventeenth International Conference on Machine Learning,Stanford 2000:1-7.
[14] Liu M, Zhang Y, Zhang X, et al. Cost-sensitive Decision Tree for Uncertain Data[M]. Heidelberg, Berlin: Springer, 2011: 243-255.
[15] 刘明建,张阳,王勇.代价敏感不确定决策树的不确定单批测试算法研究[J].工程数学学报,2012,29(4):559-566.
Liu Ming-jian, Zhang Yang,Wang Yong. Uncertain single batch test algorithm on cost-sensitive decision tree for uncertain data[J]. Chinese Journal of Engineering Mathematics, 2012,29(4):559-566.
[1] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[2] 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585.
[3] 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205.
[4] 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213.
[5] 黄岚, 纪林影, 姚刚, 翟睿峰, 白天. 面向误诊提示的疾病-症状语义网构建[J]. 吉林大学学报(工学版), 2018, 48(3): 859-865.
[6] 李雄飞, 冯婷婷, 骆实, 张小利. 基于递归神经网络的自动作曲算法[J]. 吉林大学学报(工学版), 2018, 48(3): 866-873.
[7] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[8] 王旭, 欧阳继红, 陈桂芬. 基于多重序列所有公共子序列的启发式算法度量多图的相似度[J]. 吉林大学学报(工学版), 2018, 48(2): 526-532.
[9] 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538.
[10] 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544.
[11] 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603.
[12] 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611.
[13] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
[14] 王生生, 王创峰, 谷方明. OPRA方向关系网络的时空推理[J]. 吉林大学学报(工学版), 2017, 47(4): 1238-1243.
[15] 马淼, 李贻斌. 基于多级图像序列和卷积神经网络的人体行为识别[J]. 吉林大学学报(工学版), 2017, 47(4): 1244-1252.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!