吉林大学学报(工学版) ›› 2018, Vol. 48 ›› Issue (4): 1237-1243.doi: 10.13229/j.cnki.jdxbgxb20170350

• • 上一篇    下一篇

基于Corr-LDA模型的图像标注方法

曹洁1, 苏哲1, 李晓旭1,2   

  1. 1.兰州理工大学 计算机与通信学院,兰州 730050;
    2.北京邮电大学 信息与通信工程学院,北京 100876
  • 收稿日期:2017-04-13 出版日期:2018-07-01 发布日期:2018-07-01
  • 作者简介:曹洁(1966-),女,教授,博士生导师.研究方向:智能信息处理,信息融合.E-mail:caoj@lut.cn
  • 基金资助:
    国家自然科学基金项目(61563030).

Image annotation method based on Corr-LDA model

CAO Jie1, SU Zhe1, LI Xiao-xu1,2   

  1. 1.School of Computer and Communication, Lanzhou University of Technology, Lanzhou 730050,China;
    2.School of Information and Communication Engineering, Beijing University of Posts and Telecommunications, Beijing 100876,China
  • Received:2017-04-13 Online:2018-07-01 Published:2018-07-01

摘要: 针对现有图像标注方法大多将不同类别的图像置于同一主题空间下进行标注的不足,提出了一种新的图像标注方法,该方法以Corr-LDA模型为基础,将各类图像置于不同主题空间下,并为每个类别学习出适合该类的图像标注模型。在Labelme及UIUC-Sport数据集上的实验结果表明,本文方法的标注性能要优于其他方法。

关键词: 计算机应用, 图像标注, 概率主题模型, 变分EM, Corr-LDA模型

Abstract: Most of existing image annotation methods are based on the same topic space. In fact, categories are important information to determine the image annotation words, different classifications of images present different objects. In this paper, a new image annotation method based on Corr-LDA model is proposed. In this method all sorts of images are placed in different topic spaces, and the image annotation model suitable to each category is learned. Experiment results on Labelme and UIUC-Sport datasets show that the proposed method has better performance than other methods.

Key words: computer application, image annotation, probabilistic topic model, variational expectation maximization, Corr-LDA model

中图分类号: 

  • TP391
[1] Zhu S, Li X, Li Z, et al.An improved approach for image annotation[C]∥IEEE Conference on Control, Nanjing,China, 2014: 4673-4678.
[2] Wang M, Ni B, Hua X S, et al.Assistive tagging: a survey of multimedia tagging with human-computer joint exploration[J]. ACM Computing Surveys, 2012, 44(4): 1-24.
[3] 鲍泓, 徐光美, 冯松鹤,等. 自动图像标注技术研究进展[J]. 计算机科学, 2011, 38(7):35-40.
Bao Hong, Xu Guang-mei, Feng Song-he, et al.Advances in automatic image annotation[J]. Computer Science, 2011, 38(7): 35-40.
[4] 李晓旭. 基于概率主题模型的图像分类和标注的研究[D]. 北京:北京邮电大学计算机学院, 2012.
Li Xiao-xu.The study of image classification and annotation based on probabilistic topic model[D]. Beijing: School of Computer, Beijing University of Posts and Telecommunications, 2012.
[5] Li X, Wang X, Wu C, et al.Correspondence with category latent Dirichlet allocation for image annotation[C]∥IEEE International Conference on Multimedia Technology, Hangzhou, China, 2011: 4879-4882.
[6] Blei D M, Mcauliffe J D.Supervised topic models[C]∥International Conference on Neural Information Processing Systems, Bancouver, British Columbia, 2007: 121-128.
[7] Blei D M, Jordan M I.Modeling annotated data[C]∥International ACM SIGIR Conference on Research and Development in Informaion Retrieval, Toronto, Canada, 2003: 127-134.
[8] Putthividhya D, Attias H T, Nagarajan S S.Supervised topic model for automatic image annotation[C]∥IEEE International Conference on Acoustics Speech and Signal Processing, Dallas, TX, USA, 2010: 1894-1897.
[9] 李志欣, 施智平, 李志清,等. 融合语义主题的图像自动标注[J]. 软件学报, 2011, 22(4):801-812.
Li Zhi-xin, Shi Zhi-ping, Li Zhi-qing, et al.Automatic image annotation by fusing semantic topics[J]. Journal of Software, 2011, 22(4): 801-812.
[10] Nguyen C T, Zhan D C, Zhou Z H.Multi-modal image annotation with multi-instance multi-label LDA[C]∥International Joint Conference on Artificial Intelligence, Beijing, China, 2013: 1558-1564.
[11] Li Fei-fei, Perona P.A bayesian hierarchical model for learning natrral scene categories[C]∥IEEEC Conference on Computer Vision and Pattern Recognition(CVPR), San Diego, CA, USA, 2005: 524-531.
[12] Li Li-jia, Socher Richard, Li Fei-fei.Towards total scene understanding: classification, annotation and segmentation in an automatic framework[C]∥IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, USA, 2009: 2036-2043.
[13] Wang C, Blei D,Li F F.Simultaneous Image Classification And Annotation[C]∥IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, USA, 2009:1903-1910.
[14] Xu X, Shimada A, Taniguchi R I.Latent topic model for image annotation by modeling topic correlation[C]∥IEEE International Conference on Multimedia and Expo, San Jose, CA, USA, 2013:1-6.
[15] Larochelle H, Lauly S.A neural autoregressive topic model[C]∥Advances in Neural Information Processing Systems, Lake Tahoe, Nevada, 2012:2717-2725.
[16] Zheng Y, Zhang Y J, Larochelle H.Topic modeling of multimodal data: an autoregressive approach[C]∥IEEE Conference on Computer Vision and Pattern Recognition,Colurmbus, OH, USA,2014:1370-1377.
[1] 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850.
[2] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[3] 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866.
[4] 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872.
[5] 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878.
[6] 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570.
[7] 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599.
[8] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[9] 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613.
[10] 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628.
[11] 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223.
[12] 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230.
[13] 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236.
[14] 侯永宏, 王利伟, 邢家明. 基于HTTP的动态自适应流媒体传输算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1244-1253.
[15] 赵宏伟, 刘宇琦, 特日根, 陈长征, 臧雪柏. 基于有限序列的压缩新算法[J]. 吉林大学学报(工学版), 2018, 48(3): 882-886.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 彭其渊,徐进,郑升宝,邵毅明,邓天民. 隧道洞口路面两种材料交替对行车的影响及交替位置优化[J]. 吉林大学学报(工学版), 2009, 39(06): 1497 -1503 .
[2] 王昕,姜继海. 轮边驱动液压混合动力车辆再生制动控制策略[J]. 吉林大学学报(工学版), 2009, 39(06): 1544 -1549 .
[3] 武剑,董惠娟,张松柏,张广玉. 压电超声换能器初级串联匹配新方法[J]. 吉林大学学报(工学版), 2009, 39(06): 1641 -1645 .
[4] 郑文忠, 万夫雄, 李时光. 用无机胶粘贴CFRP布加固混凝土板火灾后受力性能[J]. 吉林大学学报(工学版), 2010, 40(05): 1244 -1249 .
[5] 吉林大学学报(工学版)编辑部. 吉林大学学报(工学版)第6期目录[J]. 吉林大学学报(工学版), 2012, 42(06): 0 .
[6] 刘松山, 王庆年, 王伟华, 林鑫. 惯性质量对馈能悬架阻尼特性和幅频特性的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 557 -563 .
[7] 初亮, 王彦波, 祁富伟, 张永生. 用于制动压力精确控制的进液阀控制方法[J]. 吉林大学学报(工学版), 2013, 43(03): 564 -570 .
[8] 李静, 王子涵, 余春贤, 韩佐悦, 孙博华. 硬件在环试验台整车状态跟随控制系统设计[J]. 吉林大学学报(工学版), 2013, 43(03): 577 -583 .
[9] 朱剑峰, 林逸, 陈潇凯, 施国标. 汽车变速箱壳体结构拓扑优化设计[J]. 吉林大学学报(工学版), 2013, 43(03): 584 -589 .
[10] 胡兴军, 李腾飞, 王靖宇, 杨博, 郭鹏, 廖磊. 尾板对重型载货汽车尾部流场的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 595 -601 .