基于多尺度残差卷积自编码器的图像聚类方法

吉林大学学报(信息科学版) ›› 2022, Vol. 40 ›› Issue (4): 684-687.

基于多尺度残差卷积自编码器的图像聚类方法

李丁园¹ , 李晓杰²

1. 中国电子科技集团公司电子科学研究院, 北京 100041; 2. 内蒙古机电职业技术学院电气工程系, 呼和浩特 010070

收稿日期:2022-04-29 出版日期:2022-08-16 发布日期:2022-08-17
作者简介:李丁园(1987— ), 女, 山东蓬莱人, 中国电子科技集团公司电子科学研究院工程师, 博士, 主要从事人工智能与大数据应用研究, (Tel)86-15801087029(E-mail)lidingyuan@cetc.com.cn。
基金资助:
国家自然科学基金资助项目(U19B2036; U20B2062)

Image Clustering Method Based on Multi-Scale Residual Convolutional Autoencoder

LI Dingyuan ¹ , LI Xiaojie ²

1. China Academic of Electronics and Information Technology, Beijing 100041, China; 2. Department of Electrical Engineering, Inner Mongolia Technical College of Mechanics and Electrics, Hohhot 010070, China

Received:2022-04-29 Online:2022-08-16 Published:2022-08-17

摘要/Abstract

摘要： 对于图像的聚类, 现有方法在特征提取方面或难以选择合适的维度转换方法, 或提取的特征对图像特征的表达较弱且不够丰富, 对图像的聚类效果产生了较大影响, 导致了聚类精度较低。为此, 提出一种基于多尺度残差卷积自编码器的图像聚类方法, 通过构建具有若干个含有残差连接的多尺度卷积模块, 获得中间层的高维特征表达, 并以此进行图像聚类。实验结果表明, 在 MNIST 数据集上的聚类准确率为 82. 2% , ARI(Adjusted Rand Index) 值为 0. 781 0, NMI (Normalized Mutual Information) 值为 0. 853 2, 模型达到了较好的聚类效果。

关键词: 卷积自编码器； , 图像聚类； , 多尺度残差连接； , 深度学习

Abstract: For image clustering, the existing methods are either difficult to choose the appropriate dimension transformation method in feature extraction, or the extracted features are weak and not rich enough for the expression of image features, which have a great impact on the clustering effect of images and lead to low clustering accuracy. Therefore, an image clustering method based on multi-scale residual convolutional autoencoder is proposed. By constructing several multi-scale convolutional modules with residual connections, the high-dimensional feature expression of the middle layer is obtained, and the image is clustered based on these features. The clustering accuracy on MNIST data set is 82. 2% , ARI (Adjusted Rand Index) value is 0. 781 0 and NMI ( Normalized Mutual Information) value is 0. 853 2, indicating that the model has achieved good clustering effect.

Key words: convolutional autoencoder； , image clustering； , multi-scale residual connection； , deep learning

中图分类号:

TP3. 05

李丁园, 李晓杰. 基于多尺度残差卷积自编码器的图像聚类方法[J]. 吉林大学学报(信息科学版), 2022, 40(4): 684-687.

LI Dingyuan, LI Xiaojie. Image Clustering Method Based on Multi-Scale Residual Convolutional Autoencoder[J]. Journal of Jilin University (Information Science Edition), 2022, 40(4): 684-687.

[1]	赵杰, 郭东. 基于平行注意力机制的对抗样本防御方法[J]. 吉林大学学报(信息科学版), 2022, 40(5): 846-855.
[2]	杜睿山, 刘文豪, 孟令东, 付晓飞. 基于卷积神经网络的地震随机噪声压制方法[J]. 吉林大学学报(信息科学版), 2022, 40(4): 531-538.
[3]	任爽, 田振川, 林光辉, 杨凯, 商继财. 改良 GoogLeNet 的电机滚动轴承故障诊断[J]. 吉林大学学报(信息科学版), 2022, 40(3): 371-378.
[4]	杨雨航, 刘铭, 王新民, 肖志成, 蒋扬. 基于 DenseNet 和迁移学习的乳腺癌图像识别[J]. 吉林大学学报(信息科学版), 2022, 40(2): 213-218.
[5]	董添, 李广, 杨振宇, 张博, 于波, 王巍. 基于 Transformer 的电网企业文件密点标注系统[J]. 吉林大学学报(信息科学版), 2021, 39(6): 720-725.
[6]	孙晖, 杨艾炯, 李康博, 孟浩楠, 牛立刚. 基于深度学习的眼角膜图像自动化分析研究[J]. 吉林大学学报(信息科学版), 2021, 39(5): 609-616.
[7]	王玉, 王梦佳, 张伟红. 基于 CNN 和 Group Normalization 的校园垃圾图像分类[J]. 吉林大学学报(信息科学版), 2020, 38(6): 744-750.
[8]	高金兰, 李豪, 段玉波, 王宏建. 基于Stacking 多GＲU 模型的风电场短期功率预测[J]. 吉林大学学报(信息科学版), 2020, 38(4): 482-490.
[9]	赵维, 沈柏杉, 张宇, 孔俊. 多角度视频的驾驶人员行为识别[J]. 吉林大学学报(信息科学版), 2020, 38(3): 353-359.
[10]	霍晓凯, 史冬辉, 石一锐, 周柚, 时小虎, 吴春国. 口语对话系统中对话管理的演变[J]. 吉林大学学报(信息科学版), 2019, 37(6): 623-630.
[11]	赵梓淇, 裴昀, 常振东, 王博, 安烁文, 李文辉. 基于深度学习的CT 影像肺结节检测[J]. 吉林大学学报(信息科学版), 2019, 37(5): 572-581.
[12]	刘富，刘星，康冰. 基于浅层残差网络的视线估计算法[J]. 吉林大学学报(信息科学版), 2018, 36(3): 333-338.
[13]	邵晓光,董宏丽,代丽艳 . 微地震监测技术综述[J]. 吉林大学学报(信息科学版), 2018, 36(1): 55-61.
[14]	安杏杏,董宏丽,张勇,邵晓光,代丽艳 . 输油管道泄漏检测技术综述[J]. 吉林大学学报(信息科学版), 2017, 35(4): 424-429.