吉林大学学报(工学版) ›› 2022, Vol. 52 ›› Issue (4): 910-915.doi: 10.13229/j.cnki.jdxbgxb20210025
• 计算机科学与技术 • 上一篇
摘要:
由于当前已有方法未能考虑文本信息特征提取问题,导致平均相关性、平均优异率和新词搜索准确率下降。为了有效解决上述问题,提出一种基于分段估计和PageRank的文本信息相似性搜索算法。采用分段估计法对文本特征进行提取;将PageRank取值大小作为文本信息初步分类的准则,计算文本信息不同特征的相似度,将文本信息相似度进行排序,根据文本信息间的相关性搜索相似性文本信息,有效实现了文本信息相似性搜索。仿真实验结果表明,本文算法能够全面提升平均相关性、平均优异率和新词搜索准确率,其新词搜索准确率最高值达到了98.98%。
中图分类号:
1 | 刘素艳, 刘元安, 吴帆, 等. 物联网中基于相似性计算的传感器搜索[J]. 电子与信息学报, 2018, 40(12): 3020-3027. |
Liu Su-yan, Liu Yuan-an, Wu Fan, et al. Sensor search based on sensor similarity computing in the Internet of Things[J]. Journal of Electronics & Information Technology, 2018, 40(12): 3020-3027. | |
2 | 朱颢东, 丁温雪, 杨立志, 等. 微博环境下基于用户行为与主题相似度的改进PageRank算法[J]. 计算机工程, 2017, 43(5): 179-184. |
Zhu Hao-dong, Ding Wen-xue, Yang Li-zhi, et al. Improved Pagerank algorithm based on user behavior and topic similarity in microblog environment[J]. Computer Engineering, 2017, 43(5): 179-184. | |
3 | 段瑞, 方欢, 詹悦. 基于加权流关系的流程相似性算法[J]. 电子学报, 2019, 47(12): 2596-2601. |
Duan Rui, Fang Huan, Zhan Yue. Process similarity algorithm based on weighted flow relationship[J]. Acta Electronica Sinica, 2019, 47(12): 2596-2601. | |
4 | 黎万英, 黄瑞章, 丁志远, 等. 基于用户行为特征的多维度文本聚类[J]. 计算机应用, 2018, 38(11): 3127-3131. |
Li Wan-ying, Huang Rui-zhang, Ding Zhi-yuan, et al. Multi-dimensional text clustering with user behavior characteristics[J]. Journal of Computer Applications, 2018, 38(11): 3127-3131. | |
5 | 库珊, 刘钊. 基于PageRank与HITS的改进算法的网页排名优化[J]. 武汉科技大学学报: 自然科学版, 2019, 42(2): 155-160. |
Ku Shan, Liu Zhao. An improved algorithm for page rank optimization based on an improved algorithm for page rank optimization based on Pagerank and HITS algorithms Pagerank and HITS algorithms[J]. Journal of Wuhan University of Science and Technology(Natural Science Edition), 2019, 42(2): 155-160. | |
6 | 赵沛然, 吴新元, 汤新雨, 等. 基于GN分裂的小目标检测区域推荐搜索算法[J]. 光学学报, 2018, 38(9): 277-282. |
Zhao Pei-ran, Wu Xin-yuan, Tang Xin-yu, et al. An algorithm of small object detection region proposal search based on GN splitting[J]. Acta Optica Sinica, 2018, 38(9): 277-282. | |
7 | 孙红, 左腾. 基于PageRank的微博用户影响力算法研究[J]. 计算机应用研究, 2018, 35(4): 1028-1032. |
Sun Hong, Zuo Teng. Research on algorithm of micro-blog user influence based on PageRank[J]. Application Research of Computers, 2018, 35(4): 1028-1032. | |
8 | 谭泗桥, 张席, 李钎, 等. 基于最大互信息系数的信息推送模型构建[J]. 吉林大学学报: 工学版, 2018, 48(2): 558-563. |
Tan Si-qiao, Zhang Xi, Li Qian, et al. Information push model-building based on maximum mutual information coefficient[J]. Journal of Jilin University(Engineering and Technology Edition), 2018, 48(2): 558-563. | |
9 | 康卫, 邱红哲, 焦冬冬,等. 基于搜索的短文本分类算法研究[J]. 电子技术应用, 2018, 44(11): 121-123. |
Kang Wei, Qiu Hong-zhe, Jiao Dong-dong, et al. Search-based short-text classification[J]. Application of Electronic Technique, 2018, 44(11): 121-123. | |
10 | 金洁, 徐岳皓, 刘振宇. 基于PageRank的论文引用网络关系挖掘[J]. 中国电子科学研究院学报, 2019, 14(9): 924-928. |
Ji Jie, Xu Yue-hao, Liu Zhen-yu. Paper relational network mining based on Pagerank[J]. Journal of China Academy of Electronics and Information Technology, 2019, 14(9): 924-928. | |
11 | 赵宏伟, 王鹏, 范丽丽, 等. 相似性保持实例检索方法[J]. 吉林大学学报: 工学版, 2019, 49(6): 2045-2050. |
Zhao Hong-wei, Wang Peng, Fan Li-li, et al. Similarity retention instance retrieval method[J]. Journal of Jilin University(Engineering and Technology Edition), 2019, 49(6): 2045-2050. |
[1] | 李大湘,陈梦思,刘颖. 基于STA⁃LSTM的自发微表情识别算法[J]. 吉林大学学报(工学版), 2022, 52(4): 897-909. |
[2] | 方世敏. 基于频繁模式树的多来源数据选择性集成算法[J]. 吉林大学学报(工学版), 2022, 52(4): 885-890. |
[3] | 王学智,李清亮,李文辉. 融合迁移学习的土壤湿度预测时空模型[J]. 吉林大学学报(工学版), 2022, 52(3): 675-683. |
[4] | 毛琳,任凤至,杨大伟,张汝波. 双向特征金字塔全景分割网络[J]. 吉林大学学报(工学版), 2022, 52(3): 657-665. |
[5] | 欧阳继红,郭泽琪,刘思光. 糖尿病视网膜病变分期双分支混合注意力决策网络[J]. 吉林大学学报(工学版), 2022, 52(3): 648-656. |
[6] | 王雪,李占山,吕颖达. 基于多尺度感知和语义适配的医学图像分割算法[J]. 吉林大学学报(工学版), 2022, 52(3): 640-647. |
[7] | 李向军,涂洁莹,赵志宾. 基于多尺度融合卷积神经网络的熔解曲线有效性分类[J]. 吉林大学学报(工学版), 2022, 52(3): 633-639. |
[8] | 许鸿奎,姜彤彤,李鑫,姜斌祥,王永雷. 结合降噪自编码与极限学习机的LTE上行干扰分析[J]. 吉林大学学报(工学版), 2022, 52(1): 195-203. |
[9] | 李志华,张烨超,詹国华. 三维水声海底地形地貌实时拼接与可视化[J]. 吉林大学学报(工学版), 2022, 52(1): 180-186. |
[10] | 曲优,李文辉. 基于锚框变换的单阶段旋转目标检测方法[J]. 吉林大学学报(工学版), 2022, 52(1): 162-173. |
[11] | 雷景佩,欧阳丹彤,张立明. 基于知识图谱嵌入的定义域值域约束补全方法[J]. 吉林大学学报(工学版), 2022, 52(1): 154-161. |
[12] | 汤松梅. 基于群智能的图书馆人脸识别系统关键技术[J]. 吉林大学学报(工学版), 2021, 51(6): 2216-2224. |
[13] | 孙东明,胡亮,邢永恒,王峰. 基于文本融合的物联网触发动作编程模式服务推荐方法[J]. 吉林大学学报(工学版), 2021, 51(6): 2182-2189. |
[14] | 赵宏伟,霍东升,王洁,李晓宁. 基于显著性检测的害虫图像分类[J]. 吉林大学学报(工学版), 2021, 51(6): 2174-2181. |
[15] | 林俊聪,雷钧,陈萌,郭诗辉,高星,廖明宏. 基于电影视觉特性的动态多目标实时相机规划[J]. 吉林大学学报(工学版), 2021, 51(6): 2154-2163. |
|