基于 PAT 代数的大规模数据并行查询算法

吉林大学学报(信息科学版) ›› 2026, Vol. 44 ›› Issue (2): 421-426.

基于 PAT 代数的大规模数据并行查询算法

孙晔欣, 夏超

长春工业大学数学与统计学院, 长春 130062

收稿日期:2024-02-22 出版日期:2026-04-14 发布日期:2026-04-15
作者简介:孙晔欣(1995— ), 女, 长春人, 长春工业大学硕士研究生, 主要从事代数学、极大加代数、离散数学研究, ( Tel)86- 15604470020 (E-mail)Sunx5745@ 163. com; 夏超(1988— ), 男, 长春人, 长春工业大学讲师, 博士, 主要从事代数学、离散数学研究, (Tel)86-13578709686(E-mail)xiachao@ ceutelu. cn。
基金资助:
吉林省教育厅科学研究基金资助项目(JJKH20230745KJ)

A Parallel Query Algorithm of Large Scale Data Based on PAT Algebra

SUN Yexin, XIA Chao

School of Mathematics and Statistics, Changchun University of Technology, Changchun 130062, China

Received:2024-02-22 Online:2026-04-14 Published:2026-04-15

摘要/Abstract

摘要：

针对因未考虑大规模数据间存在的特征差异, 而以单一特征作为查询依据会造成查询误差较大的问题,提出一种基于 PAT(Pump Algebra Tutor)代数的大规模数据并行查询算法。采用 PAT 代数对并行数据语义和逻辑进行优化, 设置大规模并行数据的初始序列块, 求得数据块密度, 并按其在有向图中通过调节节点密度实现低权重点过滤, 由此实现有效过滤。同时, 利用子查询乘积最小策略确定目标数据的所在序列点, 通过贪心规则在邻域集合中查找满足条件的子句集, 建立查询连接, 实现高效数据并行查询。实验结果表明, 所提方法的数据传输量和查询量均较高, 说明其针对大规模数据能实现准确查询, 具有一定的实用价值。

关键词:

PAT 代数, 大规模数据并行查询, 数据块密度, 贪心规则

Abstract:

Without considering the feature differences between large-scale data, using a single feature as the query basis can result in significant query errors. Therefore, a parallel query algorithm for large-scale data based on PAT(Pump Algebra Tutor) algebra is proposed. Using PAT algebra to optimize the semantics and logic of parallel data, setting initial sequence blocks for large-scale parallel data, obtaining data block density, and implementing low weight key filtering in a directed graph by adjusting node density according to data block density, the effective filtering is achieved. On this basis, the strategy of minimizing the product of subqueries is used to determine the sequence points where the target data is located. Greedy rules are used to search for clause sets that meet the conditions in the neighborhood set, establish query connections, and achieve efficient parallel data queries. The experimental results show that the proposed method has high data transmission and query volume, indicating that it can achieve accurate queries for large-scale data and has certain practical value.

Key words:

pump algebra tutor ( PAT ) algebra, large scale parallel data queries, data block density, greedy rules

中图分类号:

TP391

孙晔欣, 夏超.

基于 PAT 代数的大规模数据并行查询算法

[J]. 吉林大学学报(信息科学版), 2026, 44(2): 421-426.

SUN Yexin, XIA Chao.

A Parallel Query Algorithm of Large Scale Data Based on PAT Algebra

[J]. Journal of Jilin University (Information Science Edition), 2026, 44(2): 421-426.

[1]	刘静, 陈炳希, 宁宇宸, 窦全胜, 魏广芬. 基于非对称卷积网络的高纵横比赤霞珠电子鼻数据识别 [J]. 吉林大学学报(信息科学版), 2026, 44(2): 356-369.
[2]	霍凤财, 吴伟杰, 任伟建, 刘铠铭. 基于大广角鱼眼镜头的立体标定设备及方法 [J]. 吉林大学学报(信息科学版), 2026, 44(2): 377-382.
[3]	李默, 高飞, 夏兰. 基于深度稀疏滤波学习的多模态沙漠地震噪声消减 [J]. 吉林大学学报(信息科学版), 2026, 44(2): 370-376.
[4]	越缙, 周飞. 基于双层注意力的多源全媒体交互信息相似性搜索算法 [J]. 吉林大学学报(信息科学版), 2026, 44(2): 453-459.
[5]	张岩, 汪靖哲, 张永雪, 魏子心, 张林军, 陈柏汉. 基于 LogRetinex-Net 的低照度站库监控图像增强方法 [J]. 吉林大学学报(信息科学版), 2026, 44(2): 435-445.
[6]	王莉, 蔡路路. 对称差分算法下人体运动轨迹图像分割技术 [J]. 吉林大学学报(信息科学版), 2025, 43(6): 1222-1229.
[7]	陈斌, 顾珑. 基于知识图谱的设备电子信息资源精准推荐算法 [J]. 吉林大学学报(信息科学版), 2025, 43(6): 1388-1396.
[8]	闫晓明, 尹孝萱, 籍风磊, 王勇, 王铭阳. 面向OCC系统的目标LED阵列检测算法 [J]. 吉林大学学报(信息科学版), 2025, 43(6): 1214-1221.
[9]	孙朋飞, 胡悦, 张文俊, 许婧. 结合CNN和旋转森林的影视视频标签分类算法优化 [J]. 吉林大学学报(信息科学版), 2025, 43(6): 1363-1368.
[10]	张岩, 张林军, 汪靖哲, 李新月, 张永雪, 魏子心. 基于改进RT-DETR的原油库指针式仪表检测方法 [J]. 吉林大学学报(信息科学版), 2025, 43(6): 1352-1362.