吉林大学学报(工学版) ›› 2022, Vol. 52 ›› Issue (4): 874-884.doi: 10.13229/j.cnki.jdxbgxb20200877
Xiao-hui WEI1,2(),Yan-wei MIAO1,Xing-wang WANG1,2(
记录数据出现的次数(频数估计)是流数据管理的一类重要任务。在该类任务的解决方案中,sketch是内存使用效率较高的数据结构之一。目前的多层sketch方案,通常使用相同长度的计数器记录数据能够到达的最高层级。然而,数据频数的高度偏斜会导致部分计数器的高位内存被浪费。另一方面,由于数据分布是不断变化的,静态的sketch数据结构会造成内存分配不合理的问题。为了解决上述问题,本文提出一种弹性层级结构Rhombus sketch,能够按需将计数器分配给数据,并通过估计数据的分布动态调整内存分配。实验结果表明,相比于其他典型sketch方法,特别是在内存紧张的情况下,Rhombus sketch的准确性有明显的提高。
