摘要: 高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.
中图分类号:
赫枫龄, 左万利, 张雪松. 高性能网页索引器JU_Indexer的实现[J]. J4, 2006, 44(01): 50-56.
HE Feng-ling, ZUO Wan-li, ZHANG Xue-song. Implementation of a Web Page Indexer JU_Indexer with High Performance[J]. J4, 2006, 44(01): 50-56.