Bitmap Index Design and Evaluation
针对 bitmap 索引提出的一系列指导设计建议,传统方式对于带谓词的查询,一般是:全表scan、B树 索引、每个谓词做scan然后merge;使用 bitmap 后采用第三种方案效果最好,论文中提出了四种时空权衡:空间最优、时间最优、基于空间限制下的时间最优、时空权衡; 在大量数、数据基础范围较小的情况下使用 bitmap 索引效果很好,而 bitmap 可以采用 基于范围的、基于等值的;基于范围的相当于 Value-List set,在这种场景下继续拆分,如基于<3,3>的Value-List,其空间比原始的更小;论文中提出了对 Algorithm RangeEval 改进的 Algorithm RangeEval-Opt 算法,需要处理的谓词更少,只需一次扫描;论文指出 范围编码的时空权衡效果更好,之后又对比了压缩的情况,buffer的增大,对于时空权衡也有帮助