集合データは基本的なデータ構造であり, 複合オブジェクトの部分構造として も頻繁に現れる. このため, 集合値に関する検索条件を効率的に支援する索引機構は, 先進的な 応用分野を対象としたデータベースシステムにおいて重要なものとなる. 筆者らは, テキスト検索で従来用いられてきたシグネチャファイルの手法を集 合値検索に適用することを提案し, 比較的小規模のデータベースを想定し, コ スト評価や効率的な問い合わせ処理方式などの検討を行なってきた.本論文では, 中規模データベースに対するシグネチャファイルの有用性の評価 を行なう. シグネチャファイルの構成手法としてはビットスライストシグネチャファイル (bit-sliced signature file, BSSF) を対象とし, 入れ子型インデックス (nested index) を比較の対象とする. 中規模データベースにおける検索コスト, 記憶コスト, 更新コストの評価を行 ない, 小規模データベースにおける評価結果と比較する. また, 中規模データベースにおけるシグネチャファイルの性能向上のためには, ビットスライストシグネチャファイルに圧縮を用いることが有効であると考え, ファイル圧縮時のコストについても評価を行ない, その有効性を示す.
Set-valued data is a primitive data object and often appears as a sub-structure in complex objects. Therefore, access facilities which can support set-valued object retrieval become important for databases supporting advanced application areas. We have proposed the use of signature files for efficient set-valued object retrieval, and studied their performance and efficient query processing strategies for relatively small databases.In this paper, we evaluate the availability of signature files applied to medium-scale databases. As a signature file organization, we use the bit-sliced signature file (BSSF) and compare its performance with that of the nested index. We evaluate retrieval costs, storage costs, and update costs of signature files applied to medium-scale databases, and compare the result with that for small-scale databases. Furthermore, to improve the performance of signature files in medium-scale databases, we evaluate the costs of the compressed BSSF and discuss the effect of compression. We show that the compressed BSSF is promising for set-valued object retrieval in medium-scale databases.