近年, コンピュータネットワークを通じた異種分散情報源の利用が容易 になるにしたがい, それらの統合利用が重要な課題となっている. 我々 は, WWW, リレーショナルデータベース, 構造化文書リポジトリを対象 とした異種分散情報源統合利用環境の開発を行っている. 本統合利用環境は, ラッパーと呼ぶソフトウエアモジュールを通じて各 情報源の操作を行う. 本稿では, WWWデータを扱うWebラッパーの設計と開発について述べる. Webラッパー自身がすべてのWebページの処理を行うと, 転送データ量を はじめとした転送コストが一般に膨大なものとなる. そこで, 本稿で述 べるアーキテクチャでは, ラッパー処理の一部を担当するオブジェクト 群をコンピュータネットワーク上に分散配置することにより, Webページ の転送コストを削減し, 問合せ処理の効率化を図る.
Integration of heterogeneous information sources has been one of the most important issues in recent advanced application environments. We are developing an information integration environment for the World Wide Web, relational databases, and structured document repositories. In this environment, manipulation of the information sources are performed through software modules called wrappers. In this paper, we describe design and development of the World Wide Web (or Web) wrapper. In general, Web page manipulation may result in very large data transfer cost if all the necessary pages are transferred to the Web wrapper. Therefore, the proposed Web wrapper architecture uses remote objects which cooperatively take part of the wrapper's functions at Web server sites, to reduce the cost of Web page transfer.