分散データベース
スキーマ(schema)
データベースの構造であり、データベース管理システム (DBMS) でサポートされている形式言語で記述される。関係データベースでは、スキーマは関係 (表) と関係内の属性 (フィールド) 、属性や関係の関連の定義である。スキーマは一般にデータ辞書に格納される。スキーマはテキストによるデータベース言語のデータ定義言語 (DDL) で定義されるが、グラフィカルにデータベース構造を表したものをスキーマと呼ぶことも多い
(http://ja.wikipedia.org/wiki/%E3%82%B9%E3%82%AD%E3%83%BC%E3%83%9E_(%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9))
マルチデータベース
- 異種データベース間結合機能
- 既存データベース間に内在する新しい関係を抽出する
- 既存データベースのマルチデータベースシステムへの接続機能
(http://nels.nii.ac.jp/els/110002722234.pdf?id=ART0003009530&type=pdf&lang=jp&host=cinii&order_no=&ppv_type=0&lang_sw=&no=1240996658&cp= 関数型計算によるマルチデータベースシステムの問い合わせ処理方式)
- 研究背景
- 異種データベース間に内在する関係を反映させた連結による新しい価値の生成
- 分散した多種多様な既存データベース群の永続的利用
- マルチデータベースシステムの構成
- データベース間連結の流れ
- 空間的計量モデルのアプローチ
- 計量モデル間のインテグレーション
http://www.mdbl.sfc.keio.ac.jp/project/mdb/index.htm マルチデータベースシステムにおける異種データベース間の計量的連結方式
- マルチデータベースシステムとは
- 複数のデータベース管理システム(以下DBMSと略す)に格納した表を組み合わせ、仮想表と呼ぶ一つの表を定義し、システム利用者がこの仮想表に対して DBMSの操作言語であるSQLなどを用いることで、レコード情報の検索(SELECT)、更新(UPDATE)、削除(DELETE)、新規作成(INSERT)などの問い合わせ処理を行なうシステムのことである。
- 従来のDBMSでは、実データを 格納している表に対して、複数の表を仮想的に組み合わすビューとよばれる概念がある。
- マルチデータベースシステムの仮想表
- 異なるDBMS上の表に対す るビューとして定義する。
- マルチデータベースシステムでは、上述した仮想表に対して、従来のDBMSと同様に仮想表に対する操作権限をもつユーザや表操作権限の種別を対応づけ、仮想表に対するアクセス権情報の管理を行なう。
(http://www.j-tokkyo.com/2002/G06F/JP2002-149468.shtml マルチデータベース統合システムのアクセス権管理方法)
- マルチデータベースシステムについて
- 独立に構築されたデータベース群を統合し、単一のデータベースのように共有するシステム
メタレベル・アクティブマルチデータベースシステム
- 既存の受動的データベースシステムをアクティブデータベースとして利用することを可能
- ローカルデータベースシステムのアクティブ化を最適化する
- データ管理機構によって管理されていないデータ群を、既存ローカルデータベースとして利用可能にする
- ユーザからの問い合わせに大路て、接続するローカルデータベースを動的に選択することにより、ローカルデータベースシステム群を動的に連結する
(http://www.ieice.org/~de/DEWS/proc/2004/paper/1-A/1-A-04.pdf モバイルコンピューティング環境におけるユーザ情報の動的計量による能動的情報配信方式)
連合データベース(統合データベース) Federated DataBase
(http://download.boulder.ibm.com/ibmdl/pub/software/dw/jp/db2/ds/handouts/v72fed.pdf Federated DataBase(連合データベース)機能拡張)
- マルチDBSに含まれるそれぞれのDBSを要素DBSと呼ぶ。マルチDBSには連合型のものと非連合型のものがあるが、非連合型のものは要素DBSが均一であることを要求し自律的な要素DBSを取り扱うことができない。
- 連合型のマルチDBS=連合データベースシステム
- federated database
- 連結データベース《いくつかのシステムを連結して運用するデータベース; collaboratory の一形態》.
クエリルーティング
- クエリルーティングテーブルを使って,クエリを転送していく
- 第2回:分散システムのアーキテクチャ ( http://www.aist-nara.ac.jp/~yasumoto/lecture/fs2/fs2008-2new.pdf )
- クエリルーティングの問題
- 全データへのインデックス(ルーティングテーブル)を1箇所に,または,全ピアに複製→データの数が増えると...?
- ルーティングテーブルのサイズを小さくしたい!
- クエリルーティングの問題
- http://www.jaist.ac.jp/~yhayashi/tmp_2nd_symp04/TellaGate.ppt 自己組織化型P2P検索システム : TellaGate
- 図で説明してくれてる
Skyline探索
- 膨大なデータにおける情報探索の手法
- 膨大なデータから「優秀」なデータ抽出を目的としている
- Skyline探索の例
- ビーチからの距離(x軸),宿泊費(y軸)の情報が格納されているホテルのデータセットが存在したとする.
- このときホテルのビーチからの距離が近ければ近いほどよい(優れている)とし,宿泊費が安ければ安いほどよい(優れている)とする.
- 優れているポイントが存在するホテルは報告される集合から除去(プルーニング)
- 最終的にプルーニングされずに残ったポイントがSkylineポイントとして報告される.
(高次元空間におけるk+ Skyline探索)
k+ Skyline探索
-
- Skyline探索で出力されるデータ数を調整できる
分散データベース
- 出現の背景
- スケーラブル
- 必要な情報を必要なときに,必要に応じた形でデータを収集・操作したい
- 通信費とレスポンスタイムの問題
- 障害発生時の可用性
- 求められる要件
- 位置に対する透過性
- 移動に対する透過性
- 分割に対する透過性
- 重複に対する透過性
- 障害に対する透過性
- データモデルに対する透過性
- ハードウェアおよびOSから独立
- ネットワークシステムからの独立
- 整合性の保持
- 技術
- グローバルデータディクショナリ
- レプリケーション
- 二相コミット
- ゲートウェイ
- 分散問い合わせ機能
- 参照整合性
(http://agrinfo.narc.affrc.go.jp/fs/cdrom/3syou/303st/t0301.htm)
ネットワークデータ独立
- アプリケーションレベルのAPIとデータ編成の分離
- アプリケーションの修正なしにデータレイアウトの変更
- (物理的)位置独立な名前付け
- 宣言的記述
(ネットワークデータ独立に向けて http://www.dbl.k.hosei.ac.jp/~miurat/readings/Oct1204.pdf)
http://www.sigmod.org/sigmod/record/issues/0803/p05.articles-bonifati.pdf Distributed Databases and Peer-to-Peer Databases: Past and Present