田中研究室における研究の概要

  1. [I.主な研究と特長]
    1. ■次世代検索エンジンの開発■
      1. 【検索結果の近似的内包表現の発見によるWebサーチ支援】
      2. 【Webコンテンツに対するアスペクト発見】
      3. 【Webページ間の汎化/集約関連の発見と活用】
      4. 【Webの話題構造抽出に基づく情報の統合】
      5. 【Web/Blogコンテンツに基づく地域情報検索システムBlog Map of Experiences(体験ブログマップ)】
    2. ■ユビキタス・コンテンツ環境の研究■
      1. 【映像解析による全方位映像のメタデータ自動生成】
    3. ■データベースの設計理論の研究■
      1. 【履歴データベースモデルの理論研究】
      2. 【ハイパーメディアデータベースシステムの研究】
      3. 【オブジェクト指向データベース管理システムの研究】
      4. 【動画像データベースに関する研究】
      5. 【デジタル映像通信と分散発展型データベースの研究】
  2. [II.今後の展望]

[I.主な研究と特長]

■次世代検索エンジンの開発■

 WebデータやWeb利用者のデータ検索行動に内在する意味構造に基づき,高度なWeb情報検索サービスの開発を進めている.特に,以下に挙げる意味構造の発見に焦点を置き,新しいWeb検索エンジンのための基盤技術の開発を行っている.

【検索結果の近似的内包表現の発見によるWebサーチ支援】

 サーチエンジンを用いたWeb情報検索において、その結果数の膨大さなどから得たい情報を取得することは困難である。そこで、ユーザが得た検索結果の集合がいったいどのような内容であるかを簡潔に理解するための情報によってユーザの検索行動を支援することを提案する。本研究ではこの情報を、複数のキーワードを論理演算子で結合する近似的内包表現を生成する。これは得られた検索結果集合と近似的に同じ検索結果を取得できるものである。この近似的内包表現によって、ユーザは検索結果としてどのような内容を得られているのかを簡潔に理解することを促し、ユーザの質問修正にも応用することができると考えられる。この近似的内包表現を生成するシステムのプロトタイプを実装し、その生成された近似的内包表現の定量的な評価、そしてユーザの理解という定性的な評価の両評価において有用であることを示した。

【Webコンテンツに対するアスペクト発見】

 Web 上の画像やテキストの意味は,その画像やテキスト自身の有する意味情報に加えて,これらの画像やテキストの周辺にどのような情報が配置されているかによって推定することが可能である. 本研究では画像やテキストの文脈を,このような周辺情報から推定するために,画像やテキストの周辺の情報,画像・テキストを含む領域の上位領域(Webページの論理構造),Webページへのリンク構造(Webページの被参照構造)を使用した.文脈情報をWebから抽出することで,画像がどのような文脈で使用されているか概覧することが出来,逆に,文脈情報を指定した画像検索が可能になる.さらに,これらの情報に基づき,Webページそのものがどのような観点(アスペクト,aspect)から参照されているかを把握することが出来る.図は,dolphin
というキーワードで検索される画像と,それらの3種の文脈構造を検索し,KWIC (Keyword in Context)形式で表示したものである.複数の
dolphin画像の周辺にどのような単語や画像が配置されているかによって,各画像の利用の文脈が一覧できる.また,リンクの被参照構造とそのリンク元のアンカーを含む文書の論理構造により,Web
ページの様々な(参照の)アスペクトを発見することが出来る.

【Webページ間の汎化/集約関連の発見と活用】

Webページ集合における論理構造の発見を目的として,Webページとそれを簡略化(または,詳細化/特殊化)した内容を持つページのペアを発見する手法を開発した.さらに,あるWebページの内容が別のWebページの内容の一部分になっている場合,これらのページの間に存在する集約関連を発見する手法の開発も行った.具体的には,このような意味的関連をWebデータ群から話題構造や特徴ベクトルを自動的に抽出・比較するアルゴリズムを考案した.Web
ページの中の話題構造を抽出するために,Web ページの主題語を語の出現密度分布から求め,また,関連語を語の共起関係から計算するアルゴリズムを開発しシステムの試作を行った.これにより,Web
ページ間の汎化関連や集約関連も発見することが出来た.これにより,Web データ群の概念構造に基づく自動分類,詳細度や話題の包含関係といった新たな絞り込み検索を実現することができ,従来の検索エンジンに無い,新しい検索サービスを提供できる可能性を示した.

【Webの話題構造抽出に基づく情報の統合】

Webとテレビの統合を目的として,Webコンテンツにおける主題語−内容語からなる話題構造をテレビ映像に付帯する字幕情報,および,Web
ページから自動的に抽出するシステムWebTelop の開発を行った.本システムでは,テレビの字幕情報をもとに,リアルタイムに類似の話題構造や互いに内容を補完するような話題構造を有するWebページを検索し,連動呈示を行う(図参照).
字幕データや Web ページからの話題構造抽出にあたっては,語の共起関係と出現頻度に基づく抽出手法を開発した.主題語は,話題の中心的なキーワードであり,他のキーワードとの有向共起関係が高く,かつ,出現頻度の高いキーワードを主題語とした.内容語は,選択された主題語と共起関係の高いキーワードであり,主題語と無向共起関係の高いキーワードを内容語とする方式を採用した.

【Web/Blogコンテンツに基づく地域情報検索システムBlog Map of Experiences(体験ブログマップ)】

Blog の普及により, 地域を実際に体験した個人の情報発信が活発になり,さらには記述された日時が記録されているというBlog
の特性によって,日常的スケールでの時空間における人間の活動情報が容易に得られるようになった.人間の行動は時間的・空間的要因によって規定されているという点に着目し,特定の場所について書かれた個々のテキストから時間・空間・行為・対象属性間の相関ルールマイニングを用いて人々の体験を抽出する手法を開発した.この手法に基づき,ユーザがそれらの属性を指定することで,
抽出した体験を柔軟に検索・要約することのできるシステム Blog Map of Experiences (体験ブログマップ)の実装を行った.

■ユビキタス・コンテンツ環境の研究■

【映像解析による全方位映像のメタデータ自動生成】

360度の視野角を持つ全方位カメラを用いて記録する映像を全方位映像と呼ぶ.全方位映像には,複数の被写体が同時に映されるという特徴があり,従来のカメラによって特定の被写体を捕らえた映像とは大きく異なっているため,被写体を検索,再生するための新しいインデックシングならびにアノテーションの手法が必要とされる.本研究では,全方位映像と従来の映像データの相違に注目し,全方位映像におけるフレームおよびショット等の基本ユニットを定義し,さらにビデオ代数を用いてこれらの基本ユニットを取得するための演算を定義し,概念モデルを確立させた.この概念モデルに基づき,全方位映像データの構成,検索,再生などの機能を実現した.

■データベースの設計理論の研究■

関係データベース(リレーショナルデータベース)は1970年代にそのアイデアが提起され, その後の活発な研究開発活動の後,1980年代に実用化の域に達し,現在ではイントラネットなどの上で
組織の情報システムを構築するための基盤的なソフトウエア技術として欠くべからざる存在になっている. 関係データベースの設計理論は,主に70年代に体系化されたが,研究室でも多値従属性理論や従属性が
保証されるデータベース設計論などで成果をあげた.関係データベースの設計理論研究の中で種々の概念や 設計アルゴリズムが提案されたが,これらの成果は,単に,関係データベースのみならず,
その後のデータベース技術であるオブジェクト指向データベースやハイパーメディアデータベースの 設計を考える上でも理論的・概念的な基盤を与えるものとなっている.研究室でも,
オブジェクト指向データベースやハイパーメディアの設計に関して,経路存在従属性という概念を提唱し, 理論的研究を試みている.また,データベースの設計理論の啓蒙とこの分野の電子教科書の作成を
目的にして,インターネット上で成長する電子教科書を開発中である.

【履歴データベースモデルの理論研究】

データベースの中で,時間をどのように扱うかという課題は本質的なもので,20年来の研究テーマと なっている.特に,時間概念を取り入れたデータベースモデルをどのように構築するかや,
履歴情報をもつデータベースの検索言語をどのように設計するかなどが主要な研究課題と なってきている.研究室では,このテーマに関しては,1980年代に,米国南カリフォルニア大学の
S.Ginsburg教授との共同研究をかわきりに,履歴情報を持つデータベースのためのデータモデルの構築や, 履歴データベースに対する検索言語の表現能力に関する理論的研究で成果をあげている.

【ハイパーメディアデータベースシステムの研究】

 分散ネットワーク上で関連する情報をハイパーリンクで結び,ナビゲーションと呼ばれる操作で 関連情報を芋蔓式に検索するハイパーメディア技術は,近年のインターネットとWorld
Wide Webの 浸透により,現在の情報検索の分野でも中心的な技術となっている.ハイパーメディアは,地球規模で 分散するテキスト,画像,音声などのマルチメディア情報を検索する有効な方式であるが,その大きな課題は,
関連する情報を結ぶハイパーリンクの設定や変更作業をどのようにして効率化するかである.研究室では, この問題に対して,Navigation
By Query Pairs(検索質問対によるナビゲーション)という新しいアイデアを 考案した.これは,ハイパーリンクの端点となる場所を検索質問によって指定するというもので,これによって,
人手による静的なハイパーリンク設定作業や追加されたデータに対するハイパーリンクの変更作業を大幅に 軽減できる.科学技術庁の科学技術振興調整費によるプロジェクト「創造的研究開発支援のための自己組織型
情報ベースシステムの構築に関する研究」(1991〜1995年度)に参加することにより,この成果をさらに発展させ, World Wide
Web上で検索質問対によるナビゲーションが可能となるようなシステムを稼働させるとともに, 個人の視点によって異なるハイパーリンクが動的に設定されるような機構の開発に成功している.

【オブジェクト指向データベース管理システムの研究】

データとプログラムをオブジェクトという形で一体化・抽象化し,メッセージ送信で計算を行う, いわゆる,オブジェクト指向プログラミング言語が1980年代に登場した.この影響を受けた形で,
オブジェクト指向データベース管理システムのアイデアが80年代半ばに登場し,その後,世界規模で 活発な研究開発が行われ,現在,実用段階のソフトウエアも登場している.研究室でも,
オブジェクト指向データベース管理システムの研究に早くから取り組み,さまざまな成果をあげている. 特に,オブジェクト指向データベースが,多くの利点を有する反面,クラス階層によってデータベース構造が
一律に規定されてしまい各利用者の自由度が制限されるという問題に早くから着目し,これを, オブジェクト指向データベースのビュー (View)という枠組みを提供することで解決する方式を発表し,
その後のこの分野の研究に大きな影響を与えている.また,オブジェクト指向データベース管理システムに 関する調査研究・応用システム開発・次世代型システム開発等を目的とした研究コンソシアムである
Obaseプロジェクト (1990〜1993年度, (財) 千里国際情報事業財団) を結成し研究開発活動を行うとともに, 従来のクラスベースのシステムではなく,より柔軟性の高い,インスタンス指向型のオブジェクトデータベース
管理システムを設計開発している.

【動画像データベースに関する研究】

デジタル化された動画像データの蓄積・検索・配送を効率的に行うデータベースシステムの開発のためには, 動画像情報の組織化 (動画像データの分類や内容記述)
と検索 (曖昧検索や感性検索等) を効果的に行える方式の 研究開発が重要である.動画像データの内容記述を行うためには,内容記述の対象となる断片を指定し
属性付けを行う必要があるが,各断片データに付された属性情報を互いに共有できる仕組みがあると望ましい. このために研究室では,動画像データの時区間の包含関係にもとづいて属性情報を共有できるデータモデルと
データベースシステムOVIDを開発している.また,最近では,動画像データの内容記述をWorld Wide Web上で 公開された環境で行うシステムの研究開発にも着手している.一方,動画像データの分類をコンテンツ自身によって
行うために,映像のDCT (離散コサイン変換) 値と自己組織化マップ生成機構を利用したシステムの研究開発も 行っている.この研究も,科学技術庁の科学技術振興調整費によるプロジェクト「創造的研究開発支援のための
自己組織型情報ベースシステムの構築に関する研究」 (1991〜1995年度) の一環として行ったもので, その後も継続して研究を行っている.

【デジタル映像通信と分散発展型データベースの研究】

1996年度より,通信・放送機構「次世代デジタル映像通信の研究開発」 (研究総括責任者) , および,文部省科学研究費重点領域研究「分散発展型データベースシステム技術の研究」
(研究代表者) の 2つの研究プロジェクトが発足し,主に,次のような研究を行っている.

「次世代デジタル映像通信の研究開発」
  1. 映像通信ネットワークにおけるサーバーの最適配置の在り方に関する研究
  2. リアルタイム映像通信を実現する通信プロトコールの研究
  3. 衛星通信を利用した映像データ伝送技術の研究
「分散発展型データベースシステム技術の研究」
  1. 情報構造を段階的・自律的に組織化する機能の研究
  2. 移動携帯型情報機器のためのモーバイル型データベースの研究
  3. ネットワーク上で自律的に情報収集等を行うエージェント型データベースの研究

[II.今後の展望]

 データベースシステムの研究は,1970年代以降に理論的基盤やシステム構築技術や方法論などが 急速に確立されてきた分野であり,この意味では情報工学の中でも未だ若い学問分野である.
情報技術の進展にともない,演繹推論技術,オブジェクト指向技術,ハイパーメディア, インターネットやイントラネット,マルチメディアという新しい時代的要請を受けながら,
情報共有のための基盤的ソフトウエアというスタンスで発展しつつある学問分野である. 現在のデータベースの教科書レベルで取り上げられている基本的な概念や枠組みの主なものは80年代初頭に
ほぼ体系化されたものであるが,昨今の,マルチメディアや世界規模のインターネットの発展にともない, このようなデータベースの枠組みや基本的なパラダイムに今変化が起こりつつある.21世紀のグローバルな
ネットワーク時代に対処できる,新しいデータベースパラダイムを求めて,今後も研究を続けていく必要が あるものと考えられる.

Social Widgets powered by AB-WebLog.com.