Last modified: "2007/04/14 13:15:39 (JST)"
Mori       

文部科学省 科学研究費補助金
特定領域研究「情報爆発時代に向けた新しいIT基盤技術の研究」
情報爆発時代に対応する質問応答基盤技術に関する研究


研究課題

文部科学省 科学研究費補助金 特定領域研究
456「情報爆発時代に向けた新しいIT基盤技術の研究」
A01「情報爆発時代における情報管理・融合・基盤」

情報爆発時代に対応する質問応答基盤技術に関する研究

Study on fundamental technologies of question-answering
for the era of information explosion

研究期間

平成18年度,平成19年度〜平成20年度

研究組織

研究代表者森 辰則 (Tatsunori Mori)
mori at forest.eis.ynu.ac.jp
http://www.forest.eis.ynu.ac.jp/~mori/
研究分担者田村直良 (Naoyoshi Tamura)

横浜国立大学 大学院 環境情報研究院 社会環境と情報部門
Division of Social Environment and Information,
Graduate School of Environment and Information Sciences, Yokohama National University

研究の背景と目的

ICT技術の普及に伴い、膨大な量の文書情報が入手可能となったが、一方で利用者が欲する情報に容易に到達可能であるとは言い難い。例えば、検索エンジンにより関連文書の効果的な絞込みが可能になりつつあるが、現在の検索エンジンは文書の順位付けを行うだけであるので、真に必要とする情報を得るためには文書の中身を精査する必要がある。その煩雑さや、候補を絞り込むコツが掴めないなどの理由により、利用者は有用な情報に到達できない場合もある。そのため、情報を得るまでに利用者が読むべき文書を少なく抑え作業効率を向上させる研究が行われている。例えば、文書から不要な部分を削りより短い文書を生成する自動要約や、利用者が入力した質問文に対し知識源となる文書群からその答を見つけ出す質問応答などがある。特に質問応答は、その有効性が認識され情報検索や自然言語処理のコミュニティを中心として、近年、国内外で研究が盛んになっている。これは、例えば、『「情報爆発」の領域代表者は誰ですか。』という質問に対して、『喜連川優』という答を知識源から探すタスクである。

我々は、従前より質問応答に関する研究を進めてきたが、本研究では、情報爆発時代における人に優しい情報アクセスの一手法として質問応答を位置づけ、大量かつ多様な文書を知識源とする質問応答に関する基盤技術を確立する。情報爆発の起こり方は量の側面と多様性の側面があると考えられる。量の側面に対応するためには利用者の欲する情報を過不足なく提供することが重要である。その実現方法として、本研究では、質問応答技術の目指すanswer pinpointing機能を位置づけ、我々が開発してきた質問応答システムを基盤とし、これを洗練することを検討する。多様性の側面は、文書の扱う領域の多様性、言語の多様性などに起因する。領域の多様性については、利用する検索エンジンを随時切り替えることができる我々のシステムの特長に基づき、領域に特有の解析手法を加えることにより、ネットワーク上の文書資源から、利用者が各自のPC上に保持する個別領域の文書まで幅広い分野に対応することを検討する。言語の多様性については、我々のシステムを基盤とした言語横断質問応答の実現手法を検討する。言語横断質問応答とは、質問を記述する言語が、知識源となる文書を記述する言語と異なる状況下での質問応答である。さらに、人に優しいインタフェースという観点から考えた場合、従来の一問一答型の質問応答では、質問の度に利用者は十分な文脈を質問中に明示しなければならないという欠点があった。一方で、人間間での問答においては、例えば、先の質問例に続いて、『その人は何大学の所属ですか。』と質問するように、以前の質問やその回答により既知となった事柄については新しい質問文において参照表現となったり省略されたりする。そこで、このような一連の関連する質問文群を適切に解釈し、対話における質問応答処理を行う仕組みについても検討する。

関連研究に対する本研究の位置づけと学術的な特色・独創的な点

近年、質問応答技術は急速にその精度を向上させつつあるが、これは、評価型ワークショップによる実践的な研究の促進の効果が大きい。英語については、米国NIST主催のTREC QA trackが、日本語については国立情報学研究所主催のNTCIR QACがある。我々が現在も開発を進めている質問応答システムもQACに参加し、評価を行っている。その評価の過程で明らかになった我々の質問応答システムの特長は、最良解探索型アルゴリズムの採用により文書に対する前処理を必要とせず、利用する検索エンジンを切り替えることにより多様な文書を扱うことができる点にある。同システムを基盤とすることにより、情報爆発の量・多様性の両側面に包括的に対応し、さらに、対話環境でも利用可能な質問応答システムを構築する点が本研究の特色であり、独創的な点である。

当該領域の推進に貢献できる点、新たな研究の創造が期待できる点

本研究は、対話環境におけるanswer pinpointing機能と大量かつ多様な文書を知識源として扱う仕組みを考察することにより、当該領域の推進に貢献できると考える。特に、情報検索、コンテンツ管理に関する当該領域内の他研究と密に連携することにより、知識源の多様性が拡大し、答えられる質問の種類・範囲等が拡大することが期待される。

期待される成果

質問応答に関する研究が促進されるとともに、情報爆発時代における人に優しい情報アクセス手法が構築され、利用者が必要とする情報を手軽に入手可能なインタフェースの礎となる。