研究内容 | 相澤研究室

研究概要

本研究室では、「人間の知的活動を支援する言語処理技術」に焦点をあてて、言語テキストを中心とするコンテンツとメディアに関する研究に取り組んでいます。深層学習を含む機械学習、統計モデルと分析、アノテーションとコーパス分析などの手法を基盤として、以下の分野を中心にテーマを設定しています。

情報をつなげる：情報の同定と情報推薦
人工知能による言語理解：コンピュータによるテキストの言語解析と知識獲得
人の言語活動のモデル化：テキストを介したオンラインコミュニケーション

本研究室では、計算機によるテキスト・言語処理の基盤技術を研究するとともに、以下の研究プロジェクトに取り組んでいます。

研究プロジェクト

言語を介した人間とコンピュータの共通理解基盤の構築 (研究紹介)

人間とコンピュータが自然言語を使ってコミュニケーションをとるためには、与えられたテキストに対する解釈を共有する必要があります。
本研究では、対話システムや言語の基盤化（grounding）の課題に取り組みます。

言語理解タスクデザイン (研究紹介)

深層学習を前提とする今日の言語理解システムでは、システム設計の中心になるのは、データ収集や評価基準を含めた言語理解タスクのデザインです。そこで、読解タスクや対話タスクの分析や設計を通して、言語理解に求められるスキルを測定したり、訓練に必要となる事例を収集したりする手法を研究します。

文書執筆を支援する言語インタフェース　 (研究紹介)

本プロジェクトでは、ユーザが読み書きするテキストの任意の箇所に、意味的に類似する他のテキストを対応づけて用例として推薦するための意味インデクシング法の研究を行っています。また、言い換えや誤り訂正、文生成のためのテンプレート抽出などの課題にも取り組み、非母語話者の英語論文執筆を支援する実用的なアプリケーションの開発を目指します。

わかりやすい情報提示 (研究紹介)

大量の文書の中から有用な情報を見つけることは容易なことではありません。本研究では、素早くわかりやすく文書の内容を伝えるための自然言語処理手法に焦点をあてます。具体的には、トピックや文脈を考慮した文圧縮、知識データベースを活用した質問文自動生成などの研究に取り組みます。

作業効率アップのためのAI技術 (Research topics)

電子端末上でのユーザの業務を効率化するための様々なAI技術に関する研究開発を行います。たとえば、Intelligent Process Automation (IPA)、データ連携、自然言語インタフェースなどのテーマを含みます。

学術文献の論理的・意味的構造の解析による知識の獲得と利用 (研究紹介)

情報技術の発達によって、膨大な量の言語テキストを計算機で扱うことが可能になりました。しかし、必要な情報が、必要とするそのままの形でテキスト中に書かれているとは限りません。テキスト中に埋め込まれた知識は、それを読む人間の理解を介して、はじめて知識として利用可能な形になります。このように知識を変換したり組み合わせたりして活用する人間の知能の本質的な働きを捉えらることは、人工知能の大きなチャレンジとなっています。本プロジェクトでは、汎化や統合、推論などの操作により生み出される広がりを持つ知識空間の探索という、より本質的な課題に挑戦するため、計算機による言語解析を用いた知識の獲得、および、獲得した知識の活用に関する研究を進めています。

数学知識の検索と理解支援 (研究紹介)

数式は、科学・教育のさまざまな場面で使われる数学の記述法で、多くの科学分野で重要な役割を果たします。しかし数式は非言語的な表現であることから、自然言語処理の研究対象として考慮されることは、これまでほとんどありませんでした。これに対して本研究では、数式を画像や記号列の一種ではなく、独自の構造と解釈を持つ文書の構成要素として捉え、数式とその説明文を対応付けて解析することで、数式の意味を扱うための言語処理アプローチについて研究しています。また、これらの要素技術を用いた数学的知識の検索や理解支援システムの開発や評価を通して、数学的知識の活用基盤の実現に取り組んでいます。

「読み方の科学」～視線情報に基づくテキストの読み方の分析と活用 (研究紹介)

電子端末の画面を介した言語活動は、我々の日常生活になくてはならないものとなっています。本プロジェクトでは、画面上で人がテキストを「読む」という行為に焦点をあてて、その計測・モデル化・支援についての研究を行っています。具体的には、画面上でテキストを「読む」行為を、(1)対象テキストの意味構造、(2)レイアウトや文字飾りなどの画像特徴、(3)読み手の視覚・言語認知プロセス、の三者インタラクションと捉えて、その計測およびモデル化手法を研究するとともに、読みやすい形でテキストを提示するための手法の開発にも取り組んでいます。