[:ja]研究内容[:en]Research[:]

[:ja]

研究概要

本研究室では、「人間の知的活動を支援する言語処理技術」に焦点をあてて、言語テキストを中心とするコンテンツとメディアに関する研究に取り組んでいます。深層学習を含む機械学習、統計モデルと分析、アノテーションとコーパス分析などの手法を基盤として、以下の分野を中心にテーマを設定しています。

  • 情報をつなげる: 情報の同定と情報推薦
  • 人工知能による言語理解: コンピュータによるテキストの言語解析と知識獲得
  • 人の言語活動のモデル化: テキストを介したオンラインコミュニケーション

本研究室では、計算機によるテキスト・言語処理の基盤技術を研究するとともに、以下の研究プロジェクトに取り組んでいます。

研究プロジェクト

言語を介した人間とコンピュータの共通理解基盤の構築 (研究紹介)

人間とコンピュータが自然言語を使ってコミュニケーションをとるためには、与えられたテキストに対する解釈を共有する必要があります。
本研究では、対話システムや言語の基盤化(grounding)の課題に取り組みます。


言語理解タスクデザイン (研究紹介)

深層学習を前提とする今日の言語理解システムでは、システム設計の中心になるのは、データ収集や評価基準を含めた言語理解タスクのデザインです。 そこで、読解タスクや対話タスクの分析や設計を通して、言語理解に求められるスキルを測定したり、訓練に必要となる事例を収集したりする手法を研究します。


文書執筆を支援する言語インタフェース  (研究紹介)

本プロジェクトでは、ユーザが読み書きするテキストの任意の箇所に、意味的に類似する他のテキストを対応づけて用例として推薦するための意味インデクシング法の研究を行っています。また、言い換えや誤り訂正、文生成のためのテンプレート抽出などの課題にも取り組み、非母語話者の英語論文執筆を支援する実用的なアプリケーションの開発を目指します。


わかりやすい情報提示 (研究紹介)

大量の文書の中から有用な情報を見つけることは容易なことではありません。本研究では、素早くわかりやすく文書の内容を伝えるための自然言語処理手法に焦点をあてます。具体的には、トピックや文脈を考慮した文圧縮、知識データベースを活用した質問文自動生成などの研究に取り組みます。


作業効率アップのためのAI技術 (Research topics)

電子端末上でのユーザの業務を効率化するための様々なAI技術に関する研究開発を行います。たとえば、Intelligent Process Automation (IPA)、データ連携、自然言語インタフェースなどのテーマを含みます。


学術文献の論理的・意味的構造の解析による知識の獲得と利用 (研究紹介)

情報技術の発達によって、膨大な量の言語テキストを計算機で扱うことが可能になりました。しかし、必要な情報が、必要とするそのままの形でテキスト中に書かれているとは限りません。テキスト中に埋め込まれた知識は、それを読む人間の理解を介して、はじめて知識として利用可能な形になります。このように知識を変換したり組み合わせたりして活用する人間の知能の本質的な働きを捉えらることは、人工知能の大きなチャレンジとなっています。本プロジェクトでは、汎化や統合、推論などの操作により生み出される広がりを持つ知識空間の探索という、より本質的な課題に挑戦するため、計算機による言語解析を用いた知識の獲得、および、獲得した知識の活用に関する研究を進めています。scilogos


数学知識の検索と理解支援 (研究紹介)

数式は、科学・教育のさまざまな場面で使われる数学の記述法で、多くの科学分野で重要な役割を果たします。しかし数式は非言語的な表現であることから、自然言語処理の研究対象として考慮されることは、これまでほとんどありませんでした。これに対して本研究では、数式を画像や記号列の一種ではなく、独自の構造と解釈を持つ文書の構成要素として捉え、数式とその説明文を対応付けて解析することで、数式の意味を扱うための言語処理アプローチについて研究しています。また、これらの要素技術を用いた数学的知識の検索や理解支援システムの開発や評価を通して、数学的知識の活用基盤の実現に取り組んでいます。mcat-header


「読み方の科学」~視線情報に基づくテキストの読み方の分析と活用 (研究紹介)

電子端末の画面を介した言語活動は、我々の日常生活になくてはならないものとなっています。本プロジェクトでは、画面上で人がテキストを「読む」という行為に焦点をあてて、その計測・モデル化・支援についての研究を行っています。具体的には、画面上でテキストを「読む」行為を、(1)対象テキストの意味構造、(2)レイアウトや文字飾りなどの画像特徴、(3)読み手の視覚・言語認知プロセス、の三者インタラクションと捉えて、その計測およびモデル化手法を研究するとともに、読みやすい形でテキストを提示するための手法の開発にも取り組んでいます。gazeNLP-overview


研究室メンバーからの研究紹介

[:en]Our laboratory’s research is focused on natural language technologies to assist human intelligent activities. Our major challenges include the following subjects in text and media studies that are based on machine learning including deep learning, statistical modeling and analysis, or annotation and corpus analysis.

  • Information Linkage: Entity identification and information recommendation
  • Machine reading comprehension: Computer understanding of natural languages; Semantic analysis and knowledge extraction
  • Human language activities: Measurement and modeling of human language activities through text

We are involved in the following research projects while studying the fundamental technology of text and language processing by a computer.

Research projects

Establishing a common understanding between humans and computers through natural language texts (Research topics)

For humans and computers to communicate via natural language text, it is necessary that the understanding (interpretation) of the given texts be shared.
In this research, we tackle the issues of dialogue system and language grounding.


Design of language understanding tasks (Research topics)

What is emphasized in system design in today’s language comprehensions systems underpinning deep learning is the design of language comprehension tasks including data collection and evaluation criteria. We study methods to measure skills that are demanded for language understanding and to collect cases required for training through the analysis and design of machine reading comprehension and natural language communication.


Language interface for scientific writing assistance (Research topics)

We are studying the semantic indexing method for associating other texts semantically similar and recommending them as an example to the arbitrary sites of the text read and written by a user in this project. Moreover, our subjects include paraphrasing, error correction, and template extraction for sentence generation, with the aim of developing a practical application that assists paper writing in English for non-native speakers.


Deep NLP for easy information access (Research topics)

It is not easy to find useful information in huge volume of documents. In this research, we focus on deep natural language processing methods for efficient information access. The research topics include NLP technologies such as context/topic-aware sentence compression, automatic question generation with a knowledge base.


AI Technologies to Improve Working Efficiency (Research topics)

This research aiming at developing AI technologies that help to improve efficiency of online work. The research topics include Intelligent Process Automation (IPA), data federation, natural language interface.


Logical and semantic structure analysis of research papers for scientific knowledge acquisition (Research topics)

Development of information technology has enabled us to process a huge quantity of language texts using a computer. However, fundamental information is not necessarily expressed in a text in a favorable fashion. Knowledge embedded into a text only becomes available through the understanding of its reader. Consequently, it is a great challenge for artificial intelligence to comprehend the fundamental function of human intelligence in which knowledge is transformed, combined, and used. We are conducting research on knowledge acquisition using language analysis by a computer and application of knowledge acquired, to undertake a more fundamental task: search for a widespread knowledge space generated by operations such as generalization, integration, and inference.scilogos


Retrieval and understanding of mathematical knowledge (Research topics)

A formula is mathematical notation used in diverse scenarios of science and education, and plays an important role in various scientific disciplines. However, because a formula is a nonverbal expression, it has been examined only slightly to date as a research subject in natural language processing. We regard a formula not as a kind of image or symbol string but as a component of a document carrying a special structure and interpretation, and analyze a formula associating its description to study of a language processing approach for handling the semantics of a formula. Our research goal is the implementation of an application base of mathematical knowledge through mathematical knowledge search and development and evaluation of an understanding support system using these component technologies.mcat-header


“Science of reading” — gaze-based analysis and application of reading process (Research topics)

Language activities through the screen of an electronic terminal are indispensable to our everyday life. We specifically investigate a human act of “reading” on a screen and performing research on its measurement, modeling, and support in this project. Specifically, we regard an act of “reading” a text on a screen as the interaction of the following three factors: (1) semantic structure of an object text; (2) image features, such as a layout and character decoration; and (3) a reader’s visual sense and language cognitive process. Our goal is to develop a method for presenting a text in a readable form, as well as studying the measurement and modeling method.gazeNLP-overview


Introduction of research topics by laboratory members

[:]