文書執筆を支援する言語インタフェース技術

ユーザが読み書きするテキストの任意の箇所に、意味的に類似する他のテキストを対応づけて用例として推薦するための意味インデクシング法の研究を進めます。また、言い換えや誤り訂正、文生成のためのテンプレート抽出などの課題にも取り組み、情報学分野を適用対象として、非母語話者の英語論文執筆を支援する実用的なアプリケーションの開発を目指します。


定型表現の活用を支援する言語処理基盤技術の研究

Using Formulaic Expressions in Writing Assistance Systems

Using Formulaic Expressions in Writing Assistance Systems


英語による文書作成を支援するための定型表現集が数多く出版されていますが、その大半は電子化されておらず、電子化されていたとしても執筆途中に必ずしも気軽に利用できるものではありません。そこで本研究では、ユーザのあいまいな入力に基づき適切な定型表現を提示する手法を開発します。具体的には、大量のドメイン・コーパスを計算機で解析することで、ドメインに特化した言い回しや談話構造などを含む豊富な文脈情報を自動獲得して、定型表現の予測や検索精度の向上を目指します。特に学術論文に焦点をあてて、英語の非母語話者による論文執筆支援技術の開発に取り組みます。(Iwatsuki et al.: to be presented at COLING-2018)


分散意味表現を用いた類似文検索

Inclusion criterion and crosslingually constrained word representations.

Inclusion criterion and crosslingually constrained word representations.


Inclusion criterion」と呼ぶ新しい基準に基づき句の意味表現を学習するニューラルネットワークを提案し、言語横断的な類似文検索機能を実現しました。また提案手法を論文から抽出した和英対訳文コーパスに適用して、英作文支援のデモツール CroVeWAを試作しました。(Hubert et al.: NAACL HLT 2015 demo [1], ICLR 2015 short [2])