情報アクセスを支援する DeepNLP技術

今日の検索エンジンは、巨大かつ不均質な文書集合を効率よく検索する手段を提供します。しかし、検索の結果得られる大量の候補の中から有用な情報を見つけることは容易ではなく、文書ランキングの工夫だけでは、この問題に対応することができません。本研究では、インタラクティブな検索の効率化に役立つ自然言語処理手法に焦点をあてます。具体的には、トピックや文脈を考慮した文圧縮、知識データベースを活用した質問文自動生成、意思決定を支援するための議論抽出などの研究に取り組みます。


Text Compression and Summarization

Neural network-based summarization system

Neural network-based summarization system


Text compression and summarization systems aim to produce a shorter version of a source text by preserving the key contents of the original. However, yielding an informative and grammatical compression (summary) is still a challenge. In this project, we tackle this issue by considering two aspects – the word (local) features such as part-of-speech tag of word and sentence (global) features such as readability of a whole sentence. Our experimental results demonstrate that these features coupled with techniques like deep learning and reinforcement learning can lead to compressions (summaries) with better quality (Yang et al: NLDB-2017 [1]; ACL-2018 short, accepted)