コーパス
データセット
- 2WikiMultiHopQA: A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps
- FECFeval: 定型表現評価用データセット
- OneCommon: A Natural Language Corpus of Common Grounding under Continuous and Partially-Observable Context
- Dynamic-OneCommon: A Natural Language Corpus of Maintaining Common Ground in Dynamic Environments
- NTCIR-Math: 数式検索の評価タスク
- NTCIR-math-annotation: 数式説明文のアノテーション
- Q-Scisumm: A Evaluation Dataset for Query-focused Scientific Paper Summarization
- VQAG: Synthetic datasets for Machine Reading Comprehension
ツール
デモ
その他