公開リソース

コーパス

データセット

  • 2WikiMultiHopQA: A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps
  • FECFeval: 定型表現評価用データセット
  • OneCommon: A Natural Language Corpus of Common Grounding under Continuous and Partially-Observable Context
  • Dynamic-OneCommon: A Natural Language Corpus of Maintaining Common Ground in Dynamic Environments
  • NTCIR-Math: 数式検索の評価タスク
  • NTCIR-math-annotation: 数式説明文のアノテーション
  • Q-Scisumm: A Evaluation Dataset for Query-focused Scientific Paper Summarization
  • VQAG: Synthetic datasets for Machine Reading Comprehension

ツール

  • PDFNLT 1.0: 自然言語処理のためのPDF解析ツール(学術論文用)
  • Planetext: タグ分類に基づく XML 文書の平文テキスト化
  • FixFix: 人の「読み方」の分析のための視線データ編集ツール
  • mapPdfToXml: PDFレイアウトと XMLの対応づけツール

デモ

  • TermLink: 専門用語抽出、ウィキペディア記事との対応付け、関連論文推薦
  • SideNoter: 学術論文の閲覧システム (by 阿辺川武)
  • i-linkage: 高速書誌同定エンジン

その他