公開リソース

コーパス

データセット

  • 2WikiMultiHopQA: A Multi-hop QA Dataset for Comprehensive Evaluation of Reasoning Steps
  • FECFeval: 定型表現評価用データセット
  • OneCommon: A Natural Language Corpus of Common Grounding under Continuous and Partially-Observable Context
  • Dynamic-OneCommon: A Natural Language Corpus of Maintaining Common Ground in Dynamic Environments
  • NTCIR-Math: 数式検索の評価タスク
  • NTCIR-math-annotation: 数式説明文のアノテーション
  • Q-Scisumm: A Evaluation Dataset for Query-focused Scientific Paper Summarization
  • VQAG: Synthetic datasets for Machine Reading Comprehension

ツール

  • PDFNLT 1.0: 自然言語処理のためのPDF解析ツール(学術論文用)
  • Planetext: タグ分類に基づく XML 文書の平文テキスト化
  • FixFix: 人の「読み方」の分析のための視線データ編集ツール
  • mapPdfToXml: PDFレイアウトと XMLの対応づけツール

デモ

  • TermLink: 専門用語抽出、ウィキペディア記事との対応付け、関連論文推薦
  • SideNoter: 学術論文の閲覧システム (by 阿辺川武)
  • i-linkage: 高速書誌同定エンジン

その他

  • Some High-Level Thoughts on How to Conduct Research: 本研究室に所属していた宇田川 拓真さんによる研究の進め方に関するアドバイスをまとめたスライド
  • EVAL-VL-GLUE: 視覚言語モデルを言語モダリティにおいて評価するリポジトリ。視覚言語モデル研究のための簡潔な構成(事前学習済みの画像抽出器とtransformerモデル)を含む。