2 dataset results for Multimodal Abstractive Text Summarization AND Texts

The How2 dataset contains 13,500 videos, or 300 hours of speech, and is split into 185,187 training, 2022 development (dev), and 2361 test utterances. It has subtitles in English and crowdsourced Portuguese translations.

76 PAPERS • 2 BENCHMARKS

FINDSum (Financial Report Document Summarization)

FINDSum is a large-scale dataset for long text and multi-table summarization. It is built on 21,125 annual reports from 3,794 companies and has two subsets for summarizing each company’s results of operations and liquidity.

2 PAPERS • NO BENCHMARKS YET

Datasets

2 dataset results for Multimodal Abstractive Text Summarization AND Texts