2 dataset results for Word Embeddings AND Indonesian

WikiANN, also known as PAN-X, is a multilingual named entity recognition dataset. It consists of Wikipedia articles that have been annotated with LOC (location), PER (person), and ORG (organization) tags in the IOB2 format¹². This dataset serves as a valuable resource for training and evaluating named entity recognition models across various languages.

60 PAPERS • 3 BENCHMARKS

IndoSum

The IndoSum dataset is a benchmark dataset for Indonesian text summarization. The dataset consists of news articles and manually constructed summaries.

9 PAPERS • NO BENCHMARKS YET

Datasets

2 dataset results for Word Embeddings AND Indonesian