AfriQA vs MasakhaNER 2.0

A verified, side-by-side comparison. Both records are status-checked by Findra, so you are comparing what each actually offers today, not a stale listing.

AfriQA MasakhaNER 2.0

Tags

nlp, african-languages, question-answering, cross-lingual, open-retrieval

nlp, ner, named-entity-recognition, african-languages, token-classification

Links

Website Docs GitHub

Summary

Cross-lingual open-retrieval question-answering dataset with human-translated QA pairs for 10 African languages (incl. Hausa, Igbo, Yoruba), totaling 12,159 examples across train/validation/test splits. From the Masakhane initiative.

Largest high-quality named-entity-recognition corpus for 20 African languages (incl. Nigerian Pidgin, Hausa, Igbo, Yoruba) with PER/ORG/LOC/DATE tags over news-domain text, totaling ~152,786 rows. Built by the Masakhane community.

Full details: AfriQA Full details: MasakhaNER 2.0