MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition

Research

NLP benchmark

Docs live

MasakhaNER 2.0 introduces the largest human-annotated named entity recognition dataset for 20 African languages and studies Africa-centric cross-lingual transfer learning. The paper reports that choosing the best transfer language improves zero-shot F1 by an average of 14 points across the 20 languages compared with transferring from English.

Website

Category: Research
Pricing: Free / open
Country: 🌍 Pan-African
Last verified: 5 Jul 2026

Compare MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition

Side-by-side, verified specs against its closest nlp benchmark alternatives.

MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition vs AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition vs AfriQA: Cross-lingual Open-Retrieval Question Answering for African Languages MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition vs AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition vs IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models

Related in Research

IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models

Research

IrokoBench is a human-translated evaluation benchmark covering 17 typologically diverse low-resource African languages across three tasks: natural language inference (AfriXNLI), mathematical reasoning (AfriMGSM) and knowledge-based multiple-choice QA (AfriMMLU). The paper evaluates open and proprietary LLMs and documents a large gap between high-resource languages and African languages, with the best open model reaching about 63 percent of GPT-4o performance. It was published at NAACL 2025.

Docs live

NLP benchmark

Verified Jul 2026Free / open

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages

Research

AfriHate is a multilingual benchmark of hate speech and abusive language datasets covering 15 African languages, annotated by native speakers. The paper contributes classification baselines and hate speech and offensive language lexicons, and analyses why keyword-based moderation fails for low-resource African languages. It was released on arXiv in January 2025.

Docs live

NLP benchmark

Verified Jul 2026Free / open

AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages

Research

AfriSenti is a sentiment analysis benchmark of more than 110,000 tweets in 14 African languages spanning four language families, annotated by native speakers. It underpinned SemEval-2023 Task 12, a shared task that attracted more than 200 participants, and documents data collection, annotation and baseline methods for low-resource languages.

Docs live

NLP benchmark

Verified Jul 2026Free / open

Tags

Compare MasakhaNER 2.0: Africa-centric Transfer Learning for Named Entity Recognition

Related in Research

IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages

AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages