AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages vs AfriQA: Cross-lingual Open-Retrieval Question Answering for African Languages

A verified, side-by-side comparison. Both records are status-checked by Findra, so you are comparing what each actually offers today, not a stale listing.

AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages AfriQA: Cross-lingual Open-Retrieval Question Answering for African Languages

Tags

african-languages, hate-speech, nlp-benchmark, content-moderation

african-languages, question-answering, cross-lingual, nlp-benchmark

Links

Website

Summary

AfriHate is a multilingual benchmark of hate speech and abusive language datasets covering 15 African languages, annotated by native speakers. The paper contributes classification baselines and hate speech and offensive language lexicons, and analyses why keyword-based moderation fails for low-resource African languages. It was released on arXiv in January 2025.

AfriQA is the first cross-lingual open-retrieval question answering benchmark for African languages, with more than 12,000 XOR-QA examples across 10 African languages. The paper shows that current automatic translation and multilingual retrieval methods perform poorly for these languages, where in-language digital content is scarce.

Full details: AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages Full details: AfriQA: Cross-lingual Open-Retrieval Question Answering for African Languages