Association loi 1901
Sègbé Corpus
Préserver et transmettre les langues côtières d'Afrique de l'Ouest
Sègbé enregistre la voix de locuteurs natifs en Fon, Adja, Yoruba, Mandjak, Éwé, Mina et d'autres langues parlées en Afrique de l'Ouest et dans leurs diasporas.
Pourquoi Sègbé ?
Beaucoup de langues d'Afrique de l'Ouest sont parlées par des millions de personnes mais ne s'écrivent presque pas, et restent invisibles dans les outils numériques. Sègbé se construit avec les locuteurs natifs, pas à leur place.
Patrimoine
Des langues parlées par des millions de personnes, mais quasi absentes des outils numériques.
Transmission
Rendre accessible aux jeunes générations diasporiques la langue de leurs aînés.
Communauté
Un corpus construit par et pour les locuteurs natifs, qui décident eux-mêmes de ce que devient leur voix.
Treize langues documentées
Voici les langues couvertes par les phases 1 à 3. Elles traversent les frontières, alors plutôt que des drapeaux, nous indiquons la famille linguistique et la zone géographique.
- Phase 1
Fon
- Famille :
- Gbe
- Zone :
- Bénin, Togo
- Locuteurs :
- ~4,1 M
- Phase 1
Mina (Gen)
- Famille :
- Gbe
- Zone :
- Sud-Togo, Sud-Bénin
- Locuteurs :
- ~400 K
- Phase 1
Éwé
- Famille :
- Gbe
- Zone :
- Togo, Ghana
- Locuteurs :
- ~7 M
- Phase 1
Adja
- Famille :
- Gbe
- Zone :
- Bénin, Togo
- Locuteurs :
- ~1,2 M
- Phase 1
Yoruba
- Famille :
- Yoruboïde
- Zone :
- Nigéria, Bénin, Togo
- Locuteurs :
- ~46 M
- Phase 1bis
Mahi
- Famille :
- Gbe
- Zone :
- Centre-Bénin
- Locuteurs :
- ~300 K
- Phase 1bis
Mandjak
- Famille :
- Atlantique (Bak)
- Zone :
- Guinée-Bissau, Sénégal, Gambie
- Locuteurs :
- ~230 K
- Phase 2
Wolof
- Famille :
- Atlantique
- Zone :
- Sénégal, Gambie, Mauritanie
- Locuteurs :
- ~12 M
- Phase 2
Mandinka
- Famille :
- Mandé
- Zone :
- Sénégal, Gambie, Guinée-Bissau, Mali
- Locuteurs :
- ~1,3 M
- Phase 3
Attié
- Famille :
- Kwa
- Zone :
- Sud-Est Côte d'Ivoire
- Locuteurs :
- ~600 K
- Phase 3
Baoulé
- Famille :
- Akan
- Zone :
- Centre Côte d'Ivoire
- Locuteurs :
- ~2,1 M
- Phase 3
Dioula
- Famille :
- Mandé
- Zone :
- Côte d'Ivoire, Burkina Faso, Mali
- Locuteurs :
- ~9 M (L1+L2)
- Phase 3
Bété
- Famille :
- Kru
- Zone :
- Centre-Ouest Côte d'Ivoire
- Locuteurs :
- ~900 K
Un déploiement progressif
Cinq phases pour construire le corpus. On démarre avec les langues que nous parlons dans la diaspora, puis on étend pays par pays.
An 1–2
Golfe du Bénin
Fon, Mina, Éwé, Adja et Yoruba : le premier socle du corpus, à partir de la diaspora francophone.
An 1
Patrimoine en danger
Mahi et Mandjak, deux langues encore peu documentées que nous traitons en priorité.
An 2–3
Sénégambie
Wolof et Mandinka : élargissement aux grandes langues de l'Afrique atlantique.
An 3–4
Côte d'Ivoire
Attié, Baoulé, Dioula et Bété, pour couvrir d'autres familles linguistiques (Kwa, Akan, Mandé, Kru).
An 4+
Expansions
Nouvelles langues, nouveaux registres, partenariats académiques plus larges.
Devenez contributrice ou contributeur
Le corpus avance enregistrement par enregistrement. Si vous parlez l'une des langues du projet, votre voix a sa place.
Téléchargez l'application
Bientôt disponible sur l'App Store et Google Play. Lancement prévu en juin 2026.
Choisissez votre langue
Fon, Adja, Yoruba, Wolof, Baoulé… sélectionnez celle dans laquelle vous souhaitez contribuer.
Enregistrez votre voix
Lisez les prompts proposés ou enregistrez vos propres expressions, à votre rythme.