Association loi 1901

Sègbé Corpus

Préserver et transmettre les langues côtières d'Afrique de l'Ouest

Sègbé enregistre la voix de locuteurs natifs en Fon, Adja, Yoruba, Mandjak, Éwé, Mina et d'autres langues parlées en Afrique de l'Ouest et dans leurs diasporas.

Pourquoi Sègbé ?

Beaucoup de langues d'Afrique de l'Ouest sont parlées par des millions de personnes mais ne s'écrivent presque pas, et restent invisibles dans les outils numériques. Sègbé se construit avec les locuteurs natifs, pas à leur place.

  • Patrimoine

    Des langues parlées par des millions de personnes, mais quasi absentes des outils numériques.

  • Transmission

    Rendre accessible aux jeunes générations diasporiques la langue de leurs aînés.

  • Communauté

    Un corpus construit par et pour les locuteurs natifs, qui décident eux-mêmes de ce que devient leur voix.

Treize langues documentées

Voici les langues couvertes par les phases 1 à 3. Elles traversent les frontières, alors plutôt que des drapeaux, nous indiquons la famille linguistique et la zone géographique.

  • Fon

    Phase 1
    Famille :
    Gbe
    Zone :
    Bénin, Togo
    Locuteurs :
    ~4,1 M
  • Mina (Gen)

    Phase 1
    Famille :
    Gbe
    Zone :
    Sud-Togo, Sud-Bénin
    Locuteurs :
    ~400 K
  • Éwé

    Phase 1
    Famille :
    Gbe
    Zone :
    Togo, Ghana
    Locuteurs :
    ~7 M
  • Adja

    Phase 1
    Famille :
    Gbe
    Zone :
    Bénin, Togo
    Locuteurs :
    ~1,2 M
  • Yoruba

    Phase 1
    Famille :
    Yoruboïde
    Zone :
    Nigéria, Bénin, Togo
    Locuteurs :
    ~46 M
  • Mahi

    Phase 1bis
    Famille :
    Gbe
    Zone :
    Centre-Bénin
    Locuteurs :
    ~300 K
  • Mandjak

    Phase 1bis
    Famille :
    Atlantique (Bak)
    Zone :
    Guinée-Bissau, Sénégal, Gambie
    Locuteurs :
    ~230 K
  • Wolof

    Phase 2
    Famille :
    Atlantique
    Zone :
    Sénégal, Gambie, Mauritanie
    Locuteurs :
    ~12 M
  • Mandinka

    Phase 2
    Famille :
    Mandé
    Zone :
    Sénégal, Gambie, Guinée-Bissau, Mali
    Locuteurs :
    ~1,3 M
  • Attié

    Phase 3
    Famille :
    Kwa
    Zone :
    Sud-Est Côte d'Ivoire
    Locuteurs :
    ~600 K
  • Baoulé

    Phase 3
    Famille :
    Akan
    Zone :
    Centre Côte d'Ivoire
    Locuteurs :
    ~2,1 M
  • Dioula

    Phase 3
    Famille :
    Mandé
    Zone :
    Côte d'Ivoire, Burkina Faso, Mali
    Locuteurs :
    ~9 M (L1+L2)
  • Bété

    Phase 3
    Famille :
    Kru
    Zone :
    Centre-Ouest Côte d'Ivoire
    Locuteurs :
    ~900 K

Un déploiement progressif

Cinq phases pour construire le corpus. On démarre avec les langues que nous parlons dans la diaspora, puis on étend pays par pays.

  1. An 1–2

    Golfe du Bénin

    Fon, Mina, Éwé, Adja et Yoruba : le premier socle du corpus, à partir de la diaspora francophone.

  2. An 1

    Patrimoine en danger

    Mahi et Mandjak, deux langues encore peu documentées que nous traitons en priorité.

  3. An 2–3

    Sénégambie

    Wolof et Mandinka : élargissement aux grandes langues de l'Afrique atlantique.

  4. An 3–4

    Côte d'Ivoire

    Attié, Baoulé, Dioula et Bété, pour couvrir d'autres familles linguistiques (Kwa, Akan, Mandé, Kru).

  5. An 4+

    Expansions

    Nouvelles langues, nouveaux registres, partenariats académiques plus larges.

Devenez contributrice ou contributeur

Le corpus avance enregistrement par enregistrement. Si vous parlez l'une des langues du projet, votre voix a sa place.

  1. Téléchargez l'application

    Bientôt disponible sur l'App Store et Google Play. Lancement prévu en juin 2026.

  2. Choisissez votre langue

    Fon, Adja, Yoruba, Wolof, Baoulé… sélectionnez celle dans laquelle vous souhaitez contribuer.

  3. Enregistrez votre voix

    Lisez les prompts proposés ou enregistrez vos propres expressions, à votre rythme.