UMR 8135 CNRS - INaLCO

Contrats ANR en cours

NaijaSynCor – A Corpus-Based Macro-Syntactic Study of Naija (Nigerian Pidgin) (01.02.2017-31.07.2020)

PI : Bernard Caron

NaijaSynCor propose une étude exhaustive et approfondie de la structure du naija (Nigerian Pidgin) parlé aujourd'hui au Nigéria. Il a été prouvé par Deuber (2005) que cette langue adoptée par les Nigérians éduqués, s’est développée à Lagos comme une langue autonome, distincte de la variété d’anglais parlée au Nigéria.

Ce projet se propose de déterminer par une étude diachronique, diatopique, diaphasique et diastratique si cela est vrai pour le reste du Nigeria où le naija est parlé par plus 75 millions de locuteurs.

NaijaSynCor est le résultat de la collaboration entre deux éminents experts nigérians du naija (F. Egbokhare & C. Ofulue) et deux unités de recherche qui ont prouvé leur savoir-faire dans l’annotation de corpus dans de précédents programmes : le LLACAN, dans l’étude de corpus de langues peu décrites ; le MoDyCo, dans l’étude de l’interaction de la prosodie et de la syntaxe en Français, et dans le développement de grands treebanks.

En savoir plus...


BULB (BULB - Breaking the Unwritten Language Barrier) (01.03.2015 - 28.02.2018)

PI : Gilles Adda & Sebastian Stücker

Dans un contexte où un nombre croissant de langues se trouvent en danger de disparition et les linguistes ont le plus grand besoin d'outils efficaces pour la documentation des langues, BULB vise à apporter à la documentation des langues non-écrites le soutien des technologies modernes de traitement des langues, en particulier la reconnaissance automatique de la parole (*) et la traduction automatique.

Ce projet ANR/DFG repose sur une forte coopération franco-allemande entre linguistes et informaticiens du ZAS (F. Hamlaoui), le KIT (S. Stücker) et l'Université de Stuttgart (S. Zerbian) du côté allemand, ainsi que le LPP (M. Adda-Decker, A. Rialland), le LLACAN (M. Van de Velde, D. Idiatov), le LIMSI (L. Lamel et F. Yvon), le LIG (L. Besacier) et le IMMI-CNRS (G. Adda) du côté français. Ces chercheurs et leurs équipes locales mettent en commun leur expertise pour traiter la documentation de trois langues africaines de la famille bantoue qui sont pour l'essentiel non-écrites et pour lesquelles les ressources disponibles sont généralement limitées: Basaa (Cameroun), Myene (Gabon) et Embosi (République du Congo).

En savoir plus...


Pour une analyse écopoétique des littératures de la Vallée du Fleuve Sénégal (01.01.2018 – 31.12.2021)

PI : Mélanie Bourlet

EcoSen a pour objectif de mettre en évidence les liens entre productions littéraires en langue peule et environnement dans la région du Fleuve Sénégal (sud de la Mauritanie, nord du Sénégal), par la mise en œuvre d’une approche théorique inédite pour les littératures de cette région, et afrophones en général : l’écopoétique.

Cette discipline, en voie d’émergence dans le champ de la recherche française, interroge dans les textes les relations de l’homme à son environnement pour mettre en lumière des poétiques environnementales qui seraient autant de manières d’habiter le monde, et dont elle postule plus ou moins implicitement l’importance socio-politique. L’hypothèse qui sous-tend EcoSen est que l’environnement joue un rôle moteur dans la création poétique et sa résonnance tant auprès des populations locales que de la diaspora.

Cette hypothèse prend appui sur plusieurs constats et travaux antérieurs des membres du projet, ayant en commun une longue expérience de terrain dans la vallée du fleuve Sénégal.
Cette région est traversée d’un bout à l’autre par le fleuve Sénégal, dont le régime des crues rythme toute la vie des populations. Toutefois, elle est soumise depuis les années 60 à de profonds changements environnementaux (sécheresses, construction de barrages, disparition d’espèces animales et végétales) et sociétaux (paupérisation croissante, migrations massives en et hors d’Afrique).

Parallèlement, la transformation des paysages s’est accompagnée d’une prise de conscience croissante d’une marginalisation politique, et des revendications culturelles fortes soutenues par des associations très dynamiques (sur le plan national et international), portées en grande partie par les poètes.

Une création écrite contemporaine en peul s’est ainsi développée dès les années 60 tant en Afrique qu’en Europe. En même temps, la riche et dense production poétique orale de cette vallée, très appréciée, et traditionnellement présentée comme dépendant d’une organisation sociale hiérarchisée, reste profondément ancrée dans un environnement naturel, tout en ayant évolué dans ses modes d’énonciation, de diffusion et de patrimonialisation (internet, festivals).

Afin de cerner le lien entre poésie et environnement, EcoSen propose d’expérimenter une méthodologie interdisciplinaire rassemblant des spécialistes de cette zone du Sahel (2 littéraires, 1 géographe, 2 anthropologues).
Leur but est d’initier une réflexion commune sur les processus, fonctions et enjeux de création des lieux et des paysages, avec comme point de départ un corpus de poésie orale et écrite de différents groupes sociaux (bergers, chasseurs, éleveurs, etc).

De nouvelles données seront collectées sur le terrain (poésie, cartographie, terminologie linguistique, entretiens ethnographiques, etc). Leur croisement aboutira à la mise en place d’une plateforme numérique pensée par une solide équipe de techniciens en lien avec les chercheurs, pour le grand public et l’intérêt des disciplines impliquées. La démarche et les résultats d’EcoSen seront restitués dans le cadre de publications, de collaborations universitaires (au Sénégal, en France) et avec la société civile.

EcoSen a notamment reçu le soutien de la chaire UNESCO « Fleuves et patrimoines : diversité naturelle et culturelle des paysages fluviaux ». En posant le paradigme environnemental, jusqu’ici traité comme un thème secondaire, comme un élément esthétique essentiel à la compréhension du dynamisme de cette poésie et de ses enjeux de société, EcoSen propose un changement de perspective inédit et stimulant sur la poésie de la Vallée du fleuve Sénégal. Cela permettra de saisir sous un angle nouveau les textes recueillis par le passé et ceux à venir, et de comprendre la force mobilisatrice du discours poétique observé dans cette région.

Par son originalité, EcoSen ambitionne ainsi de faire avancer la réflexion française en écopoétique, de promouvoir un dialogue comparatiste en participant à la création d’un réseau et de tester la pertinence de cette approche pour les littératures afrophones orales et écrites.

Les parlers du Croissant : une approche multidisciplinaire du contact oc-oïl (01.01.2018-31.12.2021) :

PI : Nicolas Quint

La zone du Croissant linguistique correspond à la frange Nord du Massif Central. Les parlers gallo-romans qu'on y pratique traditionnellement (et dont les locuteurs ont généralement plus de 70 ans) présentent simultanément des traits typiques des variétés d'oc et d'oïl. Ce projet a pour but d'aborder les parlers du Croissant dans une perspective multidisciplinaire :

  1. constitution de corpus pluri-dialectal ;
  2. comparaison des parlers du Croissant (base de données de référence, approche TAL) ;
  3. description (terrain) + analyse typologique (acoustique, prosodie, morphologie, sémantique) ;
  4. caractérisation vis-à-vis des zones limitrophes (oc/oïl) ;
  5. études psycholinguistiques sur le bilinguisme français/parler local ;
  6. étude sociolinguistique.

Ces actions visent à documenter tant qu'il en est encore temps et le plus possible ce patrimoine linguistique méconnu en garantissant la pérennité des données (accessibles en lignes), des productions scientifiques dédiées de qualité et en assurant un retour vers les locuteurs (contacts associations locales).

En savoir plus...


Afficher les projets ANR terminés


Contrats ANR terminés

ELLAF (Encyclopédie des Littératures en Langues africaines) (01/2014-01/2017)

PI : Ursula Baumgardt

Les littératures en langues africaines, sont peu connues mais pourtant riches, réunissant aussi bien des littératures orales que des littératures écrites en plusieurs graphies. En raison de leur grande diversité tant linguistique que formelle, elles soulèvent des questions importantes pour l’analyse et la théorie littéraires : quel est le lien entre le statut de la langue et sa capacité à produire des textes littéraires ? Quelles sont les relations entre les littératures orales et l’écriture littéraire?

Pour pallier le manque de documentation, il est indispensable de développer un outil de documentation préalable nécessaire à la réalisation de recherches transversales dépassant le cadre d’une seule littérature.

ELLAF a pour double ambition d’être à la fois une base de données sur les littératures en langues africaines quel que soit leur statut sociolinguistique et un espace de recherches. Des textes littéraires sous forme d’extraits ou en version intégrale accompagnés d’une traduction en français et/ou en anglais sont présentés sur le site selon un protocole commun, visant à préciser la contextualisation de chaque texte ainsi que les circonstances de création et/ou de performance, tout en définissant le genre littéraire dont il relève.

En savoir plus...


CorTypo (03/2013-03/2017)

PI : Amina Mettouchi

The aim of the CorTypo project is the elaboration of an innovative system of linguistic annotation of natural language corpora in lesser-described spoken languages, in view of testing linguistic hypotheses on spontaneous discourse data, in a typological perspective.

In order to achieve this goal a number of fundamental theoretical questions need to be resolved with respect to language form and language functions. Crucially, the project addresses the question of what kind of theoretical apparatus is required for the comparison of languages displaying different formal means and different functions.

By implementing theoretical solutions into corpus-design and database-design, the project provides the basis for the empirical testing and falsification of hypotheses, and allows the elaboration of new hypotheses on language structure and cross-linguistic comparison. By proposing solutions to the problem of linguistic interoperability, it paves the way for large-scale typological work based on first-hand natural language data.

En savoir plus...


RefLex (12/2010 – 05/2015)

PI : Guillaume Segerer

Le projet RefLex a pour objectif de mettre à la disposition de la communauté scientifique un corpus lexical de référence pour les langues d'Afrique, ainsi que des outils de traitement et d'analyse adaptés à ce corpus. Une description plus détaillée est disponible au format PDF

En savoir plus...


Sénélangues (10/2009 – 01/2014)

PI : Stéphane Robert

Le but de ce projet est de contribuer à la documentation et à la description de langues du Sénégal et au classement des langues du groupe atlantique.

Il permettra de définir des priorités en repérant les langues les moins documentées et/ou les plus menacées de disparition. Les descriptions effectuées sur ces langues contribueront de façon considérable à la connaissance des langues du Sénégal, et à la sauvegarde des langues en danger de ce pays.

Elles apporteront une contribution africaniste à la typologie générale et au classement génétique des langues et seront un outil précieux pour une révision argumentée de la classification encore controversée des langues de la famille atlantique.

En savoir plus...


CORPAFROAS (2007-2012)

PI : Amina Mettouchi

CORPAFROAS a été un projet financé par l’Agence Nationale de la Recherche (France), pour 2007-2012. C’est une entreprise unique, en ce qu’elle a permis de mettre à disposition le premier corpus de langues afro-asiatiques (chamito-sémitiques) comportant une indexation texte-son, et une annotation complexe. Le corpus a été librement accessible, et a été accompagné par un logiciel, des outils et des publications visant à faciliter la contribution d’autres linguistes de terrain à CORPAFROAS, ainsi que la mise en place d’initiatives inspirées de ce modèle.

En savoir plus...