Projet ESLO

♦ Le corpus


Eslo1    
Eslo2    

♦ Description générale du projet


ESLO, Enquête Sociolinguistique à Orléans, est un projet du Laboratoire Ligérien de Linguistique (UMR7270) de l'université d'Orléans.
Il a pour objectif de constituer un corpus oral (collection ordonnée d’enregistrements de la parole) qui soit prototype à toutes les étapes de sa réalisation et qui puisse se situer au même niveau, qualitatif et quantitatif, y compris par sa dimension patrimoniale, que les grands corpus oraux fabriqués, ou en cours de fabrication, en Europe et dans le monde.
ESLO 1 est la suite d'une initiative prise en 1968. A cette date, un groupe d'universitaires anglais avait entrepris de collecter des documents sonores à Orléans avec une visée didactique : l’enseignement du français langue étrangère dans le système public d’éducation anglais.
L'enquête comprend environ 200 interviews avec les propriétés sociolinguistiques des locuteurs et des situations, soit au total plus de 300 heures de parole incluant pour moitié des interviews en face à face et pour moitié une gamme d’enregistrements variés (conversations téléphoniques, réunions publiques, transactions commerciales, repas de famille, entretiens médico-pédagogiques, etc.).
L'exploitation de ces matériaux se poursuit au sein du Laboratoire Ligérien de Linguistique qui s'est donné pour objectif une mise en ligne de ceux-ci, en respectant un cahier des charges scientifique et juridique.
En partant des acquis d’ESLO 1, une nouvelle enquête a été mise en chantier par le LLL : ESLO 2. Il s’agit, à quarante années de distance, de constituer un corpus comparable dans le produit attendu et dans les modalités de la collecte : l’objectif a été fixé à 400 heures environ de documents sonores répondant à une approche variationniste et conçus à travers des des programmes spécifiques. Réunis, ESLO 1 et ESLO 2 formeront une collection de 700 heures d’enregistrement, ce qui est considéré aujourd’hui comme une valeur repère pour les investigations projetées.
Le projet est soutenu par l'Université d'Orléans, la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF - Ministère de la Culture et de la Communication), l'Agence Nationale de la Recherche (ANR), la Région Centre au titre du Centre de Ressource et d'Innovation sur les Territoires (CRITERR) et le Programme Investissement d’Avenir.
Plus d'informations ...

♦ Autorisation d'utilisation des corpus


♦ Recueil de consentement des locuteurs enregistrés
Le projet ESLO a donné lieu à un important travail sur la méthodologie d’approche et sur le recueil du consentement éclairé des personnes enregistrées. Ce travail a été mené dans la perspective instauré par le Guide des bonnes pratiques [Baude & al., Corpus Oraux, Guide des bonnes pratiques 2006, PUO et CNRS éditions].
♦ Protection des données sensibles
La base de données ESLO ne contient pas de données personnelles identifiantes.
Les noms et adresses des locuteurs enregistrés dans le module « entretien » sont conservés dans une base de données distincte conformément aux recommandations de la CNIL.
Les données de géolocalisation des enregistrements sont restreintes à un pâté de maison (troisième décimale de coordonnées GPS).
♦ Anonymisation des documents sonores et de leurs transcriptions
La procédure d’anonymisation a été élaborée dans le cadre d’un projet du LLL :
Les enregistrements et les transcriptions ont été anonymisés à l’aide d’un script fonctionnant sous Praat (Daniel Hirst).
♦ Licences
Tous les documents du corpus des ESLOs sont délivrés sous licences Creative Commons.
Les enregistrements et les transcriptions d’origine relèvent de la licence :

Attribution + Pas d’Utilisation Commerciale + Partage dans les mêmes conditions (BY NC SA) : Le titulaire des droits autorise l’exploitation de l’œuvre originale à des fins non commerciales, ainsi que la création d’œuvres dérivées, à condition qu’elles soient distribuées sous une licence identique à celle qui régit l’œuvre originale.

Les versions annotées du corpus relèvent de la licence :

Attribution + Partage dans les mêmes conditions (BY SA) : Le titulaire des droits autorise toute utilisation de l’œuvre originale (y compris à des fins commerciales) ainsi que la création d’œuvres dérivées, à condition qu’elles soient distribuées sous une licence identique à celle qui régit l’œuvre originale.

♦ Références à citer lors de l'utilisation des données


♦ Baude O., Duga C. (2011) « (Re)faire le corpus d’Orléans quarante ans après : quoi de neuf, linguiste ? » Corpus 10, Varia, 99-118.
ou
♦ Eshkol-Taravella I., Baude O., Maurel D., Hriba L., Dugua C., Tellier I., (2012) Un grand corpus oral « disponible » : le corpus d’Orléans 1968-2012. in Ressources linguistiques libres, TAL. Volume 52 – n° 3/2011, 17-46.

Back to top