IRCOM ORTOLANG TEI

Conversions au format TEI pour l'Oral et le Multimodal

1) Choisir le Format Destination
TEI (xml / tei_corpo.xml / teiml / trjs)
TRS (transcriber)
CHA (chat - childes)
TXT (texte - utf8)
DOCX (microsoft word)
XLSX (microsoft excel)
CSV (tableurs)
TEXTGRID (praat)
EAF (elan)
TXM (xml/w)
Lexico/Le Trameur (.txt)
Conserver ces locuteurs/champs dans la sortie
Supprimer ces locuteurs/champs de la sortie
Valeur du locuteur ou du champ (caractères génériques acceptés)
Supprimer les marqueurs spécifiques de l'oral
Nombre de décimales pour les temps

Une ligne par énoncé + tiers/dépendances à droite
Enoncé seul sur une ligne, tiers/dépendances en dessous rassemblé par noms de tiers
Enoncé seul sur une ligne, tiers/dépendances en dessous, un seul élément par ligne
Nombre de décimales pour les temps

Format texte: n° - Loc - Enoncé (version tableau)
Format texte: n° - Loc - Enoncé - Temps début (version tableau)
Format texte: n° - Loc - Enoncé - Temps début et fin (version tableau)

Format texte: n° - Loc - Enoncé (version tabulation)
Format texte: Temps début - Loc - Enoncé - (version tabulation)
Format texte: Temps début et fin - Loc - Enoncé (version tabulation)
Format texte: Temps début et fin - Loc - Enoncé (version tabulation) + Header (pour correction orthographique)

Format chevauchements: Loc - Enoncés
Format chevauchements: Loc - Tour de parole
Nombre de décimales pour les temps

Format par bloc: Loc - Temps - Enoncé
Format par ligne: n° - Loc - Enoncé - Temps
Texte sans aucune marque
Nombre de décimales pour les temps

- Type: Valeur:
Ajoute un indicateur de section en fin de chaque énoncé (pour lexico/le trameur)

2) Choisir le Fichier source (extension: TRS/CHA/TEXTGRID/EAF/TXT/DOCX/XLSX)
Faire glisser ici un (ou plusieurs) fichier(s)

Ou cliquer ici pour sélectionner un fichier =>

Demander les paramètres pour les fichiers praat.
Si plusieurs fichiers traités, utiliser les mêmes paramètres praat pour les autres fichiers.

Choix des relations pour
Relations choisies
(la sélection de paramètres n'est pas obligatoire)

Résultats (Effacer)

Le format TEI_CORPO suit les propositions du GT2 IRCOM et du groupe TEI Oral ISO. Il est conforme au standard TEI.
Un outil java pour le traitement par lot peut être directement téléchargé ici. Plus d'informations sont disponibles sur cette page.
L'export Excel option "une ligne par énoncé" permet de faire jouer les alignements vidéos directement sous Excel. Pour cela, faire l'export puis insérer par copier-coller les lignes Excel dans le fichier modèle téléchargeable ici. Attention il faut disposer une installation de VLC Téléchargement de VLC. Les vidéos se lancent sous MAC par les touches Alt+Cmd+W et sous PC par les touches Shift+Ctrl+W