Workshop JSALT

Journée spéciale collecte et annotation de données

Journée de Collecte et d'Annotation des Données

Le 29 juin 2023 se déroulera la Journée de Collecte et d'Annotation des Données à Le Mans Université. Cette journée est dédiée à l'échange des besoins, des défis et des outils des chercheurs, des archivistes, des diffuseurs et des producteurs de données dans la communauté de la technologie du langage humain.

Nous visons à favoriser la collaboration entre le milieu universitaire et l'industrie afin de tirer parti de la recherche en apprentissage automatique et de l'implication humaine pour créer, gérer et évaluer efficacement les processus liés aux données.

 

L'événement abordera les sujets principaux suivants :

  • Besoin de données et fournisseurs : exploration des exigences et des défis dans divers domaines.

  • Indexation et archivage des données : discussion sur les outils et les techniques permettant d'organiser et de stocker efficacement les données collectées pour une utilisation future.

  • Annotation : approfondissement du processus d'annotation, des problèmes de validation et du rôle des humains dans la collecte et l'annotation des données.


PROGRAMME de la journée

9h00 > 09h15 | ouverture

Session 1 | Production de données

 9h15 > 9h45 | Collecte et distribution de données linguistiques : réalisations, défis et perspectives
Intervenant : Denise DiPersio (Directrice associée du LDC)

 9h45 > 10h15 | Common Voice
Intervenant : Rebecca Ryakitimbo (Fondation Mozilla)


10h15 > 10h30 Pause café


 
10h30 > 11h15  | Services autour de la production et du partage des ressources linguistiques

  • Partie 1 : Production de ressources linguistiques et gestion des données
  • Partie 2 : Défis juridiques de la production et de la distribution des données

Intervenants : Victoria Arranz (Head of R&D) et Mickaël Rigault (Legal Counsel) (ELDA)

 11h15 > 12h00 | Table ronde


12h00 > 13h30 | Pause déjeuner


Session 2 | Annotations et intervention humaine

 13h30 > 14h00 | Annotations pour la segmentation des contenus audio
Intervenant : Ivan Thomas (Radio France)

 14h00 > 14h30 | Présentation de Labelit : une solution d'annotation polyvalente et extensible
Intervenants : Karel Bourgois (Voxist, Le Voice Lab), Corentin Giraud (Batvoice), Olivier Baude (Huma-Num & CNRS)

 14h30 > 15h00 | INA : Collecte et génération de données dans le processus d'archivage
Intervenant : Emmanuel Pije (INA)

 15h00 > 15h30 | Quand l'IA rencontre les archives : le cas de RTVE
Intervenant : Virginia Bazan Gil (FIAT/IFTA)


15h30 > 16h00 | Pause café


 
16h00 >16h30 | Défis de l'annotation des parole en code-switch pour les langues à orthographe non standard
Intervenant : Fethi Bougares (Elyadata)

 16h30 > 17h00 | Plain X : apprendre de la recherche et du développement d'une plateforme d'adaptation de contenu 4-en-1
Intervenant : Mirko Lorenz (Deutsche Welle)

 17h00 > 17h45 | Table ronde animée par Alfonso Ortega

 

17h45 > 18h00 Clôture

 

 

Jeudi 29 juin 2023
Eve-Scène Universitaire | Le Mans Université
Contact : jsalt2023 @ univ-lemans.fr


Retrouvez toutes les informations de l’évènement sur le site dédié au Workshop JSALT

Partagez :

Besoin d'une information ?

RECHERCHER LE CONTENU QUI VOUS INTÉRESSE :