COSMO : un modèle bayésien des fondements sensorimoteurs de la perception et de la production de la parole - Archive ouverte HAL Access content directly
Conference Papers Year :

COSMO : un modèle bayésien des fondements sensorimoteurs de la perception et de la production de la parole

(1) , , (2) , (3, 1) , , (4) , (3, 1) , , (1) , (3)
1
2
3
4

Abstract

COSMO ("Communicating Objects by Sensory-Motor Operations") is a framework for jointly modeling speech perception and production by considering sensory-motor relations as a core component of its program. COSMO allows to jointly formalize two major theoretical frameworks in speech research that are auditory and motor theories – but also to integrate them within perceptual-motor theories. This leads to new perception models associating auditory processing and motor knowledge, and new speech motor control models oriented toward the achievement of multimodal sensory goals. We present the main results obtained with COSMO, and perspectives about temporal processing and deep learning implementation allowing to get closer to learning on real data.
Nous avons développé un cadre de modélisation des processus de la communication parlée, COSMO (« Communicating Objects by Sensory-Motor Operations »), qui s'applique à la fois aux modèles de perception et de production de parole en installant les relations sensori-motrices au coeur de son programme. COSMO permet de formaliser conjointement deux cadres théoriques majeurs des recherches sur la communication parlée, les théories auditives et motrices-mais aussi de les intégrer au sein de théories perceptuo-motrices. Ceci conduit ainsi à de nouveaux modèles de perception alliant traitements auditifs et prise en compte de connaissances motrices, ou de nouveaux modèles de contrôle moteur de la parole orientés vers la réalisation de buts sensoriels multimodaux. Nous présentons ces avancées ainsi que des pistes de développement sur le traitement temporel et l'implémentation deep learning permettant d'aller vers l'apprentissage sur des données réelles.
Fichier principal
Vignette du fichier
schwartz22.pdf (1.12 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03864188 , version 1 (21-11-2022)

Identifiers

  • HAL Id : hal-03864188 , version 1

Cite

Jean-Luc Schwartz, Marie-Lou Barnaud, Pierre Bessière, Marc-Antoine Georges, Raphaël Laurent, et al.. COSMO : un modèle bayésien des fondements sensorimoteurs de la perception et de la production de la parole. JEP 2022 - 34e Journées d'Études sur la Parole, Jun 2022, Noirmoutier-en-l'Ile, France. ⟨hal-03864188⟩
0 View
0 Download

Share

Gmail Facebook Twitter LinkedIn More