La interacción humano robot basada en diálogos es un campo de investigación amplio, entre
los que se incluyen la interacción multimodal, esto es la interacción basada en voz,
visión, tacto e inclusive otros modos. En nuestro grupo de investigación est
La interacción humano robot por voz está basada en algunos pilares básicos como son:
- El reconocimiento automático de voz.
- La síntesis automática de voz.
- La localización de la fuente sonora.
- La identificación del hablante.
- El gestor de diálogos (manager).
Actualmente estamos usando un reconocedor de voz basado en gramáticas (Loquendo) y otro de lenguaje abierto (Google ASR). Sobre ellos hemos desarrollado "habilidades" capaces de trabajar de manera coordinada con la Arquitectura de Control AD. Es de vital importancia para la interacción por voz el desarrollo de un sistema de reconocimiento: preciso, de respuesta rápida y capaz de trabajar en ambientes con ruido.
El sistema de síntesis de voz, está basado en una habilidad capaz de gestionar locuciones,siendo capaz de mantener una cola en memoria, secuestrar la voz, liberarla, callarla etc. Para ello nos hemos basado en tres sistemas: Loquendo, Festival y Google TTS. Mediante estos tres sistemas somos capaces de hablar con emociones, con control de velocidad, con gestos sonoros (como risas, silbidos, lloros, etc) y en mas de 35 idiomas diferentes.
En cuanto al sistema de diálogo, en la actualidad estamos trabajando con un sistema de huecos de información (VoiceXML) pero estamos en estudio con nuevos sistemas, por ejemplo basados en modelos estadísticos como pueden ser los: POMDP.
Recientes campos de desarrollo e investigación abiertos nos llevan a la Generación de Lenguaje Natural basándonos en gramáticas o templetes.
F.Alonso; M.A.Salichs. Integration of a voice recognition system in a social robot. Cybernetics and Systems: An International Journal. Vol. 42. No. 4. pp.215-245. 2011.
-
J.F.Gorostiza; M.A.Salichs. End-User Programming of a Social Robot by Dialog
. Robotics and Autonomous Systems (http://dx.doi.org/10.1016/j.robot.2011.07.009)
. Vol. 59. No. 12. pp.1102-1114. 2011.
Conference publications
-
F.Alonso; J.F.Gorostiza; M.A.Salichs. Preliminary Experiments on HRI for improvement the Robotic Dialog
System (RDS). Robocity2030 11th Workshop: Robots Sociales. Leganés. España. Mar, 2013.
-
F.Alonso; J.F.Gorostiza; M.A.Salichs. Musical Expression in a Social Robot. Proceedings of the 2012 International IEEE Intelligent Vehicles Symposium. Workshops V Perception in Robotics. Alcalá de Hena. Spain. Jun, 2012.