Universidad politécnica de madrid escuela técnica superior de ingenieros



Descargar 3.96 Mb.
Página7/44
Fecha de conversión18.08.2020
Tamaño3.96 Mb.
1   2   3   4   5   6   7   8   9   10   ...   44
Inteligencia: Toma de decisiones y gestión de comportamientos del robot.



  • 1.2.2.2.- Implementación
    Agrupados por líneas de investigación, entre los objetivos del proyecto cabe reseñar los siguientes:


    • Navegación: Mejora del método de localización y modelado simultáneos (SLAM, Simultaneous Localization and Mapping).




    • Consciencia y emociones: Desarrollo de modelos de consciencia, diseño de una metodología de desarrollo y su implementación. Generación de modelos de emociones del robot, como reacción ante eventos de entrada.




    • Conocimiento: Modelado del conocimiento sobre el que el robot “trabaja” (presenta, enseña, explica) y sus interrelaciones; modelado del conocimiento “social” necesario para interactuar con su entorno.




    • Diálogo: Mejora de la síntesis de una voz adecuada para un robot que incluya emociones; reconocimiento de habla continua, procesamiento del lenguaje natural para conseguir una comprensión semántica del diálogo mantenido y adaptación de los modelos acústicos al locutor y a la tarea a realizar para que mejore la tasa de reconocimiento.

    Este proyecto fin de carrera se encuentra especialmente enfocado hacia el último de los puntos, con la idea de que el sistema de reconocimiento de habla permita facilitar y mejorar la tarea de navegación.



    1.3.- Objetivos y fases del proyecto
    1.3.1.- Objetivos
    En base a lo anteriormente expuesto, los objetivos que se han definido para la realización de este proyecto fin de carrera son los siguientes:
    1.3.1.1.- Adaptación de los modelos acústicos
    Como hemos indicado anteriormente, el robot se moverá por diversos lugares y no siempre interactuará con los mismos locutores. Es por este motivo que se ha definido este objetivo de manera que el sistema sea capaz de adaptar los modelos acústicos genéricos de que dispone a un locutor y unas características acústicas del entorno concretas.
    Para llevar a cabo este proceso, se creará un interfaz gráfico sencillo para que el usuario del sistema pueda especificar las características del entorno y la tarea que va a llevar a cabo sin necesidad de dedicar horas al estudio del mismo. También se pretende reducir el tiempo de grabación que el locutor deberá llevar a cabo para que el sistema pueda modificar y adaptar los modelos genéricos a sus características de una manera fiable.
    1.3.1.2.- Guiado del robot
    Actualmente, cuando el robot llega a un lugar cuyo mapa desconoce, una de las personas responsables del mismo o maestro, recorre el nuevo lugar junto con el robot manejándolo mediante un mando analógico e introduciendo manualmente etiquetas que definan lugares o zonas especiales como pueden ser los puntos en los que el robot deberá dar una explicación o zonas peligrosas para la integridad física del robot a las que no deberá acercarse.
    Este objetivo se centra en realizar un estudio inicial para el proyecto robonauta que seguirá a éste, en el que se realizará un prototipo del sistema de guiado del robot mediante comandos de voz. Definir y preparar una propuesta de gramáticas que permitan al maestro guiar al robot mediante la voz sin necesidad de emplear el mando analógico. De esta manera se permite una mayor versatilidad y libertad a la hora de recorrer un nuevo escenario, definir etiquetas y comprobar que el robot ha generado un mapa correcto del lugar con las etiquetas asociadas al mismo.
    1.3.1.3.- Aprendizaje automático
    El sistema de comprensión que emplea el reconocedor de habla para que el robot sea capaz de traducir las frases que los usuarios le dicen por comandos que comprenda puede realizar dicha traducción mediante el empleo de dos técnicas:

    En la versión del reconocedor de la que se partió, no se encontraba en funcionamiento el aprendizaje mediante el empleo de reglas contextuales. Este objetivo tiene como fin activarlas y utilizarlas según desee el usuario, así como modificar las medidas de confianza del reconocedor para que estime la confianza de un reconocimiento a partir de las palabras que realmente aportan información.


    1.3.2.- Fases del proyecto
    Para llevar a cabo los objetivos que acabamos de definir, hemos dividido el trabajo en cuatro fases de investigación y desarrollo estructuradas en base al cumplimiento y requisitos de los mismos.
    En la primera fase se llevará a cabo un estudio del sistema y simplificación del mismo mediante la definición de métodos que encapsulen tareas concretas que hasta ahora se realizaban como parte del método principal, permitiendo de este modo que sean empleados por otros métodos o hebras. También se ha llevado a cabo una simplificación y reducción de los ficheros de configuración que necesita el sistema de manera que el usuario pueda encontrar de una manera más sencilla las variables que desea modificar.
    La segunda fase se centra en la fase de adaptación. Ésta a su vez puede dividirse en tres etapas, cada una de ellas orientada a la consecución de un subobjetivo para conseguir la adaptación.


    • Primera etapa: Crear una interfaz gráfica que le permita al usuario introducir las características de la situación a la cual quiere adaptar el sistema, así como poder grabar de forma sencilla las frases que sean necesarias para llevar a cabo el proceso de adaptación de los modelos.




    • Segunda etapa: Crear los scripts que lleven a cabo todo el proceso de adaptación a partir de los scripts ya existentes de Linux. Esto implica dar el formato correcto a los ficheros que se vayan a emplear y realizar las llamadas a los distintos programas que constituyen la herramienta HTK.




    • Tercera etapa: Llevar a cabo pruebas en distintos contextos que permitan validar la adaptación realizada.

    La tercera fase está enfocada a la definición y validación del vocabulario y la gramática que permitirán llevar a cabo la tarea, mediante el estudio de los requisitos de la misma.


    La cuarta y última fase engloba las actividades que nos permitirán aplicar el aprendizaje incremental de reglas contextuales para acelerar dicho proceso, así como mejora de las técnicas de medida de confianza de manera que se lleve a cabo un filtrado de las palabras fuera de vocabulario, de aquellas palabras que no aporten información a la frase. También se pretende permitir la posibilidad de que se pueda asociar más de un comando a cada una de las frases definidas en el vocabulario de forma que el diálogo con el robot pueda realizarse de forma parecida al lenguaje natural.

    2.- DESCRIPCIÓN DE LAS TÉCNICAS Y HERRAMIENTAS EMPLEADAS

    En este capítulo se realizará un estudio de las técnicas y herramientas que se emplearán en el desarrollo de este Proyecto así como un análisis de los proyectos fin de carrera que lo precedieron.

    2.1.- Técnicas empleadas
    2.1.1.- Adaptación
    Como se comentó en el primer capítulo el objetivo de las técnicas de adaptación es desarrollar un sistema de reconocimiento con prestaciones similares a las de un robusto sistema entrenado, pero empleando una cantidad muy reducida de datos. [Díaz 2002]
    En base a lo expuesto anteriormente, llevaremos a cabo dos adaptaciones:

  • 1   2   3   4   5   6   7   8   9   10   ...   44


    La base de datos está protegida por derechos de autor ©odont.info 2019
    enviar mensaje

        Página principal