Universidad politécnica de madrid escuela técnica superior de ingenieros



Descargar 3.96 Mb.
Página20/44
Fecha de conversión18.08.2020
Tamaño3.96 Mb.
1   ...   16   17   18   19   20   21   22   23   ...   44
4.1.2.- Directorio “data”
En este directorio se encuentran los subdirectorios asociados a cada una de las tareas que puede realizar el robot, un subdirectorio en el que se guardarán las grabaciones, otro subdirectorio para archivos y operaciones temporales, un directorio para los modelos que se hayan generado en caso de haber realizado algún proceso de adaptación, un subdirectorio en el que se realizan los primeros pasos del proceso de adaptación, archivos de configuración del sistema y otros ficheros básicos e invariantes necesarios para el reconocimiento.
4.1.2.1.- Directorio de tarea
Dentro del directorio “Data” se creará una nueva carpeta por cada tarea diferente que pueda llevar a cabo el robot. Cada directorio de tarea debe contener desde el principio tres archivos fundamentales:


  • “dicc.dic”: Este fichero es necesario para el aprendizaje mediante reglas. Permite agrupar las palabras en categorías de forma que el sistema es capaz de aprender con menos reglas y en menos tiempo. La estructura del fichero es: el número de palabras que contiene el fichero en la primera línea y a continuación, una palabra con su categoría en cada línea. Puede estar vacío pero en ese caso debe tener un cero en la primera línea.




  • “Palfunc.lis”: Fichero necesario para el aprendizaje mediante reglas. Contiene las palabras que se considera que no aportan significado, de forma que no se generan reglas con ellas. Debe contener alguna palabra, no puede estar vacío. Cada palabra función se pone en una nueva línea.




el

la

los



las

un

una



unos

unas


Cuadro 10: Ejemplo de palabras función del fichero Palfunc.lis


  • Fichero de comandos: Este fichero contiene las frases que el sistema debe ser capaz de reconocer, cada una de ellas seguida del comando con el que debe asociarse. La estructura del fichero es la siguiente:




    • No puede haber líneas en blanco ni al principio ni al final del fichero.

    • Las líneas no pueden comenzar por mayúscula.

    • Soporta tildes.

    • Cada línea contiene una frase y el comando por el que debe ser traducida. El formato de una línea es:

eres inteligente -> orden=[inteligencia]


A la izquierda de la flecha se escribe la frase y a la derecha debe aparecer el concepto asociado a la frase y, entre corchetes, el valor que se da a ese concepto que es lo que se mandará al robot como comando entendido. El valor puede coincidir con alguna de las palabras de la frase y debe escribirse en minúscula. Es recomendable que haya el menor número de espacios posibles en la parte derecha de la sentencia para evitar errores.
4.1.2.2.- Directorio de grabaciones
En este directorio se guardan las grabaciones que se van realizando de las frases dichas por el usuario. El nombre de las mismas está relacionado con el usuario y la sesión de grabación. Un ejemplo de nombre de grabación sería:
locutor_sesion_numero de grabacion.wav
En el caso de que se esté llevando a cabo un proceso de adaptación de los modelos acústicos al hablante, las grabaciones relacionadas también se guardan en este directorio pero dentro de una subestructura de directorios que se explicará con más detalle en el capítulo 6.
4.1.2.3.- Directorio de modelos
En este directorio se guardarán los modelos que hayan sido modificados en el proceso de adaptación. Tiene una estructura interna similar a la del directorio de grabaciones, por lo que ésta podrá verse en detalle en el capítulo 6.
4.1.2.4.- Directorio de adaptación
En este directorio se encuentran los programas ejecutables necesarios para llevar a cabo las primeras transformaciones de formato en los ficheros de diccionario, necesarias para el proceso de adaptación. En este directorio también se irán guardando los ficheros intermedios que se necesiten para dar formato a los ficheros de diccionario y transcripciones, de manera que sean comprensibles por el programa HTK.

4.1.2.5.- Directorio temporal


Este directorio se emplea para realizar operaciones intermedias en el momento de la generación de diccionarios y gramáticas, y para guardar los archivos de depuración que se generan durante la ejecución. Puede limpiarse en función de un flag que se lee del fichero de configuración.
4.2.- Configuración del sistema
La configuración del sistema del que partimos se realizaba mediante lecturas de ficheros .INI de configuración. El directorio SERVIVOX tenía alrededor de 120 archivos con esa extensión, muchos de los cuales ya no se utilizaban y podían dar lugar a error a la hora de buscar un parámetro de configuración que se deseaba variar.
La primera tarea que se llevó a cabo en esta línea de simplificar la configuración del sistema para hacer más sencilla su portabilidad y manejo fue determinar qué ficheros de configuración realmente eran utilizados en nuestro sistema y cuáles no. De ésta limpieza nos quedamos con seis ficheros de configuración que realmente se utilizaban en esta versión del programa. Esos ficheros son:

1   ...   16   17   18   19   20   21   22   23   ...   44


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal