Universidad politécnica de madrid escuela técnica superior de ingenieros



Descargar 3.96 Mb.
Página21/44
Fecha de conversión18.08.2020
Tamaño3.96 Mb.
1   ...   17   18   19   20   21   22   23   24   ...   44
Detector.ini: Contiene las variables asociadas al detector como los niveles en decibelios que debe ir superando la voz de la grabación para que sea considerada como un discurso real o el tiempo que debe estar en cada uno de esos niveles.




  • Entorno.ini: En este fichero se definen las diferentes prioridades que puede tener una hebra de ejecución, así como variables de activación de alguna de las funcionalidades que presenta el sistema (como utilizar el método de reconocimiento N-Best).




  • Tade.ini: Tiene variables relacionadas con los directorios de grabación, número de intentos para reconocer lo dicho antes de desecharlo o el timeout del sistema.




  • Voz.ini: Contiene variables de configuración relativas a la grabación y el reconocimiento de ficheros como el tiempo máximo de grabación, el formato de la grabación, el número máximo de gramáticas y diccionarios que se pueden utilizar o cuál es el fichero de configuración de la parametrización.




  • Reco_cfg_generico.ini: Es el fichero de configuración para el reconocimiento. Contiene variables relacionadas con las gramáticas, parametrización, ficheros de audio, tramas o penalización por inserción de palabras.




  • Prb_htk_generico_Speechdat.ini: Contiene las variables asociadas a la parametrización de los ficheros de audio como pueden ser las varianzas, el número de parámetros a considerar o la longitud y el tamaño de las ventanas.

Una vez identificamos los ficheros de configuración relevantes, realizamos una selección de los parámetros que más frecuentemente solían que ser modificados por los usuarios para ponerlos en un nuevo fichero de configuración. El objetivo de este procedimiento es que el usuario del sistema sólo tenga que abrir un fichero de configuración para modificar los parámetros que más habitualmente serán modificados para adaptarlos a las circunstancias concretas de la tarea que vaya a realizarse.


Así es como surge en fichero “urbano.ini”. El contenido de este fichero puede verse detalladamente en el manual de usuario del anexo 1. Pese a que también están reflejadas en el manual de usuario, queremos explicar con un poco más de detalle las principales variables de configuración que intervendrán en el desarrollo de este proyecto. Dichas variables son:


  • modoAutomatico: Es la variable que indica si el usuario desea que el proceso de configuración del sistema sea o no transparente para él. Los posibles valores que puede tomar son:




    • Valor 0: El modo automático está desactivado y, por tanto, el usuario puede modificar manualmente la configuración del sistema.




    • Valor 1: El modo automático está activado y, por tanto, la configuración/ funcionamiento del sistema es transparente al usuario, realizándose a través de los ficheros .ini. Este es el modo de funcionamieto normal del robot.




  • adaptacionNecesaria: Es la variable que indica al sistema si es necesario que el usuario lleve a cabo un proceso de adaptación de los modelos de lenguaje a su voz. Si el modo automático está activo, se ignorará el valor de esta variable. Los valores que puede tomar son:




    • Valor 0: No es necesario adaptar los modelos acústicos al locutor.




    • Valor 1: Es necesario que el locutor lleve a cabo un proceso de adaptación.




  • dir_dic: Es el directorio en el que se encuentran los diccionarios. Puesto que cada tarea tiene asociados unos diccionarios, este directorio deberá corresponderse con el de la tarea.



1   ...   17   18   19   20   21   22   23   24   ...   44


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal