Universidad politécnica de madrid escuela técnica superior de ingenieros



Descargar 3.96 Mb.
Página32/44
Fecha de conversión18.08.2020
Tamaño3.96 Mb.
1   ...   28   29   30   31   32   33   34   35   ...   44
6.3.1.5.- Normalización Cepstral
El siguiente paso es obtener los datos necesarios para llevar a cabo la normalización de la media y de la varianza, como se comentó en el apartado 2.2.1.3. Para ello nos valemos del programa HCompV descrito en dicho apartado junto con sus respectivos ficheros de configuración y las listas de ficheros de parámetros.

6.3.2.- “adaptaMap.bat”


El proceso de adaptación MAP se lleva a cabo mediante una única llamada al programa HERest:


HERest -H modelos/SpeechDat_Continua_MMF -M hmm_2 -T 1 -B -w 2.0 -m 0 -u mwp

-s hmm_2/stats -C ../lib/config/herest2.cvn.map2.cfg -A -V -D

–I ../lib/lab/%1_train_tri.mlf

-S ../lib/flist/%1.scp ../lib/mlist/lista.cvn_0.5.100.784.tri > hmm_2/LOG



Cuadro 42: Llamada a HERest
Los parámetros que se la pasan a la función son los siguientes:


-H modelos/SpeechDat_Continua_MMF  modelos que vamos a reestimar

-M hmm_2  directorio en el que se guardarán los nuevos modelos

-T 1  trazas que se desean mostrar

-B  saca el formato binario

-w 2.0  mixture weigth con el valor que se le quiere dar

-m 0  mínimo número de ejemplos para ensayo necesarios

-u mwp  flags de configuración :m(media),w(mixture weigth),p(adaptación MAP)

-s hmm_2/stats  archivo que almacena las estadísticas de ocupación

-C ../lib/config/herest2.cvn.map2.cfg  fichero de configuración de HERest

-A  se imprimen los argumentos que se le pasan

-V  saca listado con versión de la herramienta y los módulos que utiliza

-D  saca los settings

-I ../lib/lab/%1_train_tri.mlf  fichero .mlf que cargamos para re-estimar

-S../lib/flist/%1.scp fichero script con los nombres de los ficheros de audio

../lib/mlist/lista.cvn_0.5.100.784.trilista de trifonemas que se va a

procesar


hmm_2/LOG  fichero en el que se guarda la salida de la ejecución del HERest

Tabla 5: Parámetros de la llamada a HERest
Una vez ejecutada, ya tenemos los nuevos modelos, por los que los copiaremos al directorio de modelos correspondiente y volveremos al directorio de tarea.
El fichero de configuración nos permite variar los parámetros de la adaptación MAP.


HPARM: TARGETKIND = PLP_0_D_A_Z

SAVEBINARY = T

MAXTRYOPEN = 2
HFWDBKWD: PRUNEINIT = 200.0

HFWDBKWD: PRUNEINC = 200.0

HFWDBKWD: PRUNELIM = 1200.1

HFWDBKWD: MINFORPROB = 20.0

HFWDBKWD: TRACE = 1
CMEANDIR = /usuarios/HMMs-CEU/cmn

CMEANMASK = *%%%%%%%%%%%%.plp

#VARSCALEFN = /usuarios/HMMs-CEU/cvn/globalvar

VARSCALEDIR = /usuarios/HMMs-CEU/cvn

VARSCALEMASK = *%%%%%%%%%%%%.plp
HMAP:TRACE = 1

HMAP:MAPTAU = 3



Cuadro 43: Fichero de configuración de HERest para la técnica MAP
De todos ellos cabe destacar la variable MAPTAU que nos permitirá modificar el peso de los modelos originales o de las nuevas grabaciones en la re-estimación según la ecuación 2.3.
6.3.3.- “adaptaMLLR.bat”
El proceso de adaptación empleando MLLR supone ejecutar más instrucciones que en el caso de MAP. Los pasos a seguir con sus instrucciones correspondientes son:


  1. Generamos el árbol de clases de regresión mediante HHEd.




HHEd –A –V –D –B –H ../modelos/SpeechDat_Continua_MMF –M classes

-T 00401 regtree128.hed ../lib/mlist/lista.cvn_0.5.100.784.tri

> classes/LOG


Cuadro 44: Instrucción para crear los árboles de clases de regresión
Todos los parámetros se han explicado en la Tabla 5 salvo uno que es “regtree128.hed” que es un script para HHEd con las siguientes instrucciones:


LS "../modelos/stats"

RN "rtree"

RC 128 "rtree" {(sil,sp).state[2-4].mix}


Cuadro 45: Script regtree128.hed
Donde las instrucciones que se utilizan son:


    • LS: Se emplea para leer el fichero de estadísticas que se le pasa como parámetro. Este fichero es necesario para realizar algunas operaciones de clustering ya que contiene la cuenta de la ocupación de cada estado del HMM.




    • RN: Renombra el identificador del modelo con el nombre pasado como parámetro.




    • RC: Se utiliza para generar árboles de clases de regresión. Se le pasan tres parámetros:




      • N  Número de nodos terminales del árbol

      • Identificador  Nombre con el que se guarda el nuevo árbol de clases

      • Lista de elementos  Lista con los sonidos “no hablados” que se quieren incluir como pueden ser los modelos de silencios.




  1. Creamos una transformación global con el fin de modificar todas las gaussianas originales de acuerdo con las características globales del locutor.




HERest –a –A –D –V –T 7 –C ../../lib/config/herest2.cvn.mllr0.cfg

-J ../classes –H ../../training/modelos/SpeechDat_Continua_MMF

-B –w 2.0 –m 0 –u a –I ../../lib/lab/%1_train_tri.mlf

–z regc.tmf –K hmm128 mllr0 –h “*/%%%%%%%%%%%%_*.plp”

-S../../lib/flist/%1.scp ../../lib/mlist/lista.cvn_0.5.100.784.tri

> hmm128/LOG



Cuadro 46: Comando para realizar la primera transformación con HERest

En esta llamada a HERest, se utilizan los siguientes parámetros cuya funcionalidad se detalla a continuación:







Compartir con tus amigos:
1   ...   28   29   30   31   32   33   34   35   ...   44


La base de datos está protegida por derechos de autor ©odont.info 2019
enviar mensaje

    Página principal