treinamentosphinxtrain-140521075026-phpapp02
-
Upload
leonardo-jesus -
Category
Documents
-
view
218 -
download
0
Transcript of treinamentosphinxtrain-140521075026-phpapp02
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
1/16
Sphinx Voxforge Pt-BrTreinando um modelo acstico para o toolkit
CMU Sphinx com o corpus de fala Voxforge
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
2/16
O que precisamos para treinar?
Arquivos de udio e suas respectivas transcries
Arquivos .raw, .sph, .wav
amanh chove forte Dicionrio fontico
e um alfabeto fontico
mapeamento palavrasequncia de fonemas
Modelo Lingustico necessrio para a avaliao do modelo
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
3/16
CMU Sphinx Toolkit
Pocketsphinx reconhecedor leve (em C)
Sphinxbase biblioteca de suporte ao Pocketsphinx
Sphinx4 reconhecedor flexvel e customizvel (em Java)
Sphinxtrain ferramenta de treinamento de modelo acsticos
Sphinx3
reconhecedor desatualizado (em C) CMUclmtk
toolkit para o treinamento do modelo lingustico
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
4/16
Pr-requisitos...
Perl ActivePerl no Windows
Linux
~$ sudo apt-get install perl(debian-based)~$ sudo yum install perl(RPM repo-based)
Python ActivePython no Windows
Linux
~$ sudo apt-get install python(debian-based)
~$ sudo yum install python(RPM repo-based)
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
5/16
Agora vamos instalar...
baixe os pacotes .tar.gz sphinxbase-0.8
pocketsphinx-0.8
sphinxtrain-1.0.8 extrair os pacotes e entrar no diretrio
~$ tar -zxf
~$ cd /
executar os comandos...~$ ./autogen.sh
~$ ./configure
~$ make
~$ make install
http://sourceforge.net/projects/cmusphinx/files/sphinxtrain/1.0.8http://sourceforge.net/projects/cmusphinx/files/sphinxbase/0.8/http://sourceforge.net/projects/cmusphinx/files/sphinxtrain/1.0.8http://sourceforge.net/projects/cmusphinx/files/pocketsphinx/0.8http://sourceforge.net/projects/cmusphinx/files/sphinxbase/0.8/ -
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
6/16
Variveis de ambiente...
export PATH=/usr/local/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/lib
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
7/16
Estrutura das pastas
etc nome_db.dic
nome_db.phone
nome_db.lm.DMP
nome_db.filler
nome_db_train.fileids
nome_db_train.transcription
nome_db_test.fileids
nome_db_test.transcription
wav
speaker_1 file_1.wav
speaker_2
file_2.wav
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
8/16
Voxforge
Repository voxforge Pt - 16kHz, 16bit Pacotes .tgzpara cada locutor
etc
prompts wav
arquivos .wav
http://www.repository.voxforge1.org/downloads/pt/Trunk/Audio/Main/16kHz_16bit/ -
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
9/16
Preparando os diretrios...
baixar e executar scripts~$ git clone https://github.
com/gabrielaraujof/voxforge2sphinxPtBr.git scripts
~$ chmod +x scripts/setupam.py
~$ ./scripts/setupam.py -s voxforge
Copiar os arquivos (disponvel aqui) voxforge.dic (**converter para iso-8859-1)
voxforge.phone
voxforge.filler
Converter e copiar o modelo lingustico voxforge.lm.DMP (formato ARPA aqui)
Primeiramente deve-se ordernar com o comando: sphinx_lm_sort < 3gram.lm > 3gram_sorted.lm
http://www.laps.ufpa.br/falabrasil/files/constituicao_sphinx.rarhttp://www.laps.ufpa.br/falabrasil/files/LaPSLM.rarhttp://www.laps.ufpa.br/falabrasil/files/constituicao_sphinx.rar -
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
10/16
Configurar Sphinxtrain...
De dentro da pasta configurada, executar
~$ sphinxtrain -t setup
Editar parmetros de treinamento arquivo etc/sphinx_train.cfg
$CFG_HMM_TYPE
$CFG_INITIAL_NUM_DENSITIES
$CFG_FINAL_NUM_DENSITIES
$CFG_N_TIED_STATES
Executar o trainamento...
~$ sphinxtrain run
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
11/16
Logs do treinamento...
Arquivo .html links para os logs de cada fase do treinamento
indicaes de erros
resultado da avaliao do modelo
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
12/16
Resumindo...
Executar
~$ ./scripts/setupam.py -s
Copiar restante dos arquivos
Executar
~$ sphinx_train setup
modificar parmetros
Executar~$ sphinx_train run
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
13/16
Observaes
Locutores incompatveis udios e transcries em ingls
Palavras fora do dicionrio
quinta-feira fim-de-semana
-
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
14/16
Resultados
Modelo acstico Sphinx
https://docs.google.com/spreadsheets/d/10eslV99s4bFEQX1Gmdeii234SC0oU76nY7cyYTmIS5A/edit?usp=sharing -
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
15/16
Referncia
http://cmusphinx.sourceforge.
net/wiki/tutorialam
http://cmusphinx.sourceforge.net/wiki/tutorialamhttp://cmusphinx.sourceforge.net/wiki/tutorialam -
7/25/2019 treinamentosphinxtrain-140521075026-phpapp02
16/16
Dvidas e contato
E-mail: [email protected]
mailto:[email protected]