kaldi-aishell2
2019-03-26 17:15:34 0 举报
AI智能生成
登录查看完整内容
kaldi-aishell2逻辑
作者其他创作
大纲/内容
输入文件
wav.scp
trans.txt
wav
run.sh
可能报错
1.和gmm一样,去看gmm的
2.没有独占gpu会报错,独占一下gpu
1.提取mfcc错误
音频格式错误
处理一下音频格式,16k采样率
音频音量过大
降低一下音量
utt2spk和spk2utt的排序不同
2. 其他错误
输入数据时wav.scp和trans.scp的音频名不对应
2. utt2spk和spk2utt的排序不同
3. 文件缺失
4. 语料过少
5. 还可能遇到很多其他的问题,内存不足什么的,查一下
预先准备和说明
prepare_all
prepare_dict
prepare_data
train
test
dev
prepare_lang
L.fst
train_lms
lm_unpruned.gz
format_lm
G.fst
数据处理
中间结果
utt.list
wav_utt.list
trans_utt.list
wav.list
等等一大堆不写了自己看
最终结果
text
spk2utt
utt2spk
run_gmm
stage1:make mfcc
feats.scp
stage2:train_mono.sh
exp/momo_ali
tree
final.mdl
exp/momo
decode_dev
scoring_kaldi
best_cer
cer_detail
per_utt
decode_test
stage3:tir1,train_deltas.sh
exp/tri1_ali
exp/tri1
exp/tri2_ali
exp/tri2
exp/tri3_ali
exp/tri3
run_tdnn
stage5:make_mfcc
mfcc_hires
stage6: UBM PCA iVector
exp/chain/ivectors_train_all
diag_ubm_all
extractor_all
stage7:align_fmllr_lats
exp/tri4_sp_lats
stage8:steps/nnet3/chain/gen_topo.py
stage9:bulid_tree
exp/chain/tri4_cd_tree_sp
stage10:steps/nnet3/xconfig_to_configs
exp/chain/tdnn_1b_all_sp/configs
stage11:steps/nnet3/chain/train.py
exp/chain/tdnn_1b_all_sp/final.mdl
stage12:mkgraph.sh
exp/chain/tdnn_1b_all_sp/graph/HCLG.fst
stage13:decode
exp/chain/tdnn_1b_all_sp/decode_dev
exp/chain/tdnn_1b_all_sp/decode_test
结果
路径下/scoring_kaldi/best_cer
错误率
路径下/scoring_kaldi/cer_details/per_utt
识别内容结果
show_results
tdnn模型需要独占gpu
如果gpu实在不足
子主题
nvidia-smi -c 3
独占gpu
nvidia-smi -c 0
恢复默认gpu
若使用远程链接服务器运行需要开启后台screen,不然链接断掉整个gg
screen -S name
建立后台进程,远程链接这边断掉也可以再连回去
screen -r name
重新登入后台进程
screen -ls
查看所有后台进程
测试可以只使用tdnn模型测试
运行中断可以修改stage来跳过之前跑过的步骤,注意gmm的stage要在run.sh里面改
如果有其他我不知道的错误自己搜一下吧
绿色标签为语言模型需要的步骤,跑语言模型可以只跑这些
收藏
0 条评论
回复 删除
下一页