问题描述
只训练一个唤醒词,训练时第一轮acc就到1了,导出的kmodel文件无法识别,用官方提供的kmodel倒是可以正常识别,可以排除是硬件问题。训练时提供了500条15s秒的wav文件(16kHz / 16bit,wav_from_k230.zip),通过训练脚本拆分后得到约2500条含有单个唤醒词的样本,音频样本抽测过均正常。
复现步骤
1、将wav_from_k230.zip文件放置在speechcommand_v1文件夹内,zip文件的目录为:wav_from_k230.zip->wav_from_k230->xiaozhixiaozhi->xiaozhi_n.wav,同时在speechcommand_v1内下载了speech_commands_v0.01.tar.gz负样本数据。
2、在s0目录下运行./run.sh -1 5 "/root/K230_training_scripts/end2end_kws_doc/" xiaozhixiaozhi 2 0 之后第一轮就出现了过拟合的现象。