如何进一步优化在线训练平台上自己训练出来的模型

Viewed 44

屏幕截图 2025-06-27 224055.png
这是我的训练截图,训练次数200次,数据大小为16,loss在0.155左右
屏幕截图 2025-06-27 230218.png
这是我训练出来的模型文件里的det_results里的测试集,基本上都识别出来了,虽然跟我做标注时的颜色不一样,但是上面显示的数字是对的,基本准确率都在80%以上甚至90%
但是我在后面按照示例代码将标签和anchor修改后,调用模型时发现实际效果并不是很准,大部分数字准确率能达到80%,但是有几个数字准确率只有40%到50%如5跟7,就是我得把阈值调很低才能识别出来,但是把阈值调低又可能会让某些数字混淆如3和8,我不知道为什么训练出来是这个效果,我对此不是很满意想进一步优化,那么请问我还能做哪些调整呢?
我上传的图像数据集一开始是4000张,8个数字每个数字500张,用K210拍的320*240像素照片,后来训练时一直失败显示通信异常啥的,看到平台上最大只能上传1000张照片就改成8个数字每个数字125张,我现在在想会不会是数据集太小了的问题,同时我看到有些帖子说确实可以上传1000张以上的照片,所以我的第一个问题是:能否扩大数据集?最多能支持多少张图片,多少张图片最优
然后我的训练次数选择的是200次,数据量大小选择的16,因为之前选择300次数或24大小好像都失败了,显示网络通信异常,但是听说越多次数数据量越大训练效果越好,所以我的第二个问题是:训练参数上还能否做优化?
我的K210最大能支持VGA(640x80)照片但是LCD显示屏最大为320x240,平台要求照片像素在320x240以上,所以我的第三个问题是:能否采用VGA图片,效果会不会更好一点?
希望有知道的或训练过相关模型的朋友能够解答我的疑惑,谢谢

1 Answers

因为det_results中的图片是使用训练后的模型直接测试的,而板子上的代码是使用量化后的kmodel做的,应该会有一定的性能损失。看训练曲线,训练过程是没问题的,loss基本上都快接近于0了。你需要确认一下采集的训练数据是否和部署测试的时候的图片差不多,比如你采集只采了一个角度,固定距离的,但是测试的时候你出现其他角度的图片或者里的更远可能会对结果有影响。图片分辨率大了应该会好一些,但是帧率会变低。

我测试的数字摆放位置和训练的图片是一致的,只是个别数字无法得到较高的准确率,那么如果我想要它能够针对不同角度不同距离也能识别的话,就要训练不同角度的更多图片,目前是8个数字每个数字125张,我觉得太少了,想知道能不能扩大数据集照片数量呢,最大能支持多少,另外还有必要增加迭代次数和数据量大小嘛

这个场景很简单,1000张完全足够,迭代次数也可以适当增加到300试试。另外也可以适当补充一些难识别的图片,以压缩包的形式上传是不受图片张数影响的,不过你要先处理成要求的格式。