AIcube用例程训练时出现进程工作异常

Viewed 50

问题描述


image.png
错误界面如图所示

#################
错误log文件
################
2025-11-16 23:41:08,467: INFO AICube.py 154: license校验通过!
2025-11-16 23:41:08,512: INFO AICube.py 161: GPU环境检查通过!
2025-11-16 23:54:01,699: INFO maincontroller.py 4746: CUDA error: an illegal instruction was encountered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
2025-11-16 23:54:01,699: INFO maincontroller.py 4747: 训练线程工作异常!
2025-11-16 23:54:01,700: ERROR maincontroller.py 4748: NoneType: None

硬件板卡


k230视觉模块

多测试了几轮,都是在第四轮出现问题,求大佬解释

看来是随机的,又出现后面的轮次报错的了

模型调小一点(n),图像尺寸调小一点(350)就能完整训练,但是仍不知道如何解决这个问题

1 Answers

什么卡?看着像是底层的问题,显卡驱动和cuda版本是多少?

PS C:\Users\Lenovo\Desktop> nvidia-smi
Mon Nov 17 13:15:07 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 581.57 Driver Version: 581.57 CUDA Version: 13.0 |

RTX4070,佬快救救我,加qq:903599909

cuda版本太新了,我们也没测过这个版本

测试的是哪个版本,我重新下一下试试