-
Notifications
You must be signed in to change notification settings - Fork 137
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 #166
Comments
换yolov8s也是同样的问题 |
前几个epoch精度正常吗?前面训练的也截图下。训自己数据集注意加载coco权重做预训练。 |
https://github.com/PaddlePaddle/PaddleYOLO/blob/release/2.6/configs/yolov8/_base_/yolov8_cspdarknet.yml#L2 |
不知道我说得对不对。 V8这些训练问题,是不是assign的问题,或者说选择回归的loss点太多了(没有处理postive sample 和 negative sample)。造成起始的cls_loss这么大! [07/18 00:44:35] ppdet.engine INFO: Epoch: [0] [ 0/3665] eta: 81 days, 15:43:15 lr: 0.000000 loss: 1312362.750000 loss_cls: 1312202.375000 loss_iou: 160.321213 loss_dfl: 0.000000 loss_l1: 53.665325 batch_cost: 3.8499 data_cost: 0.0013 ips: 8.3118 images/s |
这个起始loss_cls这么大明显是初始化的问题,你是改了初始化的相关代码吗。先按coco数据集训下看正常的情况,自定义数据集如果训的不正常,应该先排查数据集制作的问题。 |
我找找,我应该没有改的,就改了head
…---原始邮件---
发件人: "Feng ***@***.***>
发送时间: 2023年7月18日(周二) 中午12:47
收件人: ***@***.***>;
抄送: ***@***.******@***.***>;
主题: Re: [PaddlePaddle/PaddleYOLO] YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 (Issue #166)
这个起始loss_cls这么大明显是初始化的问题,你是改了初始化的相关代码吗。先按coco数据集训下看正常的情况,自定义数据集如果训的不正常,应该先排查数据集制作的问题。
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
未更改初始化,而且在训练前还重新拉取的最新代码。 仅将forward_train\forward_eval\get_loss代码进行了修改 |
数据集应该没问题,跑了ppyoloe,yolof,v3,v5 |
我将ppyoloe的head的DFL去掉,训练正常; |
分享一个我的解决方案,不用paddleyolo,讲yolov8那几个Python文件放到对应的paddledetection里面去,你参考ppyoloe,这样是没问题的,保险一点就是所以的除了head按照以上操作,改ppyoloe的head,也可以不改,因为head不是这俩模型的主要差别,我目前就是这么玩通的。
不改head是因为里面涉及标签分配,loss计算等一大堆内容,这样又可能一堆小问题出现。
ps:fpn输出这俩模型不一样,一个是4 3 2,另一个是2 3 4,顺序是反着的,这地方需要修改一下。
…---原始邮件---
发件人: ***@***.***>
发送时间: 2023年9月7日(周四) 下午2:51
收件人: ***@***.***>;
抄送: ***@***.******@***.***>;
主题: Re: [PaddlePaddle/PaddleYOLO] YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 (Issue #166)
我用yolov8s也出现同样的问题,从11epoch开始,loss为0 而且前面10epoch后eval全为0,加载了coco权重做预训练,用的是aistudio上的A100资源
hi~,我也遇到了同样的问题,训练自己的数据集,加载了预训练权重,使用bs=16单卡训练,在第3个epochloss变0,跟你发出来的情况几乎一样。请问最后有解决办法嘛
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
大佬可以交流一下嘛,PPYOLO要求paddle2.4以上,我目前用的ppdetection是2.3,这个可以直接把代码迁移过去嘛 |
应该问题不大。你就迁移backbone和fpn的嘛,没啥特别的操作。
…---原始邮件---
发件人: ***@***.***>
发送时间: 2023年9月7日(周四) 下午3:16
收件人: ***@***.***>;
抄送: ***@***.******@***.***>;
主题: Re: [PaddlePaddle/PaddleYOLO] YOLOv8m训练自己的数据集,几个epoch后loss变0。3090ti,单卡,调整了学习率,取消了mosaic增强。 (Issue #166)
大佬可以交流一下嘛,PPYOLO要求paddle2.4以上,我目前用的ppdetection是2.3,这个可以直接把代码迁移过去嘛
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
感谢建议,后续会排查下这个问题。 |
问题确认 Search before asking
请提出你的问题 Please ask your question
The text was updated successfully, but these errors were encountered: