原神启动原神启动原神启动原神启动
我是纳西妲的狗
第一次接触,感觉很厉害,谢谢
谢谢分享
我是纳西妲的.....
大佬:lol
大佬训练的时候开了dpo没?我看教程说的GPT模型最好不要超过20轮,但好像看分享的模型基本都跑到五六十轮了,我自己怎么好像跑个25轮就已经有明显劣化的趋势了?
路过:lol
哇 好棒 试试{:3_41:}
ykn 发表于 2024-2-18 10:32
大佬训练的时候开了dpo没?我看教程说的GPT模型最好不要超过20轮,但好像看分享的模型基本都跑到五六十轮了 ...
没开,效果感觉和数据集质量的关系很大,发现效果变差的话减小轮次就好了,模型没什么一定要多少轮或者高轮次一定好之类的说法,还是要看实际效果