cj453
/

dense_reward_trainer_final_opt__NumTrainEpochs5_SaveStrategiesepoch_reward_modeling_anthropic_hh

Generated from Trainer

Model card Files Files and versions

dense_reward_trainer_final_opt__NumTrainEpochs5_SaveStrategiesepoch_reward_modeling_anthropic_hh

5.68 GB

1 contributor

History: 2 commits

cj453's picture

End of training

14b6698 verified over 1 year ago