by Hugging Face
Train models with TRL: SFT, DPO, GRPO, GGUF conversion
Utilizziamo i cookie per migliorare la navigazione, fornire contenuti personalizzati e analizzare il traffico.
Necesarias para el funcionamiento
Ayudan a mejorar rastreando el uso
Usadas para publicidad dirigida
cookie_policy