by Hugging Face
Train models with TRL: SFT, DPO, GRPO, GGUF conversion
Utilizamos cookies para melhorar sua navegação, servir conteúdo personalizado e analisar nosso tráfego.
Necesarias para el funcionamiento
Ayudan a mejorar rastreando el uso
Usadas para publicidad dirigida
cookie_policy