⌘Ctrlk

Powered by GitBook

On this page

LLMs

LLM Post-training

Llama Post-training

Multiple rounds of SFT+DPO
Llama models card

PreviousLLM Techniques NextInference/Test Time Scaling

Last updated 1 year ago