Post-Training

Improves model performance by tailoring responses, refining instructions and optimizing preferences and biases.

Group leaders Eliu A. Huerta and Azton Wells

Eliu Huerta and Azton Wells lead this team, which focuses on model post-training, including supervised fine-tuning, chat/instruction fine-tuning, preference optimization and alignment. Outcomes will include a series of refined and aligned models (Chat/Instruct/Code, etc.) for each raw model.