Access Hidden States in Custom Loss Function in Finetuning

melhoushi · November 18, 2024, 4:52am

When using SFTTrainer how can I create a custom loss function (as descirbed here) that can access hidden states of a model.

I know hidden states can be accessed if we pass output_hidden_states=True to the model’s forward call (as described here). So maybe another version of my question is how can we make SFTTrainer output hidden states?

Topic		Replies	Views
Supervised Fine-tuning Trainer - Loss function calculation Beginners	0	3329	September 6, 2023
SFTTrainer Loss function Beginners	2	4662	July 8, 2024
Supervised Fine-tuning Trainer - Custom Loss Function 🤗Transformers	3	4541	November 7, 2024
MaskedLMOutput does not have last_hidden_state 🤗Transformers	0	1615	May 27, 2021
Hidden states embedding tensors 🤗Transformers	5	3997	July 22, 2023

Access Hidden States in Custom Loss Function in Finetuning

Related topics