Roberta hidden_states[0] == Bert pooler_output?

81Yuji · July 25, 2022, 7:42am

I want to feed the last layer hidden state which is generated by RoberTa.

out = pretrained_roberta(dummy_input[“input_ids”],
dummy_input[“attention_mask”], output_hidden_states=True)

out = out.hidden_states[0]
out = nn.Dense(features=3)(out)

Is that equivalent to pooler_output in Bert?

pooler_output (torch.FloatTensor of shape (batch_size, hidden_size)) — Last layer hidden-state of the first token of the sequence (classification token) after further processing through the layers used for the auxiliary pretraining task.

Topic	Replies	Views
MaskedLMOutput does not have last_hidden_state 🤗Transformers	1632	May 27, 2021
Difference between CLS hidden state and pooled_output? Beginners	1510	March 28, 2022
Roberta Model concat last hidden layers 🤗Transformers	608	April 10, 2023
Question about last_hidden_state of the bert model Beginners	332	December 7, 2023
For tuning a classifier head on a pretrained BERT should I use `last_hidden_state` or `outputs[0][:, 0, :]` from the BERT? Beginners	180	February 15, 2024

Roberta hidden_states[0] == Bert pooler_output?

Related topics