Token level representations

raphaelsty · February 17, 2024, 5:39pm

Hi,

I’d like to get token level representation in output of my encoder.

I know how to do it using MLM based encoder but for my specific use case I only want token level embeddings, i.e hidden states and not MLM logits anymore.

Is there any dedicated module to perform this?

Any help is welcome, thank you.

from transformers import AutoModelForMaskedLM, AutoTokenizer

model = AutoModelForMaskedLM(...)

output = model(**encoded_input)

# Hidden state
output.hidden_states[-1] # I need this

# MLM logits
output.logits # I don't need this anymore and I want to avoid this computation to save time.

Topic		Replies	Views
Getting the same embedding from llama 2 class token for any input 🤗Transformers	1	1287	December 4, 2023
Unexpected result from transformer model prediction Beginners	0	288	November 21, 2021
Get each generated token last layer hidden state 🤗Transformers	3	43	March 16, 2025
How to get token-embeddings of input with decoder-only models? Beginners	1	495	September 20, 2024
The hidden_states when i use model.generate 🤗Transformers	4	1845	March 28, 2025

Token level representations

Related topics