-inf values for logit score outputs with model.generate

vinusankars · December 27, 2023, 3:52am

I have been trying to obtain the logit values for each token output as follows. However, the output that I get is a vector with -inf in all positions except at the position of the predicted token. This is observed when generation_config.do_sample = True. When generation_config.do_sample = False, the output that I get is a vector with definite values in it.

I am confused since I thought the values when do_sample=True should be definite and not -inf for any non-deterministic token sampling to work well.

Can someone please explain why this is happening?

Here is the code:

from transformers import AutoTokenizer, AutoModelForCausalLM

name = "meta-llama/Llama-2-7b-chat-hf"
tokenizer = AutoTokenizer.from_pretrained(name)
model = AutoModelForCausalLM.from_pretrained(name, device_map='auto')

model.generation_config.do_sample = True
model.generation_config.temperature = 0.6

sen = "[INST] What is Sun? [/INST]"

output = model.generate(**tokenizer(sen, return_tensors='pt').to(0), max_length=20, output_scores=True, return_dict_in_generate=True)    
print(output.scores)

Output screenshot:

mbismay · May 2, 2024, 7:28pm

Same issue! Could anyone please explain how to tackle this?

LazerLambda · September 20, 2024, 12:02am

Same problem here! Any solutions yet?

Kripi · January 2, 2025, 3:40pm

To get raw logits, pass output_logits instead of output_scores to generate() and use output.logits.

Topic		Replies	Views
How can I obtain the logits via model.generate()? 🤗Transformers	2	2707	October 8, 2024
Can I get logits for each sequence I acqired from model.generate()? Beginners	1	1301	November 27, 2020
How to get the logits for the T5 model when using the `generate` method for inference? Beginners	3	5159	April 18, 2023
[Announcement] Generation: Get probabilities for generated output 🤗Transformers	63	40638	January 20, 2025
Inconsistency in logit values between generation and direct model prediction #31127 🤗Transformers	0	212	May 30, 2024

-inf values for logit score outputs with model.generate

Related topics