Why is the following condition checked after obtaining `outputs`?

daoer · July 2, 2024, 9:36am

Why is this condition checked after the outputs are generated? Is this considered a form of resource wastage?

        while self._has_unfinished_sequences(this_peer_finished, synced_gpus, device=input_ids.device):
            # prepare model inputs
            model_inputs = self.prepare_inputs_for_generation(input_ids, **model_kwargs)

            # forward pass to get next token
            outputs = self(
                **model_inputs,
                return_dict=True,
                output_attentions=output_attentions,
                output_hidden_states=output_hidden_states,
            )

            if synced_gpus and this_peer_finished:
                continue  # don't waste resources running the code we don't need

The code comes from transformers/generation/utils.py:GenerationMixin._sample

Topic		Replies	Views
How to generate without decoding? 🤗Transformers	1	372	December 13, 2023
Prevent repeat tokens in GPT2LMHeadModel text generation with max_new_tokens=1 Beginners	0	1119	November 19, 2021
CUDA OOM on model(inputs) but not on model.generate(inputs), but doesn't generate use model(inputs)? Intermediate	4	256	May 4, 2024
Encoder Decoder Model gives same generation results after finetuning 🤗Transformers	2	664	August 4, 2022
Model.generate generates same output for different inputs 🤗Transformers	1	623	November 13, 2023

Why is the following condition checked after obtaining `outputs`?

Related topics