How to get the Trainer API to use GPU?

martinmin · May 21, 2021, 6:57pm

I am following this pretrain example, but I always get the Cuda: out of memory error, although I have 2 GPU available with 16GB memory each.

And the code is below, exactly copied from the tutorial:
from datasets import load_dataset
from transformers import AutoTokenizer
from transformers import AutoModelForSequenceClassification
from transformers import TrainingArguments
from transformers import Trainer
from torch.utils.data import DataLoader
from datasets import load_metric

    def tokenize_function(examples):
        return tokenizer(examples["text"], padding="max_length", truncation=True)

    raw_datasets = load_dataset("imdb")
    tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")

    tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
    small_train_dataset = tokenized_datasets["train"].shuffle(seed=42).select(range(1000))
    small_eval_dataset = tokenized_datasets["test"].shuffle(seed=42).select(range(1000))
    full_train_dataset = tokenized_datasets["train"]
    full_eval_dataset = tokenized_datasets["test"]

    model = AutoModelForSequenceClassification.from_pretrained("bert-base-cased", num_labels=2)
    training_args = TrainingArguments("test_trainer")

    trainer = Trainer(
        model=model, args=training_args, train_dataset=small_train_dataset, eval_dataset=small_eval_dataset
    )

    trainer.train()

Is there any configuration to use the GPU with the Trainer API? If I use the native version of the PyTorch pretrain tutorial example, the GPU is used correctly.

Topic		Replies	Views
Cuda out of memory while using Trainer API Beginners	1	1760	October 20, 2021
Is Transformers using GPU by default? Beginners	6	154646	December 11, 2023
Using 3 GPUs for training with Trainer() of transformers 🤗Transformers	2	2297	October 18, 2023
Can I use CUDA with Trainer.train? Beginners	3	7906	May 10, 2022
Multi GPU Training with Trainer and TokenClassification Model 🤗Transformers	0	1520	July 21, 2023

How to get the Trainer API to use GPU?

Related topics