Jupyter notebook hangs when creating TrainingArguments

kllisre · October 5, 2023, 4:36pm

Hello, when I use the TrainingArguments my notebook freezes permanently.

from transformers import TrainingArguments


training_args = TrainingArguments(
    output_dir="./checkpoints",
    learning_rate=2e-5,
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
    num_train_epochs=2,
    weight_decay=0.01,
    evaluation_strategy="epoch",
    save_strategy="epoch",
    load_best_model_at_end=True
)

The previous code runs without problems.

nvidia-smi:

Thu Oct  5 16:25:58 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.125.06   Driver Version: 525.125.06   CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  N/A |
|  0%   32C    P8    16W / 250W |     16MiB / 11264MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
+-----------------------------------------------------------------------------+

transformers[torch]==4.34.0

The same issue

Topic		Replies	Views
Program hangs when creating a transformers.TrainingArguments object 🤗Transformers	2	428	April 23, 2024
Trainer.evaluate() freezing 🤗Transformers	3	488	August 23, 2024
Mutli GPU freezes on Roberta Pretraining Beginners	6	2063	July 11, 2022
Trainer freezes after all steps are complete (multi-gpu setting) 🤗Transformers	4	1527	February 14, 2024
Trainer.train() hangs with multiple GPUs (but GPUs show activity) Beginners	4	810	October 31, 2024

Jupyter notebook hangs when creating TrainingArguments

Related topics