Train large models on large datasets by parts

Constantin · April 24, 2021, 7:03am

Hi

It is not possible to train large xlm-roberta model on large datasets for token classification due to GPU memory using run_ner.py

But what if I split my dataset into parts? Is it okay for run_ner.py script? I just think that result will be worse.

Topic		Replies	Views
The most efficient way for predictions(zero-shot classification) on huge dataset Beginners	0	527	July 6, 2022
Training RoBERTa on a large corpus 🤗Transformers	5	3341	August 25, 2020
Pre-training a language model on a large dataset 🤗Transformers	5	3876	March 15, 2022
Re-Training with new number of classes 🤗Transformers	2	1044	January 3, 2022
RuntimeError: CUDA out of memory. Tried to allocate 384.00 MiB (GPU 0; 11.17 GiB total capacity; 10.62 GiB already allocated; 145.81 MiB free; 10.66 GiB reserved in total by PyTorch) Beginners	8	27443	December 10, 2023