Shared Memory in Accelerate

Hameliton · December 30, 2022, 12:01am

Hey, I have a question about how to interact with shared memory and accelerate.

I have been using accelerate to streamline my multi-GPU training, specifically performing distributed training across 4 GPU’s. However, my dataset is very large (40GB) and when it is copied to 4 GPU’s it takes up over 160GB of RAM.

The dataset itself is just a single tensor object that contains the same data across each device. Is there a way to force accelerate to use a single shared memory location for the dataset so that it only takes 40GB of RAM instead of 160GB?

Topic		Replies	Views
Using large dataset with accelerate 🤗Accelerate	0	52	March 6, 2025
How does `datasets.Dataset.map` parallelize data? Beginners	3	3164	August 5, 2024
Using DistributedSampler with accelerate 🤗Transformers	4	354	April 2, 2025
Accelerate natively compatible with datasets 🤗Accelerate	0	33	July 19, 2024
Multigpu precompute dataset map function and share between processes 🤗Accelerate	0	200	July 8, 2024

Shared Memory in Accelerate

Related topics