Default distributed strategy used in single-node multi-GPU env

mk6 · September 12, 2023, 6:42am

Hi,

It seems that in a single-node multi-GPU env, all GPUs are automatically used. I’m wondering what distributed strategy is used? DP? DDP? I didn’t find any documentation describing related behaviors.

Thanks

Topic		Replies	Views
Multi gpu training 🤗Transformers	3	6028	April 24, 2022
Distributed training on just cpu on a single node 🤗Transformers	0	164	November 21, 2023
Detecting single gpu within each node 🤗Accelerate	2	761	January 17, 2023
Which data parallel does trainer use? DP or DDP? 🤗Transformers	6	6420	August 30, 2025
Can't use multi GPU in evaluation from Trainer 🤗Transformers	3	967	December 6, 2023

Default distributed strategy used in single-node multi-GPU env

Related topics