Host memory still occupied after huggingface model deleted

leevan · August 24, 2023, 4:11pm

import torch
from transformers import AutoConfig, AutoTokenizer, BloomForCausalLM, AutoModelForCausalLM
import time
import psutil
import gc

def get_host_memory():
memory_allocated = round(psutil.Process().memory_info().rss / 1024**3, 3)
print(“cpu”," memory used total: ", memory_allocated, “GB”)

def load_and_run():
s_ = time.time()
config = AutoConfig.from_pretrained(‘bigscience/bloom-560m’)
model = AutoModelForCausalLM.from_config(config)
e_ = time.time()
print("model loading time: %f " % (e_ - s_))
get_host_memory()
del model
del config

load_and_run()
gc.collect()
for obj in gc.get_objects():
try:
if torch.is_tensor(obj) or (hasattr(obj, ‘data’) and torch.is_tensor(obj.data)):
print(type(obj), obj.size())
except:
pass
get_host_memory()

Expected behavior

right now:
after model loaded:
cpu memory used total: 3.327 GB
after model deleted:
cpu memory used total: 3.364 GB

expected, host memory should be freed after model deleted.

leevan · September 7, 2023, 5:52am

@sgugger could you help to check this quesiton? thank you!

Topic		Replies	Views
Clear GPU memory of transformers.pipeline Beginners	6	23883	March 19, 2025
How is memory managed when loading a model? Beginners	2	6210	July 4, 2023
Cache large models on GPU instances between reboots Spaces	3	856	February 14, 2023
Is model stored in free RAM or available RAM? Beginners	0	166	June 17, 2024
How do I release memory after using AutoModel.from_pretrained() to load model Beginners	5	619	September 24, 2024

Host memory still occupied after huggingface model deleted

Expected behavior

Related topics