Is it necessary to create model in model.tar.gz format for deployment over amazon sagemaker

abhibisht89 · August 1, 2023, 10:30am

I am trying to deploy a custom data fine tune llam2 model over amazon sagemaker .
However the model compression is taking a lot more time , Just want to know is it possible to use an uncompressed model dir .

huggingface_model = HuggingFaceModel( 
    image_uri=get_huggingface_llm_image_uri("huggingface",version="0.8.2"),
    model_data="s3_path",  
    role=role,  
    transformers_version='4.28',  
    pytorch_version='2.0',  
    py_version='py310', 
    env=hub
)

can we use uncompress model dir for “s3_path” ?

Dennison33 · February 28, 2024, 6:11am

We also have the same question, we can see from Sagemaker API this is allowed but not necessarily using the hugging face model. See Deploying uncompressed models - Amazon SageMaker

Does anyone know if the uncompressed approach can be used with a hugging face model deployment?

Topic		Replies	Views
Deploying Mixtral8x7B on AWS Sagemaker from S3 Amazon SageMaker	2	486	June 11, 2024
Loading inference.py separately from model.tar.gz Amazon SageMaker	4	1853	June 5, 2023
Use my finetuned Bert Model in SageMaker BatchTransform Amazon SageMaker	4	2974	April 30, 2022
Sagemaker deployment fails for local llama2 model Amazon SageMaker	3	2270	August 17, 2023
How to Create Model in SageMaker Console from .tar.gz Amazon SageMaker	7	10323	March 10, 2022

Is it necessary to create model in model.tar.gz format for deployment over amazon sagemaker

Related topics