Loading inference.py separately from model.tar.gz

augustindal · March 22, 2023, 11:04am

It is possible to give only the inference.py script if you have your model.tar.gz in s3. Not sure if it works with hub.

When you create the HuggingFaceModel() object, give it source dir (local folder where inference.py script is), entry point (inference.py) and model_data (s3 url).

Then next time you do HuggingFaceModel.deploy() it will use the inference script from your local folder and the model from s3.

Topic		Replies	Views
Inference Toolkit - Init and default template for custom inference Amazon SageMaker	12	2206	October 4, 2021
Help for inference.py code Amazon SageMaker	10	4043	March 8, 2022
Inference Toolkit - custom inference with multiple models Amazon SageMaker	1	647	April 4, 2024
How to quickly change the inferece.py for an endpoint on AWS SagemMaker Amazon SageMaker	1	788	December 2, 2022
SageMaker Inference for Model Tuned Elsewhere Amazon SageMaker	4	1095	September 2, 2021

Loading inference.py separately from model.tar.gz

Related topics