Skip model repacking in Batch Transform

jparmet · August 15, 2023, 6:51pm

Hi,

I have a HuggingFace Model that I’ve already loaded from the tar.gz in S3 to SageMaker. When instantiating a batch transform job I seemingly have to repack the model every time, which results in ~5 minutes of time Repacking model artifact before the console lets me know that it’s Using already existing model: topic-model.

Does anyone know if there’s a way to skip model repacking and default to using the existing model?

Here’s the code I’m using to instantiate (within a custom class, hence self):

        self.model = HuggingFaceModel(
            env=hub,
            model_data=s3_path_join('s3://', self.bucket, f"{self.model_type}_model.tar.gz"),
            entry_point=entry_point,
            role=self.role,
            transformers_version="4.28.1",
            pytorch_version="2.0.0",
            py_version="py310",
            name=f"{self.model_type}-model"
        )
...
        batch_job = self.model.transformer(
            instance_count=instance_count,
            instance_type=instance_type,
            output_path=s3_path_join('s3://', self.bucket, 'output'),
            strategy='MultiRecord',
            assemble_with='Line')

Topic		Replies	Views
Create batch transform with existing model Amazon SageMaker	0	653	January 8, 2023
Create a batch transform job with custom trained biobert model Amazon SageMaker	15	2045	February 22, 2022
Use my finetuned Bert Model in SageMaker BatchTransform Amazon SageMaker	4	2975	April 30, 2022
No space left on device when trying to run batch inference - HF not using EBS storage? Amazon SageMaker	2	1012	February 3, 2022
Batch_transform Pipeline? Amazon SageMaker	9	3441	September 28, 2021

Skip model repacking in Batch Transform

Related topics