Sagemaker MultiRecord Inference Not Completing

agtm48 · June 21, 2024, 7:02pm

Hi,
I’m working on using batch transform for a HuggingFace-hosted LLM. I can’t use the MultiRecord strategy for some reason, as it just ends up only performing inference on a few entries, and skips the rest in my .jsonl.

huggingface_model = HuggingFaceModel(
    env=hub,  # configuration for loading model from Hub
    role=role,
    image_uri=get_huggingface_llm_image_uri("huggingface", version="2.0.2"),
)

batch_job = huggingface_model.transformer(
    instance_count=1,
    instance_type='ml.g5.2xlarge',
    output_path=s3_output_data_path,
    strategy='MultiRecord'  # or 'SingleRecord' depending on your use case
)

batch_job.transform(
    data=s3_input_data_path,
    content_type='application/json',
    split_type='Line',
    wait=True
)

I’d greatly appreciate it if someone could provide some feedback on this issue.

Topic		Replies	Views
Error using 'MultiRecord' in batch transform Amazon SageMaker	2	1252	May 29, 2022
Running batch transform in Sagemaker on a Huggingface model from the Hub with parameters Beginners	2	1746	February 2, 2023
Batch Transform with strategy='MultiRecord' returns only one line 🤗Transformers	0	415	November 19, 2023
Errors while running a sagemaker batch transform (inference) job Beginners	2	1104	May 15, 2023
Batch_transform Pipeline? Amazon SageMaker	9	3485	September 28, 2021

Sagemaker MultiRecord Inference Not Completing

Related topics