After quantization of facebook/Mbart50 gives empty output

Marsius · October 6, 2022, 5:58am

I am trying to reduce size of 2.4GB mbart model

import torch
from transformers import MBartConfig, MBartForConditionalGeneration


config = MBartConfig.from_pretrained("/content/drive/MyDrive/Translation/modelforquantization/model")


model = MBartForConditionalGeneration.from_pretrained("/content/drive/MyDrive/Translation/modelforquantization/model",config=config)
model.eval()
quantized_model = torch.quantization.quantize_dynamic(model, {torch.nn.Linear}, dtype=torch.qint8)
print(quantized_model)
torch.save(quantized_model.state_dict(), "/content/drive/MyDrive/Translation/newww_new_quant.bin")'''

> This code reduced the size to 1.53GB but when I tried inference the output was just empty string.

Topic		Replies	Views
Help my model return the expected data Models	2	136	November 18, 2024
How to export facebook/mbart-large-50-many-to-many-mmt to TorchScript format? Beginners	8	52	December 17, 2024
Using ONNX format of the facebook/mbart-large-50-many-to-many-mmt? Intermediate	2	42	June 23, 2025
Incorrect model ``stas/tiny-wmt19-en-ru`` Models	1	313	May 3, 2021
How to export facebook/mbart-large-50-many-to-many-mmt to ONNX format? Beginners	3	39	December 17, 2024

After quantization of facebook/Mbart50 gives empty output

Related topics