T5 Inference using tensorflow_model_server (with grpc)

ndvb · January 29, 2023, 8:48am

Any examples of how to grpc call a tensorflow_model_server running a T5 model?

What I did so far is:

Saving a model in torch format using: model.save_pretrained(“local-pt-checkpoint”)
Convert the saved model to ONNX using: python -m transformers.onnx --model=local-pt-checkpoint --opset=13 onnx/
Convert the ONNX to tf using: onnx-tf convert -i onnx/model.onnx -o tf_export
Run the model server using: tensorflow_model_server --port=9000 --model_name=my_model --model_base_path=./t5-base/tf_export/.

Now I just need to find some example code of how to call the model server.

Topic		Replies	Views
How to load finetuned model in TF Beginners	2	450	September 28, 2020
Saving a model and loading it Models	3	57671	July 5, 2024
Using PyTorch model in TensorFlow 🤗Transformers	2	2244	June 7, 2023
Helsinki-NLP/opus-mt-en-fr missing tf_model.h5 Course	2	1153	January 17, 2022
Boost inference speed of T5 models up to 5X & reduce the model size by 3X 🤗Transformers	2	5599	June 8, 2023