Happytransformer Inference on dataset

sowmiyan · May 12, 2022, 3:13pm

0

I am running T5-base-grammar-correction for grammer correction on my dataframe with text column

from happytransformer import HappyTextToText
from happytransformer import TTSettings
from tqdm.notebook import tqdm
tqdm.pandas()

happy_tt = HappyTextToText("T5",  "./t5-base-grammar-correction")
beam_settings =  TTSettings(num_beams=5, min_length=1, max_length=30)
def grammer_pipeline(text):
    text = "gec: " + text
    result = happy_tt.generate_text(text, args=beam_settings)
    
    return result.text

df['new_text'] =  df['original_text'].progress_apply(grammer_pipeline)

Pandas apply function, though runs and provides required results, but runs quite slow .

Also I get the below warning while executing the code

/home/.local/lib/python3.6/site-packages/transformers/pipelines/base.py:908: UserWarning: You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset
  UserWarning,

How to use Dataset to speed up things?

LycheeX · January 31, 2023, 6:40am

I have the same problem , have solved this ?
pls help me ? type your codes ?

Topic		Replies	Views
Pipeline inference with Dataset api 🤗Transformers	5	12038	November 15, 2023
Very low GPU usage when translating text, datasets not helping 🤗Transformers	3	5814	July 12, 2022
Error in fine tuning T5 model for Seq2Seq translation task 🤗Transformers	3	1255	November 25, 2023
Fine-tuning sentence-transformer for retrieval task makes things worse Beginners	0	1720	July 25, 2023
What can I do to optimize this process? Beginners	0	300	November 20, 2022

Happytransformer Inference on dataset

Related topics