LaTeX friendly Seq2Seq Model

melembroucarlitos · February 13, 2023, 12:18pm

I was hoping to fine tune T5 on the MATH dataset until I came to realize that it’s tokenizer returned tokens for a lot of LaTeX characters (ie. ,{,}).

Is there a go to Seq2Seq model who’s tokenizer doesn’t experience this problem?

Topic		Replies	Views
Train tokenizer for seq2seq model 🤗Tokenizers	0	340	April 19, 2024
Customizing T5 tokenizer for finetuning 🤗Transformers	1	618	May 2, 2024
T5 decoder predicting tokens even after hitting end of sequence token, i.e </s> 🤗Transformers	4	328	February 26, 2024
Seq2seq decent predict but letter by letter instead of words 🤗Transformers	2	466	August 9, 2022
Keyword generation using T5 Models	4	1990	November 2, 2022

LaTeX friendly Seq2Seq Model

Related topics