Is hf supports split multiple sents into one sequence with <eos> when trainning gpt ，so that receive compute resources

hiha · September 16, 2022, 9:58am

Like metraon-lm [ltor](https://github.com/NVIDIA/Megatron-LM/blob/0bb597b42c53355a567aba2a1357cc34b9d99ddd/megatron/utils.py#L146) implementation，
i found gpt2 in hf only support casual attention mask.

Topic		Replies	Views
Dynamic attention mask during GPT-2 training 🤗Transformers	0	856	December 11, 2020
Issues with translating inputs containing repeated phrases 🤗Transformers	1	1554	September 9, 2020
Transformers v3.0.0 is out! 🤗Transformers	0	1956	July 7, 2020
GPT-GPT encoder decoder 🤗Transformers	0	294	May 4, 2021
Separation token in GPT for text similarity/question answering Models	2	1472	March 23, 2021

Is hf supports split multiple sents into one sequence with <eos> when trainning gpt ，so that receive compute resources

Related topics