🤗Transformers

Topic	Replies	Views	Activity
Fine Tuning GPT2 for machine translation 🤗Transformers	1	4720	May 2, 2021
DataCollator vs. Tokenizers 🤗Transformers	1	3734	May 1, 2021
Dataset for training BlenderBot 🤗Transformers	1	2490	May 1, 2021
Could I inference the Encoder-Decoder model without specify "decoder_input_ids"? 🤗Transformers	4	2442	May 1, 2021
How to only finetune the last layer of ALBERT? 🤗Transformers	4	4034	April 30, 2021
TFTrainer.train() stucks into infinite loop 🤗Transformers	0	404	April 29, 2021
Marian MT half precision inference 🤗Transformers	0	409	April 29, 2021
Adding more information on Trainer state 🤗Transformers	2	302	April 29, 2021
How to specify sequence length when using "feature-extraction" 🤗Transformers	3	1294	April 28, 2021
Eval freezes on local multi GPU Deepspeed run DeepSpeed	4	2878	April 28, 2021
RuntimeError: CUDA error: device-side assert triggered 🤗Transformers	1	2483	April 28, 2021
[Deepspeed] ZeRO-Infinity integration released and config changes DeepSpeed	2	2291	April 28, 2021
Append a linear layer on top of the vanilla Electra model 🤗Transformers	1	370	April 27, 2021
Getting random results with BERT 🤗Transformers	3	913	April 27, 2021
[Deepspeed ZeRO-Infinity] looking for NVMe device benchmarks DeepSpeed	0	1182	April 26, 2021
Large max differences between single input processing and batching with Bert and T5 🤗Transformers	0	550	April 26, 2021
Prohibit GPT-2 from generating some words on a condition 🤗Transformers	7	1105	April 25, 2021
Model for Scandinavian sentiment analysis 🤗Transformers	0	499	April 25, 2021
RobertaTokenizer: How to enable masking of custom special tokens 🤗Transformers	1	967	April 24, 2021
PEGASUS (CNN / DailyMail) model doesn't summarize this input 🤗Transformers	0	438	April 24, 2021
How to separate the parameters of a transformer into groups? 🤗Transformers	0	271	April 23, 2021
BartForConditionalGeneration with PubMedBERT/Bio_ClinicalBERT tokenizer 🤗Transformers	0	259	April 22, 2021
Model loading and saving seems to change the model file 🤗Transformers	0	389	April 22, 2021
Mixed precision for bfloat16-pretrained models 🤗Transformers	2	12181	April 21, 2021
Run_mlm.py cuda error memory after resuming a training 🤗Transformers	4	2896	April 21, 2021
Get output embedding of FeatureExtractor 🤗Transformers	1	701	April 20, 2021
Error when finetuning pretrained huggingface conv-ai chatbot model 🤗Transformers	2	812	April 19, 2021
LongBlender embedding positions mismatch 🤗Transformers	0	521	April 19, 2021
ASR: Offset and probability 🤗Transformers	2	324	April 19, 2021
Training PEGASUS on unlabeled data 🤗Transformers	0	390	April 16, 2021