🤗Transformers

Topic	Replies	Views	Activity
DallE mega use in transformers 🤗Transformers	1	940	August 9, 2022
Confidence Score For Wav2Vec? 🤗Transformers	0	241	August 8, 2022
How to use decoder generation upon features and not token ids? 🤗Transformers	0	220	August 8, 2022
Where to set T5 sep_token? 🤗Transformers	0	799	August 7, 2022
LayoutLMV3 Inference with lot of BBoxes 🤗Transformers	0	1046	August 7, 2022
CUDA RunTime Error during ASR training 🤗Transformers	0	865	August 7, 2022
Fine-Tuning / Pre-Training Tips 🤗Transformers	1	2925	August 5, 2022
How to get Wav2Vec2Processor into Torchscript or through Swift? 🤗Transformers	0	235	August 5, 2022
Missing keys in RobertaForMaskedLM state dict 🤗Transformers	5	2039	August 5, 2022
Freezing first N layers of a transformer model 🤗Transformers	0	931	August 5, 2022
How to concat laserembeddings with huggingface funnel transformers simple CLS output for fine tuning on downstream NLP sequence classification data problem? 🤗Transformers	0	937	August 4, 2022
What if sequence of outputs of ViT is fed into GPT 🤗Transformers	0	268	August 4, 2022
Encoder Decoder Model gives same generation results after finetuning 🤗Transformers	2	654	August 4, 2022
Roberta-base takes too long 🤗Transformers	0	314	August 3, 2022
Retrieving Probability Over Tokens During Beam Search 🤗Transformers	0	541	August 3, 2022
Exporting GPTJ model to onnx is not supported 🤗Transformers	1	864	August 3, 2022
Transformers changelog 🤗Transformers	2	1337	August 3, 2022
Trainer load_best_model f1 score vs. loss and overfitting 🤗Transformers	0	1027	August 3, 2022
Regarding metrics to use in Fine Tuning Masked Language Modeling 🤗Transformers	0	283	August 3, 2022
Questions on distilling [from] T5 🤗Transformers	15	4777	August 2, 2022
I am using TFGPT2LMHeadModel and GPT2LMHeadModel, when i use tensorflow version to load pytorch_model.bin,there are some weight can not be used 🤗Transformers	0	286	August 2, 2022
SST2 classification with BertForSequenceClassification 🤗Transformers	0	600	August 1, 2022
Checkpoints not saved 🤗Transformers	0	709	August 1, 2022
'BertEncoder' object has no attribute 'gradient_checkpointing' 🤗Transformers	2	7091	August 1, 2022
L^2-SP Regularization 🤗Transformers	0	325	July 31, 2022
Terminating: fork() called from a process already using GNU OpenMP, this is unsafe 🤗Transformers	0	1335	July 31, 2022
Loading model from repository does not return expected result 🤗Transformers	1	252	July 29, 2022
Allocation of 93763584 exceeds 10% of free system memory 🤗Transformers	0	1766	July 29, 2022
Training T5 on mlm task from scratch 🤗Transformers	4	3250	July 29, 2022
When i use GPT2LMHeadModel, why it have a keys to ignore on load missing in pytorch version,while it doesn't have in tensorflow2 version? 🤗Transformers	0	462	July 28, 2022