🤗Transformers

Topic	Replies	Views	Activity
Trainer with load_best_model_at_end doesn't work 🤗Transformers	6	3836	July 28, 2022
Why last_hidden_state isnt the same for different heads of same checkpoint? 🤗Transformers	0	173	July 28, 2022
Having inconsistent results when I import pipeline of my custom made sequence classification 🤗Transformers	0	301	July 28, 2022
Cannot allocate memory in static TLS block 🤗Transformers	0	2304	July 28, 2022
How to get/extract CONCRETE FUNCTIONS from my model? (In order to convert my model into TFLite) 🤗Transformers	3	776	July 28, 2022
Quantization of facebook/opt-13b model 🤗Transformers	0	995	July 28, 2022
I am using TFGPT2LMHeadModel and GPT2LMHeadModel.When i use GPT2LMHeadModel weight to initialize TFGPT2LMHeadModel, there is some weight is not used.I'm comfirm the config file is the same one, but why is it happened? 🤗Transformers	0	272	July 28, 2022
The first argument to `Layer.call` must always be passed 🤗Transformers	3	1545	July 27, 2022
Model saved into an unique .h5 file (or TensorflowLight) 🤗Transformers	5	6158	July 27, 2022
\multi-node finetuning with Trainer 🤗Transformers	0	468	July 27, 2022
Tensorflow Models are way slower than Pytorch models, for autoregressive generation? 🤗Transformers	3	388	July 26, 2022
Wav2vec2-large-xlsr-53 🤗Transformers	4	806	July 26, 2022
There is a adamw optimizer in pytorch version.Is there a adamw in tensorflow2 version 🤗Transformers	1	283	July 26, 2022
How to add multiple metrics to Huggingface Transformers Trainer? 🤗Transformers	1	2053	July 26, 2022
Dynamic range quantization for HF models seem to be spurious 🤗Transformers	0	200	July 26, 2022
Why Tensorflow Models are way slower than Pytorch models, for autoregressive modeling? 🤗Transformers	10	2099	July 25, 2022
Segmentation of drone images 🤗Transformers	2	479	July 25, 2022
Issue with sentencepiece tokenizer 🤗Transformers	2	2017	July 25, 2022
Save the model into a .h5 model 🤗Transformers	0	536	July 25, 2022
TFResNetForImageClassification fails with `save_pretrained()` when `saved_model` is True 🤗Transformers	1	381	July 25, 2022
Roberta hidden_states[0] == Bert pooler_output? 🤗Transformers	0	535	July 25, 2022
Unable to load saved fine tuned tensorflow model 🤗Transformers	0	1774	July 25, 2022
Distilbert customize model 🤗Transformers	0	216	July 24, 2022
Model.generate() is extremely slow while using beam search 🤗Transformers	2	5314	July 24, 2022
Help! - Drastic Overfitting and Atrocious Accuracy on ViT Model 🤗Transformers	0	696	July 23, 2022
If there are adamw optimizer in pytorch version, while there aren't have a same one in tensorflow version? 🤗Transformers	0	216	July 23, 2022
Smaller embedding size causes lower loss 🤗Transformers	0	319	July 23, 2022
Ensemble learning using transformers 🤗Transformers	1	2171	July 23, 2022
Create custom data_collator for Huggingface Trainer 🤗Transformers	1	4041	July 22, 2022
KeyError: 'test' when trying to divide a custom dataset into train and test for fine-tuning 🤗Transformers	0	551	July 22, 2022