Hugging Face Forums

Topic	Replies	Views	Activity
Do I need to apply the softmax function to my logit before calculating the CrossEntropyLoss? 🤗Transformers	1	3214	October 15, 2020
Finetuned model generating test label exactly Beginners	0	462	October 15, 2020
Understanding <bos> Token in GPT2 Training Models	0	422	October 16, 2020
Clarification for the forward function of the SequenceSummary class from modeling_utils.py 🤗Transformers	0	368	October 16, 2020
For the logits from HuggingFace Transformer models, can the sum of the elements of the logit vector be greater than 1? 🤗Transformers	1	1609	October 16, 2020
Training GPT2 on CPUs? 🤗Transformers	4	1668	October 17, 2020
Why do different tokenizers use different vocab files? 🤗Transformers	0	1774	October 18, 2020
More complex training setups 🤗Transformers	4	1014	October 18, 2020
Hyperparameter for distil bert Research	0	667	October 19, 2020
Resume Training / Finetune a language model and further finetune a classifier Research	1	1259	October 19, 2020
What is the proper way to do inference using fine-tuned model? Beginners	1	329	October 19, 2020
Adding a new model to Transformers with additional dependencies 🤗Transformers	15	1456	October 19, 2020
How to fine-tune the output head of the pre-trained Transformer models? 🤗Transformers	0	487	October 19, 2020
Are the weights of the maskedLM head of the `BertForMaskedLM` model pre-trained? 🤗Transformers	0	417	October 19, 2020
`add_prefix_space=True` option for the BPE tokenizer 🤗Transformers	0	1668	October 19, 2020
How to extract the "student" model after distillation? Beginners	2	876	October 19, 2020
Distillation code works on TPU? Intermediate	0	310	October 19, 2020
Load torchtext.data.dataset.Dataset to Trainer Beginners	0	558	October 20, 2020
Pretrain encoder of tf T5 model Intermediate	0	529	October 19, 2020
BART for Portuguese 🤗Transformers	7	1689	October 20, 2020
Converting Transformers model to Tensorflow 🤗Transformers	2	778	October 20, 2020
Load fine tuned model from local Beginners	4	10274	October 20, 2020
Fine-tuning distiBART Beginners	2	753	October 20, 2020
[pegasus] evaluation datasets and build scripts are now available Models	0	2031	October 21, 2020
Docker container, run model only 🤗Transformers	0	1132	October 21, 2020
Optimizing models using ONNX Models	1	1114	October 21, 2020
Model giving same output for eval function but trains Beginners	1	1420	October 21, 2020
Loading pretrained SentencePiece tokenizer from Fairseq 🤗Tokenizers	5	6357	October 21, 2020
Load/save HF block sparse model Research	1	397	October 21, 2020
TransformerXL on Custom Language Beginners	1	250	October 21, 2020