Hugging Face Forums

Topic	Replies	Views	Activity
Error while loading the xlm\roberta checkpoints Beginners	0	263	October 9, 2021
Log Perplexity using Trainer 🤗Transformers	2	1939	October 9, 2021
When should you train a custom tokenizer/language model? Beginners	0	339	October 9, 2021
Moving my own trained model to huggingface hub Beginners	1	657	October 9, 2021
Tensorboard support when using optimizer with 2 separate learning rates Intermediate	0	356	October 9, 2021
Open-sourcing better cross-encoders for STILTS and better IR? Intermediate	2	897	October 9, 2021
Tokenizer.encode not returning encodings 🤗Tokenizers	2	896	October 9, 2021
Live Tensorboard View in Amazon SageMaker? Beginners	0	261	October 8, 2021
Overlapping data between pre-training and fine-tuning stages 🤗Transformers	0	251	October 8, 2021
Stop sequence for few-shot learning with GPT-J on HF API 🤗Transformers	0	740	October 8, 2021
How does the GPT-J inference API work? Beginners	5	754	October 8, 2021
BART summarization token probabilities Intermediate	0	903	October 8, 2021
Need permission to use dataset for blog post - who to reach out to? 🤗Datasets	1	345	October 8, 2021
Inference Hyperparameters Amazon SageMaker	29	4811	October 8, 2021
Cannot load training_args.bin 🤗Transformers	1	2183	October 8, 2021
Making sense of duplicate arguments in Huggingface's hyperparameter search work flow 🤗Transformers	3	1014	October 8, 2021
Bert Tokenizer Parameter Possible Values 🤗Transformers	0	250	October 8, 2021
Finetune bart for text summary has nan loss Amazon SageMaker	5	934	October 8, 2021
Map's cache behavior with partial 🤗Datasets	2	554	October 8, 2021
How release notes are created in Transformers repo 🤗Transformers	2	375	October 8, 2021
"Initializing global attention on CLS token" on Longformer Training Beginners	1	1118	October 7, 2021
Custom model.generate() parameters for hosted models Beginners	0	448	October 7, 2021
Help understanding how to build a dataset for language as with the old TextDataset 🤗Datasets	7	12637	October 6, 2021
Small miniLM model for multilingual 🤗Transformers	0	324	October 7, 2021
min_length in generate method Models	0	358	October 7, 2021
Hyperparameter tuning practical guide? Beginners	1	486	October 6, 2021
How to use Transformer XL for sequence classification? 🤗Transformers	2	591	October 6, 2021
Getting a whole distribution for GPT next token 🤗Transformers	0	370	October 6, 2021
Pre-Training From Scratch 🤗Transformers	0	996	October 6, 2021
Loading custom dataset without cache - using load script 🤗Datasets	1	355	October 6, 2021