Hugging Face Forums

Topic	Replies	Views	Activity
Converting pytorch checkpoints to original roberta pytorch checkpoints 🤗Transformers	0	653	November 4, 2020
ImportError: cannot import name 'TFLongformerForMaskedLM' Models	3	2109	November 4, 2020
How to analyze ROCstories with `BertForQuestionAnswering`? 🤗Transformers	1	285	November 5, 2020
T5-base model create spelling mistake is summary 🤗Transformers	2	763	November 5, 2020
Is there a pre-trained BERT model with the sequence length 2048? 🤗Transformers	2	2079	November 5, 2020
T5 training from scratch Beginners	5	2153	November 5, 2020
Best pre-trained transformer question answer model 🤗Transformers	0	240	November 5, 2020
Pre-trained Sandwich transformer model 🤗Transformers	0	300	November 5, 2020
Clarifying multi-GPU memory usage Beginners	1	1405	November 5, 2020
Which model to choose for seq2seq(generating headers for articles)? Models	0	264	November 6, 2020
TinyReformer/TinyLongformer details Models	3	429	November 6, 2020
Torchscript vector Input 🤗Transformers	0	278	November 8, 2020
How can I go about building Grammarly for my local language? Beginners	1	1343	November 7, 2020
Working with large datasets 🤗Datasets	5	4093	November 10, 2020
Restarting gpt-2 finetuning after power failure Beginners	1	609	November 10, 2020
Summarization - Pegasus - min_length Beginners	1	504	November 10, 2020
Seq2Seq Distillation: train_distilbart_xsum error 🤗Transformers	5	433	November 10, 2020
RAG Retriever : Exact vs. Compressed Index? Models	3	1100	November 10, 2020
Compressing, saving, and loading datasets 🤗Datasets	3	2199	November 10, 2020
How to evaluate T5 on classification task in case of multiple tasks 🤗Transformers	0	591	November 11, 2020
How to configure datasets to a gs bucket to have the data downloaded 🤗Datasets	0	310	November 11, 2020
Question about loading wikipedia datset 🤗Datasets	2	2327	November 11, 2020
BartForConditionalGeneration "logits" shape is wrong/unexpected 🤗Transformers	4	912	November 11, 2020
Message "Some layers from the model were not used" Beginners	7	6320	November 11, 2020
Why does PretrainedConfig.use_cache default to True? 🤗Transformers	0	495	November 11, 2020
Num_beams: Faster Summarization without Distillation 🤗Transformers	1	576	November 12, 2020
BERT2BERT Notebook for Models without GenerationMixin 🤗Transformers	0	285	November 12, 2020
A question about the modeling_bart.py Models	1	322	November 12, 2020
TokenizerFast with various units (e.g., BPE, wordpiece, word, character, unigram) Intermediate	1	420	November 12, 2020
What are some popular datasets for domain adaptation in NLP Research	1	470	November 12, 2020