Hugging Face Forums

Topic	Replies	Views	Activity
How to apply pruning on a BERT model? Beginners	5	3332	October 21, 2020
Cannot find pre-trained SOP head of ALBERT Beginners	0	274	October 22, 2020
How to use the Rostlab/prot_bert fill-mask pipeline 🤗Transformers	1	565	October 22, 2020
RAG Class for Question Answering 🤗Transformers	0	417	October 22, 2020
Distilbart Truncation Beginners	3	288	October 22, 2020
How to use Seq2seq Trainer with my original "[MASK]" Beginners	2	704	October 22, 2020
Passing the tokenizer to Trainer for bucketing does not work for evaluation set 🤗Transformers	5	1623	October 23, 2020
Convert new T5 checkpoints released from Google (NaturalQuestion dataset) 🤗Transformers	3	1487	October 18, 2020
How to deal with unpickable objects in map 🤗Datasets	9	4503	October 23, 2020
Running a Trainer in DistributedDataParallel mode 🤗Transformers	1	1444	October 24, 2020
RuntimeError: arguments are located on different GPUs 🤗Transformers	2	1865	October 24, 2020
Change bpe-dropout value on the fly? 🤗Tokenizers	0	432	October 24, 2020
The difference between Seq2SeqDataset.collate_fn and Seq2SeqDataCollator._encode Beginners	2	1296	October 24, 2020
Getting output attentions for encoder_attention decoder layers 🤗Transformers	0	349	October 24, 2020
Best method to use pre-trained model, and docker Beginners	0	510	October 24, 2020
The way to get Seq2SeqLM's `decoder_input_ids` to obtain `past_key_values` Beginners	0	1349	October 25, 2020
Positional Encoding error, Protein Bert Model Intermediate	2	652	October 25, 2020
Load dataset failure Beginners	1	1746	October 26, 2020
How to integrate an AzureMLCallback for logging in Azure? 🤗Transformers	4	1501	October 26, 2020
There seems to be a mistake in documentation (pretrained_models.html) regarding BART Site Feedback	2	644	October 26, 2020
RAG: Do we need to pretrained the doc-encoder when using a custom dataset? 🤗Transformers	0	640	October 26, 2020
Forward-looking or left-context attention mask (left-to-right) generation with BertGeneration and RobertaForCausalLM 🤗Transformers	3	1349	October 27, 2020
Can't use DistributedDataParallel for training the EncoderDecoderModel 🤗Transformers	2	5465	October 27, 2020
How to know if gpu memory is enough before starting training? Beginners	1	303	October 27, 2020
Bart-base rouge scores Research	11	1727	October 27, 2020
Fine-Tune BART using "Fine-Tuning Custom Datasets" doc Beginners	6	9309	October 28, 2020
Trainer class, compute_metrics and EvalPrediction 🤗Transformers	6	14317	October 28, 2020
TransfoXLLMHeadModel - Trying to create tensor with negative dimension -199500 🤗Transformers	1	2987	October 28, 2020
[seq2seq] Run distributed eval somewhat faster than run_eval 🤗Transformers	0	256	October 28, 2020
Adding features to a pretrained language model Research	3	3875	October 28, 2020