🤗Transformers

Topic	Replies	Views	Activity
If there are adamw optimizer in pytorch version, while there aren't have a same one in tensorflow version? 🤗Transformers	0	219	July 23, 2022
Smaller embedding size causes lower loss 🤗Transformers	0	321	July 23, 2022
Ensemble learning using transformers 🤗Transformers	1	2187	July 23, 2022
Create custom data_collator for Huggingface Trainer 🤗Transformers	1	4172	July 22, 2022
KeyError: 'test' when trying to divide a custom dataset into train and test for fine-tuning 🤗Transformers	0	567	July 22, 2022
Electra-base-sentence-splitter 🤗Transformers	4	736	July 22, 2022
How to check if image exists at image url? 🤗Transformers	1	3253	July 22, 2022
What is the difference between Trainer.evaluate() and Trainer.predict()? 🤗Transformers	1	4221	July 22, 2022
How can i output structure of TFGPT2LMHeadModel? 🤗Transformers	2	2935	July 22, 2022
How to load T0pp into 40Gb of GPU memory using mixed precisoin? DeepSpeed	2	868	July 21, 2022
Example of prefix_allowed_tokens_fn() while text generation 🤗Transformers	2	5884	July 21, 2022
Hidden_states Transformers for computer vision 🤗Transformers	0	429	July 21, 2022
Fine-tuning a locally saved model on NER task 🤗Transformers	2	1221	July 21, 2022
Vision Transformer reconstruct image 🤗Transformers	2	1121	July 21, 2022
Using oneDNN with 🤗 models 🤗Transformers	0	531	July 21, 2022
Save and load ViT model into a unique .h5 file (or TensorflowLight) 🤗Transformers	0	1434	July 20, 2022
Should gpt-j-6B model's embedding layer have bias? 🤗Transformers	0	408	July 20, 2022
Distilbert for fake news dtection 🤗Transformers	0	236	July 19, 2022
Saving checkpoints in drive 🤗Transformers	6	4098	July 19, 2022
TFBertForSeqClassification for multilabel classification 🤗Transformers	0	889	July 18, 2022
Exploring Segformer but its giving out Value error for input size, and expects to be 128x128 🤗Transformers	3	610	July 19, 2022
LayoutLMv2Processor uses pad tokens for non-first subword tokens on NER task 🤗Transformers	3	386	July 19, 2022
Trainer log output reports 0 samples in dataset 🤗Transformers	0	275	July 18, 2022
Seq2Seq Trainer plot attention maps 🤗Transformers	0	449	July 18, 2022
T5 generate() output doesn't produce <extra_id_0> 🤗Transformers	1	2270	July 18, 2022
Custom Pipeline 🤗Transformers	0	557	July 18, 2022
When i use TFGPT2LMHeadModel, how can i build labels?labels = inputs_ids or labels = inputs_ids[1:] 🤗Transformers	0	367	July 18, 2022
GPT2 summarization performance 🤗Transformers	3	3123	July 17, 2022
CUDA out of memory 🤗Transformers	2	537	July 16, 2022
Bigger batch size, the lower throughput and GPU usage？ 🤗Transformers	1	638	July 16, 2022