🤗Transformers

Topic	Replies	Views	Activity
Understanding DataCollation 🤗Transformers	0	14	July 18, 2024
Kosmos-2 batch modality and processing speed 🤗Transformers	0	19	July 18, 2024
Training out of memory 🤗Transformers	0	213	July 18, 2024
Tensor parallelism inference 🤗Transformers	0	62	July 18, 2024
Transformer Hangsup 🤗Transformers	0	48	July 17, 2024
Fine-tuning Decoder-only or Encoder-Decoder models for classification 🤗Transformers	0	620	July 17, 2024
Injecting multi modal embeddings into a language model breaks the `generate` function 🤗Transformers	0	55	July 17, 2024
Questions about outputs.logits, 🤗Transformers	0	342	July 17, 2024
Model is getting loaded unevenly with AutomodelforCasualLM 🤗Transformers	0	5	July 16, 2024
Model is getting loaded unevenly using AutomodelforCasualLM 🤗Transformers	0	4	July 16, 2024
Please remove the dependency "ipadic" because its own README says to not use it 🤗Transformers	0	7	July 16, 2024
My pytorch worked, but all of a sudden now has issues for Roberta 🤗Transformers	0	112	July 16, 2024
Image Regression (multivalue) 🤗Transformers	0	29	July 16, 2024
Two Whisper classes for generation but same functionalities? 🤗Transformers	2	201	July 16, 2024
Loading a specific model configuration in TGI 🤗Transformers	0	105	July 15, 2024
Run name issue, different run name file in webpage & local 🤗Transformers	0	55	July 15, 2024
OOM Error using PPO Trainer to LoRa-tune 4-bit Llama-3-8B Model 🤗Transformers	0	156	July 15, 2024
Online Decision Transformer 🤗Transformers	1	334	July 14, 2024
MLM Pretraining Domain Adaption 🤗Transformers	0	36	July 13, 2024
Adapt Decision Transformer collator to handle evaluation 🤗Transformers	1	232	July 13, 2024
Finetuning a small LLM on 32GB, 4vCPU 🤗Transformers	0	168	July 12, 2024
Are there any plans for replacing attention in transformers? 🤗Transformers	3	1001	July 11, 2024
The Impact of Pretraining on Fine-tuning and Inference 🤗Transformers	0	54	July 11, 2024
Bypassing "CUDA error: unspecified launch failure" error from trainer checkpoint loading 🤗Transformers	0	194	July 11, 2024
VivitModel last hidden states dimension Problem 🤗Transformers	0	47	July 11, 2024
Trainer predict or evaluate returns zero for metrics 🤗Transformers	0	52	July 11, 2024
Re-initialize decoder parameters of a pretrained model 🤗Transformers	0	60	July 11, 2024
Model is getting loaded unevenly on GPUs 🤗Transformers	1	49	July 11, 2024
Track multiple losses & different outputs size with Trainer and callbacks 🤗Transformers	4	3057	July 11, 2024
How to rewrite this code? 🤗Transformers	0	50	July 11, 2024