Hugging Face Forums

Topic	Replies	Views	Activity
Embed size 2 in time series transformer Beginners	7	676	December 19, 2023
Training sentencePiece from scratch? 🤗Tokenizers	8	19164	December 19, 2023
Train a simple Pytoch model with transformers Trainer 🤗Transformers	0	125	December 19, 2023
Mapping text that describes connected devices to a JSON object with chosen shape Intermediate	2	418	December 19, 2023
Time series Prediction: inference process 🤗Transformers	1	1764	December 19, 2023
Logits function too slow 🤗Transformers	0	224	December 19, 2023
Generating text word by word 🤗Transformers	2	896	December 19, 2023
I was trying to fine tune llama2 for specific usecase.In that after fine tuning when I'm trying load fine tune model locally I'm getting error below mentioned 🤗Transformers	1	878	December 19, 2023
Whisper: Summarization Task or ASR + Summarization Trained End to End Models	1	533	December 19, 2023
How to deploy larger model inference on multiple machine with multiple GPU？ 🤗Transformers	1	2525	December 19, 2023
How to perform training on CPU +GPU offloading? 🤗Transformers	1	1576	December 19, 2023
Loading checkpoint shards very slow 🤗Transformers	1	7230	December 19, 2023
Forcing BERT hidden dimension size 🤗Transformers	1	1127	December 19, 2023
Avoid loading checkpoint shards for each inference 🤗Transformers	2	2245	December 19, 2023
How to mount persistent disk to HF Spaces In Docker? Spaces	2	1771	December 19, 2023
Anyone else VERY confused? Community Calls	1	1225	December 19, 2023
Structuring chat histories while also mitigating more than one chatbot response 🤗Datasets	0	397	December 16, 2023
What infrastructure (compute, network, and storage) will support OpenLLaMA 7B model training, fine-tuning, and inferencing? Intermediate	0	163	December 20, 2023
Trade offs when upscale an image 🧨 Diffusers	3	1589	December 20, 2023
Gradient clipping on Transformers 🤗Transformers	0	251	December 20, 2023
Whisper encoder Beginners	0	147	December 20, 2023
PPO using TRL: optimal strategy for reward calculation? Research	1	916	December 20, 2023
Different intermediate results given different number of epochs Beginners	0	132	December 20, 2023
QLoRA memory requirement with 3B model loads GPU with 10GB of memory with 4bit quantization Intermediate	0	1147	December 19, 2023
Crash during training 🤗Hub	3	713	December 20, 2023
Which HF pricing plan to choose Models	0	235	December 20, 2023
Choosing the right model to generate simple art from text Beginners	0	263	December 20, 2023
Using text-generation pipeline for Llama-2-7b-chat-hf setting high T doesn't change output 🤗Transformers	1	3655	December 20, 2023
I have the dataset, dont know where to start Beginners	0	126	December 20, 2023
Training Arguments to do pure bf16 training? 🤗Transformers	0	1944	December 20, 2023