Models

Topic	Replies	Views	Activity
Fine tune Zero-shot classification on multi-label dataset	4	3658	November 30, 2023
Finetuning a model for machine translation on a programming language	1	650	November 29, 2023
Decoder only fine-tuning enough for UMT5	0	343	November 29, 2023
Llama2 model parameters count is half	1	962	November 29, 2023
How long it takes to train MusicGen in local PC?	0	291	November 27, 2023
Looking for help with Tensorflow (Smile Detection)	0	219	November 27, 2023
ProsusAI/FinBert only one sentiment value via transformers library	1	574	November 23, 2023
Query about Text model - T5	0	170	November 23, 2023
Parameters that contribute to GPU Memory	0	246	November 23, 2023
Fine tuned Mistral-7B-Instruct-1.0 inference missing config.json	2	2701	November 22, 2023
Train Bart for Conditional Generation (e.g. Summarization)	14	17182	November 22, 2023
Help for using whisper with embeddings	1	426	November 22, 2023
How to calculate the memory required using Lora fine tuning	0	979	November 21, 2023
LLM security check	2	1028	November 21, 2023
BLIP2 generation outputs depends on batch size	1	1436	November 21, 2023
Problem while building an ArxivChat bot	0	196	November 20, 2023
Merged LoRA & text generation inference issues	5	2450	November 20, 2023
Llama2 torch_dtype	0	308	November 20, 2023
WavLM ECAPA-TDNN embeddings for Speaker verification	0	592	November 19, 2023
<\|nospeech\|> tokens in seq2seq/whisper	0	444	November 19, 2023
How to train Wav2Vec2 in LoRA?	1	1315	November 19, 2023
LLama2 Finetuning giving RuntimeError: mat1 and mat2 shapes cannot be multiplied (33x4096 and 1x8388608)	0	502	November 17, 2023
Creating a learning agent; to rag on vectordb or finetune	0	195	November 17, 2023
What are the Latest Methods to Evaluate Instruction-Tuned Model on a Custom Test Set?	0	411	November 17, 2023
Supervised BERTopic with multiple topics per document	7	3697	November 16, 2023
New DALL•E 3 on HuggingFace	0	2451	November 16, 2023
Exploring optimal deployment strategies for Hugging Face's open-source embedding models in a high-usage, cost-effective environment without vendor lock-in	0	326	November 16, 2023
Usage of confidential data in querying LLMs	0	214	November 15, 2023
Always output generation config in terminal	1	253	November 15, 2023
How to save inference in local system and how to push the model to hub for layoutlmV3	0	208	November 15, 2023