Fine-Tuning Strategies: Choosing Between microsoft/mpnet-base and sentence-transformers/all-MiniLM-L6-v2

Balakishan · September 24, 2024, 10:29am

Hi everyone,

I’m looking for recommendations on which model to fine-tune for a similarity task. I have a dataset of around 5,000 samples. According to the Sentence Transformers documentation, there are various base models to choose from, including microsoft/mpnet-base (Training Overview — Sentence Transformers documentation).

I am planning to use all-mpnet-base-v2 for fine-tuning, which is not mentioned in the documentation. I believe that using all-mpnet-base-v2 may be better due to its prior fine-tuning compared to microsoft/mpnet-base. Is this approach correct? Additionally, any insights on pooling strategies or general tips for fine-tuning would be greatly appreciated!

Balakishan · November 15, 2024, 9:07am

This has been addressed here.

system · November 15, 2024, 9:07pm

This topic was automatically closed 12 hours after the last reply. New replies are no longer allowed.

Topic		Replies	Views
Sentence-transformers/all-mpnet-base-v2 requires Input Text after Cleaning or Raw Text Only Models	0	592	January 6, 2022
Sentence transformer poor performance after fine tuning 🤗Transformers	1	1596	September 11, 2022
Fine-tuning sentence-transformer for retrieval task makes things worse Beginners	0	1727	July 25, 2023
No sentence-transformers model found with name sentence-transformers/all-MiniLM-L6-v2 Beginners	2	4300	April 30, 2024
Sentence Transformers paraphrase-MiniLM fine-tuning error Beginners	3	1458	August 30, 2021

Fine-Tuning Strategies: Choosing Between microsoft/mpnet-base and sentence-transformers/all-MiniLM-L6-v2

Related topics