Evaluating my own model on AGIEval or MMLU benchmarks

allyc · November 24, 2023, 9:28pm

I have recently trained from scratch a GPT-2 model. I now want to evaluate its performance on two popular benchmarks that assess the general intelligence of a model: AGIEval and MMLU. How do I do this?

Topic		Replies	Views
Evaluating pretrained model Beginners	0	311	July 26, 2021
Causal LLM benchmarks Beginners	0	472	June 13, 2023
Increasing Perplexity when fine-tuning GPT-2 Beginners	0	688	November 20, 2020
Evaluation results in training GPT-2 on WikiText-2 Beginners	4	1872	April 14, 2021
Performance of hosted inference API Beginners	0	297	February 16, 2021

Evaluating my own model on AGIEval or MMLU benchmarks

Related topics