How can I optimise GPT-J-6B for Heroku?

mrbrawler · February 15, 2022, 10:00am

This is the code I found in the documentation:

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("EleutherAI/gpt-j-6B")
tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6B")

prompt = (
    "In a shocking finding, scientists discovered a herd of unicorns living in a remote, "
    "previously unexplored valley, in the Andes Mountains. Even more surprising to the "
    "researchers was the fact that the unicorns spoke perfect English."
)

input_ids = tokenizer(prompt, return_tensors="pt").input_ids

gen_tokens = model.generate(
    input_ids,
    do_sample=True,
    temperature=0.9,
    max_length=100,
)
gen_text = tokenizer.batch_decode(gen_tokens)[0]

If I add this to my code, the application crashes. How do I optimise this for Heroku?

Topic		Replies	Views
Issues running GPT-J-6B Beginners	1	1120	January 31, 2023
Reducing latency for GPT-J Beginners	9	2444	December 18, 2022
GPT-J generating chatbot response 🤗Transformers	2	2679	September 23, 2022
How to get "EleutherAI/gpt-j-6B" working? Models	4	6319	August 31, 2021
Keyerror when trying to download GPT-J-6B checkpoint Beginners	2	1701	September 29, 2021

How can I optimise GPT-J-6B for Heroku?

Related topics