从 GptNeo 模型生成 10000 个句子会导致内存不足错误

发布于 2025-01-16 09:28:49 字数 451 浏览 1 评论 0原文

我正在做一些工作，我想从 GptNeo 模型生成 10000 个句子。我有一个大小为 40GB 的 GPU，并且正在 GPU 中运行模型，但每次代码都会耗尽内存。我可以生成的句子数量是否有限制？下面是我的代码的一小段。

tokenizer = GPT2Tokenizer.from_pretrained(model)
model = GPTNeoForCausalLM.from_pretrained(model , pad_token_id = tokenizer.eos_token_id)
model.to(device)
input_ids = tokenizer.encode(sentence, return_tensors=‘pt’)
gen_tokens = model.generate(
input_ids,
do_sample=True,
top_k=50,
num_return_sequences=10000
)

原文

I was doing some work where I wanted to generate 10000 sentences from the GptNeo Model. I have a GPU of size 40GB and am running the model in the GPU but everytime the code runs out of memory. Is there a limitation to the number of sentences that I can generate. Below is a small snippet of my code.

tokenizer = GPT2Tokenizer.from_pretrained(model)
model = GPTNeoForCausalLM.from_pretrained(model , pad_token_id = tokenizer.eos_token_id)
model.to(device)
input_ids = tokenizer.encode(sentence, return_tensors=‘pt’)
gen_tokens = model.generate(
input_ids,
do_sample=True,
top_k=50,
num_return_sequences=10000
)

分享到QQ

分享到微博