Help with loading model #1499

Axel-At-Apollo · 2025-01-03T14:54:39Z

See #1410, has not been resolved as of yet.

KareemMusleh · 2025-01-03T21:08:51Z

I got your code to work like this

modeling_llama = importlib.reload(transformers.models.llama.modeling_llama)

model = modeling_llama.LlamaForCausalLM.from_pretrained(checkpoint_path)
tokenizer = transformers.AutoTokenizer.from_pretrained(checkpoint_path)

# Add text generation
prompt = "Write a short story about a robot learning to paint:"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(
    inputs.input_ids,
    max_length=200,
    num_return_sequences=1,
    temperature=0.7,
    do_sample=True,
    pad_token_id=tokenizer.eos_token_id,
)
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("\nGenerated text:")
print(generated_text)

I will try to find a more general solution

KareemMusleh mentioned this issue Jan 4, 2025

Reload Transformers imports huggingface/transformers#35508

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Help with loading model #1499

Help with loading model #1499

Axel-At-Apollo commented Jan 3, 2025 •

edited

Loading

KareemMusleh commented Jan 3, 2025

Help with loading model #1499

Help with loading model #1499

Comments

Axel-At-Apollo commented Jan 3, 2025 • edited Loading

KareemMusleh commented Jan 3, 2025

Axel-At-Apollo commented Jan 3, 2025 •

edited

Loading