decoding_visualizer

Running on Zero

multimodalart HF Staff commited on 3 days ago

Commit

b186b15

verified ·

1 Parent(s): b7439a7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,6 @@ import spaces
 tokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/SmolLM2-360M-Instruct")
 model = AutoModelForCausalLM.from_pretrained("HuggingFaceTB/SmolLM2-360M-Instruct")
-model.to("cuda")
 print("Loading finished.")
@@ -430,7 +429,7 @@ def get_beam_search_html(
 ):
     input_with_template=f"<|im_start|>system /n You are a helpful chatbot.<|im_end|><|im_start|>{input_text}"
-    inputs = tokenizer([input_with_template], return_tensors="pt").to("cuda")
     outputs = model.generate(
         **inputs,
@@ -501,4 +500,4 @@ with gr.Blocks(
         outputs=[out_html, out_markdown],
     )
-demo.launch()

 tokenizer = AutoTokenizer.from_pretrained("HuggingFaceTB/SmolLM2-360M-Instruct")
 model = AutoModelForCausalLM.from_pretrained("HuggingFaceTB/SmolLM2-360M-Instruct")
 print("Loading finished.")
 ):
     input_with_template=f"<|im_start|>system /n You are a helpful chatbot.<|im_end|><|im_start|>{input_text}"
+    inputs = tokenizer([input_with_template], return_tensors="pt")
     outputs = model.generate(
         **inputs,
         outputs=[out_html, out_markdown],
     )
+demo.launch()